#nltk
#nltk
Вопрос:
Я изучаю Stanford CS224N: обработка естественного языка с глубоким обучением.
Крис сказал
«очень мелкие различия между датчиками, которые человек едва может понять разницу между ними и относиться к»
в лекции 1, когда он иллюстрирует фрагмент кода NLTK.
Есть ли в nltk обозначение с именем sensor? если да, что это значит?
Ответ №1:
Я думаю, что автоматическое субтитрирование Youtube неверно и что лектор произнес слово synset.
И да, в NLTK есть обозначение для synsets, на самом деле обозначение поступает из Wordnet.
Вы можете получить synset с:
from nltk.corpus import wordnet as wn
dog = wn.synset('dog.n.01')
где dog — морфологическая основа одной из лемм, n — часть речи (в данном случае существительное), а 01 — индекс.
Согласно документации NLTK:
Synset(wordnet_corpus_reader)
Создайте Synset из строки lemma.pos.number, где: lemma — морфологическая основа слова pos — один из атрибутов модуля ADJ, ADJ_SAT, ADV, СУЩЕСТВИТЕЛЬНОЕ или ГЛАГОЛ number — это число смысла, отсчитываемое от 0.