#nlp #sentiment-analysis #wordnet #senti-wordnet
#nlp #анализ настроений #wordnet #senti-wordnet
Вопрос:
Я работаю над проектом анализа настроений, который использует SentiwordNet3
lexicon. Проблема в том, что я не могу понять структуру lexicon. Одна строка этого словаря является:
a 00002730 0 0 акроскопический# 1, обращенный к вершине или сбоку от нее
1. a
=? Цель a
?
2. POS-ID=00002730
. Какова цель POS-ID
?
3. SynsetTerms Gloss
= acroscopic#1 facing or on the side toward the apex
- Что такое
acroscopic
? Это word, по которому мы хотим получить оценку? - Что такое
#1
? Цель? - Почему предложение после
#1
?facing or on the side toward the apex
.
Что касается доступа к score, мы получили к нему доступ как
`list(SWN.senti_synsets(Tagged[i][0],'a')`
a
является, Adjective
тогда как v
, r
и n
также присутствуют в лексиконе.
Ответ №1:
Корпус имеет заголовок, содержащий определение столбцов:
Идентификатор пользователя PosScore NegScore SynsetTerms Gloss
- POS ‘a’ — это часть речи (прилагательное)
- ID — это уникальный идентификатор леммы в Wordnet
- Положительный результат =>
- Отрицательный балл => Отрицательный результат
- SynsetTerms => Имена синтаксических наборов Wordnet (#1 = первый смысл, # 2 = второй смысл)
- Поясняющее предложение
Комментарии:
1. Итак, если мы дадим
list(SWN.senti_synsets(Tagged[i][0],'a')
какой смысл будет возвращен? Как определить смысл?2. Что ж, это вернет все смыслы. Он вернет список наборов синхронизации, которые содержат список лемм. Вот пример: nltk.org/howto/sentiwordnet.html Вот как выполняется сопоставление между WN и SWN: github.com/bogdan-ivanov/wnext/blob/master/sentiwordnet.py
3. Это
from nltk.corpus import sentiwordnet as swn happy = swn.senti_synsets('happy', 'a') for i in happy: print(i)
возвращает<happy.a.01: PosScore=0.875 NegScore=0.0> <felicitous.s.02: PosScore=0.75 NegScore=0.0> <glad.s.02: PosScore=0.5 NegScore=0.0> <happy.s.04: PosScore=0.125 NegScore=0.0>
, чтоs
вglad.s.02
и почему02
здесь?4. Что вы имеете в виду под
Explanatory sentence
?5. Предложение, которое объясняет смысл