# #syntax #nlp #linguistics #google-cloud-nl
Вопрос:
Я не уверен, что это проблема/вопрос с кодированием. Я использую НЛП Google для анализа синтаксиса некоторых предложений, и я вижу некоторые несоответствия между множественным и единичным обозначением. Возможно, я делаю что-то не так или неправильно понимаю то, что я вижу как непоследовательность.
Например.
The dolphins jump over the wall
Это слово dolphins
обозначено так, как "SINGULAR"
я и ожидал "PLURAL"
. Я подумал, может быть, потому, что это относится к группе, как к ОДНОЙ «школе рыб»(хотя они млекопитающие)
Поэтому я попытался Crows
The crows jump over the wall
The crows are jumping over the wall
Оба они возвращаются crows
как "SINGULAR"
, что, как я думал, было бы последовательным, поскольку группа crows
-это ОДНО «Убийство ворон».
Хорошо, хорошо, тогда я попробовал Cows
— группа коров-это ОДНО стадо
The cows jump over the wall
Но в этом предложении слово cows
обозначено "PLURAL"
.
Я не специалист по лингвистике, что, возможно, и является причиной моего замешательства. Или это «непоследовательность» из-за анализа предложения ТОЛЬКО с помощью API analyseSyntax без анализа его настроений или сущностей?
Это журнал для The cows jump over the wall.
{ theSentence: 'The cows jump over the wall.',
theTags: [ 'DET', 'NOUN', 'VERB', 'ADP', 'DET', 'NOUN', 'PUNCT' ],
theLabels: [ 'DET', 'NSUBJ', 'ROOT', 'PREP', 'DET', 'POBJ', 'P' ],
theNumbers:
[ 'NUMBER_UNKNOWN',
'PLURAL',
'SINGULAR',
'NUMBER_UNKNOWN',
'NUMBER_UNKNOWN',
'SINGULAR',
'NUMBER_UNKNOWN' ]
Это журнал для The crows jump over the wall.
{ theSentence: 'The crows jump over the wall.',
theTags: [ 'DET', 'NOUN', 'VERB', 'ADP', 'DET', 'NOUN', 'PUNCT' ],
theLabels: [ 'DET', 'NSUBJ', 'ROOT', 'PREP', 'DET', 'POBJ', 'P' ],
theNumbers:
[ 'NUMBER_UNKNOWN',
'SINGULAR',
'SINGULAR',
'NUMBER_UNKNOWN',
'NUMBER_UNKNOWN',
'SINGULAR',
'NUMBER_UNKNOWN' ]
Обновление : Я пробовал использовать https://language.googleapis.com/v1beta2/documents:analyzeSyntax
, и я получаю те же результаты
Комментарии:
1. Общедоступный трекер проблем создается для проблемы, возникающей при обозначении грамматического номера слова. Не стесняйтесь добавлять дополнительные варианты использования, в которых возникает эта проблема. См. раздел отслеживание проблем issuetracker.google.com/199097296 .