Синтаксический анализ естественного языка Google

# #syntax #nlp #linguistics #google-cloud-nl

Вопрос:

Я не уверен, что это проблема/вопрос с кодированием. Я использую НЛП Google для анализа синтаксиса некоторых предложений, и я вижу некоторые несоответствия между множественным и единичным обозначением. Возможно, я делаю что-то не так или неправильно понимаю то, что я вижу как непоследовательность.

Например.

The dolphins jump over the wall

Это слово dolphins обозначено так, как "SINGULAR" я и ожидал "PLURAL" . Я подумал, может быть, потому, что это относится к группе, как к ОДНОЙ «школе рыб»(хотя они млекопитающие)

Поэтому я попытался Crows

The crows jump over the wall

The crows are jumping over the wall

Оба они возвращаются crows как "SINGULAR" , что, как я думал, было бы последовательным, поскольку группа crows -это ОДНО «Убийство ворон».

Хорошо, хорошо, тогда я попробовал Cows — группа коров-это ОДНО стадо

The cows jump over the wall

Но в этом предложении слово cows обозначено "PLURAL" .

Я не специалист по лингвистике, что, возможно, и является причиной моего замешательства. Или это «непоследовательность» из-за анализа предложения ТОЛЬКО с помощью API analyseSyntax без анализа его настроений или сущностей?

Это журнал для The cows jump over the wall.

 { theSentence: 'The cows jump over the wall.',
  theTags: [ 'DET', 'NOUN', 'VERB', 'ADP', 'DET', 'NOUN', 'PUNCT' ],
  theLabels: [ 'DET', 'NSUBJ', 'ROOT', 'PREP', 'DET', 'POBJ', 'P' ],
  theNumbers: 
   [ 'NUMBER_UNKNOWN',
     'PLURAL',
     'SINGULAR',
     'NUMBER_UNKNOWN',
     'NUMBER_UNKNOWN',
     'SINGULAR',
     'NUMBER_UNKNOWN' ]
 

Это журнал для The crows jump over the wall.

 { theSentence: 'The crows jump over the wall.',
  theTags: [ 'DET', 'NOUN', 'VERB', 'ADP', 'DET', 'NOUN', 'PUNCT' ],
  theLabels: [ 'DET', 'NSUBJ', 'ROOT', 'PREP', 'DET', 'POBJ', 'P' ],
  theNumbers: 
   [ 'NUMBER_UNKNOWN',
     'SINGULAR',
     'SINGULAR',
     'NUMBER_UNKNOWN',
     'NUMBER_UNKNOWN',
     'SINGULAR',
     'NUMBER_UNKNOWN' ]
 

Обновление : Я пробовал использовать https://language.googleapis.com/v1beta2/documents:analyzeSyntax , и я получаю те же результаты

Комментарии:

1. Общедоступный трекер проблем создается для проблемы, возникающей при обозначении грамматического номера слова. Не стесняйтесь добавлять дополнительные варианты использования, в которых возникает эта проблема. См. раздел отслеживание проблем issuetracker.google.com/199097296 .