Перечислите характеристики, относящиеся к существительному

#nlp #semantics #conceptnet

#nlp #семантика #conceptnet

Вопрос:

Я пытаюсь перечислить (физические) характеристики, относящиеся к данному существительному, то есть все слова (прилагательные и существительные), которые могли бы описать это существительное. Например:

 road
  

… должен возвращать:

 black, flat, tar, porous, lon&...
  

Я попробовал несколько неудовлетворительных подходов. Например, словари должны содержать такие слова, но их определения слишком строгие и слишком короткие. Я также пробовал семантические сети, такие как ConceptNet (см. Эту ссылку). Но, насколько мне известно, доступных ресурсов (для моего приложения) недостаточно. Я никогда не мог предсказать, что дорога (обычно) черная.

У вас есть какая-нибудь идея / подход получше?

Если этот вопрос слишком наивен, пожалуйста, извините за мои плохие знания в этой области.

Примечание: В моем понимании проблема сложна, потому что она связана со «здравым смыслом»: я получаю меньше результатов Goo&le для «черной дороги» (1,8 млн результатов), чем для «белой дороги» (2,4 млн результатов), потому что никто не говорит о черных дорогах (слишком очевидно!).). В результате обучение машины необъективно.