#nlp #semantics #conceptnet
#nlp #семантика #conceptnet
Вопрос:
Я пытаюсь перечислить (физические) характеристики, относящиеся к данному существительному, то есть все слова (прилагательные и существительные), которые могли бы описать это существительное. Например:
road
… должен возвращать:
black, flat, tar, porous, lon&...
Я попробовал несколько неудовлетворительных подходов. Например, словари должны содержать такие слова, но их определения слишком строгие и слишком короткие. Я также пробовал семантические сети, такие как ConceptNet (см. Эту ссылку). Но, насколько мне известно, доступных ресурсов (для моего приложения) недостаточно. Я никогда не мог предсказать, что дорога (обычно) черная.
У вас есть какая-нибудь идея / подход получше?
Если этот вопрос слишком наивен, пожалуйста, извините за мои плохие знания в этой области.
Примечание: В моем понимании проблема сложна, потому что она связана со «здравым смыслом»: я получаю меньше результатов Goo&le для «черной дороги» (1,8 млн результатов), чем для «белой дороги» (2,4 млн результатов), потому что никто не говорит о черных дорогах (слишком очевидно!).). В результате обучение машины необъективно.