Библиотека для классификации текста по влиянию

#nlp #classification

#nlp #классификация

Вопрос:

Существуют ли библиотеки для автоматической классификации текста, например, на английском языке, на affect? Если это довольно грубо, это все равно может быть достаточно хорошо.

Ответ №1:

Обычно, когда я вижу используемый термин «классификация влияния», он описывает обработку голосовых данных, а не текста — с использованием звуковых функций, таких как спектр, громкость и т. Д., Чтобы Определить, злится ли говорящий, расстроен и т. Д. Очевидно, что эти типы функций плохо переводятся в текст.

Говоря о классификации текста, чаще всего ссылаются на классификацию настроений, известную как «Анализ мнений», чтобы определить, говорит ли автор текста положительно или отрицательно о предмете текста. Если это дает достаточно нюансов для ваших нужд, к счастью, существует большое количество ресурсов, которые помогут вам в этом. В Python инструментарий естественного языка предоставляет классификаторы, которые часто используются для такого типа работы, например, эта демонстрация.

Недостатком этого подхода является то, что он обычно ограничивается положительной / отрицательной классификацией и что он очень специфичен для конкретной области. Например, классификатор, обученный обнаруживать положительные рецензии на фильмы, будет плохо выполнять классификацию обзоров программного обеспечения.

Также была проделана некоторая работа по классификации эмоций в тексте, например, эта статья, а также эта статья об определении эмоционального содержания сообщений в блоге, к сожалению, похоже, что вы с меньшей вероятностью найдете столько «готовых» библиотек, поддерживающих эту задачу, но, учитывая информацию висследование, вы должны быть в состоянии построить этот тип системы поверх чего-то вроде NLTK или других библиотек классификации / обработки естественного языка.

Ответ №2:

Система «Pattern» используется для анализа настроений: