#nlp #stanford-nlp #named-entity-recognition
#nlp #stanford-nlp #распознавание именованных объектов
Вопрос:
Я делаю более точный классификатор для трех тегов (PER, ORG, LOC). Я проверяю свои результаты на основе классификатора стэнфордского crf. Поэтому я хотел бы знать, как работает часть оценки классификатора stanford crf. Учитывает ли он все ТЕГИ (PER, ORG, LOC, O) или только (PER, ORG, LOC)??
Ответ №1:
Оценка равна F1 на основе отзыва и точности извлеченных объектов. Если у вас есть схема маркировки, такая как (PER, ORG, LOC), объект — это просто последовательность последовательных токенов с одним и тем же тегом. Обратите внимание, что последовательности токенов с O
меткой не считаются объектами.
Итоговый отчет выдает F1 для всех объектов, а также дает оценки F1 для каждого типа объектов.
Также обратите внимание, что частичного зачисления нет. Вы либо находите объект правильно, либо нет. Итак, в примере предложения «Джо Смит живет в Калифорнии.» и «Джо», и «Смит» должны быть помечены как, PERSON
чтобы получить правильно найденную PERSON
сущность. Если бы просто «Джо» был помечен как PERSON
(и «Смит» был помечен как O
), вы бы получили оценку 0 правильных PERSON
объектов и 1 неправильный PERSON
объект.