Оценка стэнфордского классификатора crf

#nlp #stanford-nlp #named-entity-recognition

#nlp #stanford-nlp #распознавание именованных объектов

Вопрос:

Я делаю более точный классификатор для трех тегов (PER, ORG, LOC). Я проверяю свои результаты на основе классификатора стэнфордского crf. Поэтому я хотел бы знать, как работает часть оценки классификатора stanford crf. Учитывает ли он все ТЕГИ (PER, ORG, LOC, O) или только (PER, ORG, LOC)??

Ответ №1:

Оценка равна F1 на основе отзыва и точности извлеченных объектов. Если у вас есть схема маркировки, такая как (PER, ORG, LOC), объект — это просто последовательность последовательных токенов с одним и тем же тегом. Обратите внимание, что последовательности токенов с O меткой не считаются объектами.

Итоговый отчет выдает F1 для всех объектов, а также дает оценки F1 для каждого типа объектов.

Также обратите внимание, что частичного зачисления нет. Вы либо находите объект правильно, либо нет. Итак, в примере предложения «Джо Смит живет в Калифорнии.» и «Джо», и «Смит» должны быть помечены как, PERSON чтобы получить правильно найденную PERSON сущность. Если бы просто «Джо» был помечен как PERSON (и «Смит» был помечен как O ), вы бы получили оценку 0 правильных PERSON объектов и 1 неправильный PERSON объект.