Схемы меток по языку в Spacy

nlp #spacy

#nlp #spacy

Вопрос:

Из документации Spacy:

Для получения списка мелкозернистых и крупнозернистых тегов части речи, назначаемых моделями spaCy на разных языках, см. Схемы меток, документированные в каталоге моделей.

Я предполагаю, что это относится к тегам частей речи, например: VERB , NOUN , NUM и т. Д., И что этот список будет разным для каждого языка.

Это правильное предположение?

Я перешел по ссылке в документации на каталог моделей, но не смог найти список допустимых тегов POS для каждого языка.

https://spacy.io/usage/linguistic-features#pos-tagging

Ответ

Спасибо @polm23 за ответ, вот снимок экрана с навигацией, на случай, если кто-то еще не сможет его найти.

введите описание изображения здесь

Ответ №1:

Найдите «схему меток» на странице для любого отдельного языка.

скриншот схемы меток

Теги типа ГЛАГОЛА СУЩЕСТВИТЕЛЬНОГО, которые входят в .pos атрибут, взяты из универсальных зависимостей и в основном одинаковы между языками. Грубозернистые теги для .tag атрибута могут быть любыми и, насколько мне известно, уникальны для каждого языка.

Комментарии:

1. Я, должно быть, ослеп!

2. Не беспокойтесь. Они могли бы быть более заметными, но мы сворачиваем их, чтобы страница не становилась слишком длинной.