Почему AllenNLP «PretrainedTransformerEmbedder» выводит все «last_hidden_state», включая первое » [CLS]»?

#bert-language-model #allennlp Вопрос: Моя интуиция заключается в том, что TokenEmbedder генерирует представления токенов (слов или подсловов), и его вывод будет использоваться для Seq2VecEncoder . Однако [CLS] используется для классификации во…

Продолжить чтениеПочему AllenNLP «PretrainedTransformerEmbedder» выводит все «last_hidden_state», включая первое » [CLS]»?