Можно ли использовать другую модель трансформатора для токенизатора и модели?

ProgramBox

Можно ли использовать другую модель трансформатора для токенизатора и модели?

Post author:admin
Запись опубликована:14 января, 2022
Post category:Вопросы по программированию

#nlp #bert-language-model #roberta

Вопрос:

Могу ли я использовать Роберту для токенизатора, а Берта-для модели?

 from transformers import RobertaTokenizerFast

tokenizer = RobertaTokenizerFast.from_pretrained("./bert_tokenizer", max_len=512)

from transformers import BertForMaskedLM
config = BertConfig()
bert= BertForMaskedLM(config)

Ответ №1:

Вы не можете использовать токенизатор Роберты для модели БЕРТА. Причина в том, что словарный запас у Берта и Роберты разный. Таким образом, лексема словосочетания, присутствующая в словаре Роберты, может отсутствовать в словаре БЕРТА.

Метки: Можно ли использовать другую модель трансформатора для токенизатора и модели?

Вопрос:

Ответ №1:

Вам также может понравиться

Самоподписанный HTTPS Elastic Beanstalk не работает

Метод, который возвращает цвет метки в Tkinter

Надстройки SharePoint и SharePoint Framework