#azure-cognitive-services
Вопрос:
Я серьезно рассматриваю возможность обучения модели NMT с использованием некоторых данных домена. Пользовательский переводчик кажется хорошим вариантом.
Но мне интересно, является ли модель, предлагаемая Azure, пустой моделью (никогда не обучалась языковым данным) или предварительно обученной общей моделью (например, Bing Translator)?
Если это первый случай, нужно ли мне обучать модель дополнительным данным общей предметной области для достижения идеальных результатов.
Спасибо
Ответ №1:
Пользовательский переводчик позволяет заказчику использовать свой собственный набор данных, специфичный для домена, для создания механизма перевода, который использует терминологию их домена. Настройка с использованием общих данных домена не обеспечит качество перевода, которого желает клиент.
Если у клиента нет набора данных домена, было бы лучше использовать наш общий домен (или стандартные модели, такие как bing translate). Для получения дополнительной информации о пользовательском переводчике, https://techcommunity.microsoft.com/t5/azure-ai/customize-a-translation-to-make-sense-in-a-specific-context/ba-p/2811956