#windows #text-to-speech #speech-synthesis #microsoft-speech-api
#Windows #преобразование текста в речь #синтез речи #microsoft-speech-api
Вопрос:
Я работаю над исследовательским проектом, в рамках которого мы создаем новый механизм преобразования текста в речь (TTS), который преобразует текст в устный звук. Поскольку движок уже работает хорошо, мы пытаемся сделать его доступным для большого числа приложений, что побудило нас захотеть, чтобы движок отображался как TTS voice в Windows 10.
В документации Microsoft для разработчиков все, что я нашел, — это информация о том, как я могу использовать существующие / уже установленные голоса в моем приложении. Однако я не нашел никакой информации о том, как реализовать голос, чтобы он отображался как голос Windows и мог использоваться любым приложением, использующим Speech SDK или SAPI.
Какой интерфейс я должен реализовать или к какому API я должен подключиться, чтобы наш новый движок TTS работал с Windows Speech?
Я уже просмотрел документацию Microsoft Speech SDK, а также сайты разработчиков, такие какhttps://learn.microsoft.com/en-us/dotnet/api/system.speech.synthesis.ttsengine
Ответ №1:
Вам следует ознакомиться с Руководством поставщика движка TTS по переносу. Вам необходимо реализовать ISpTTSEngine
, которая выполняет всю работу, и ISpObjectWithToken
, которая управляет регистрацией и созданием.
Комментарии:
1. Почему это не помечено как ответ? Похоже на ответ, и если на связанной странице ничего не пропущено, интерфейс ISpTTSEngine кажется намного проще, чем я ожидал. Для реализации доступно только два метода.
2. Да, внедрение движка TTS несложно. (Намного, намного, намного проще, чем внедрение движка SR.). При этом Microsoft не делает дальнейших инвестиций в SAPI.