Внедрение службы TTS для Windows 10

#windows #text-to-speech #speech-synthesis #microsoft-speech-api

#Windows #преобразование текста в речь #синтез речи #microsoft-speech-api

Вопрос:

Я работаю над исследовательским проектом, в рамках которого мы создаем новый механизм преобразования текста в речь (TTS), который преобразует текст в устный звук. Поскольку движок уже работает хорошо, мы пытаемся сделать его доступным для большого числа приложений, что побудило нас захотеть, чтобы движок отображался как TTS voice в Windows 10.

В документации Microsoft для разработчиков все, что я нашел, — это информация о том, как я могу использовать существующие / уже установленные голоса в моем приложении. Однако я не нашел никакой информации о том, как реализовать голос, чтобы он отображался как голос Windows и мог использоваться любым приложением, использующим Speech SDK или SAPI.

Какой интерфейс я должен реализовать или к какому API я должен подключиться, чтобы наш новый движок TTS работал с Windows Speech?

Я уже просмотрел документацию Microsoft Speech SDK, а также сайты разработчиков, такие какhttps://learn.microsoft.com/en-us/dotnet/api/system.speech.synthesis.ttsengine

Ответ №1:

Вам следует ознакомиться с Руководством поставщика движка TTS по переносу. Вам необходимо реализовать ISpTTSEngine , которая выполняет всю работу, и ISpObjectWithToken , которая управляет регистрацией и созданием.

Комментарии:

1. Почему это не помечено как ответ? Похоже на ответ, и если на связанной странице ничего не пропущено, интерфейс ISpTTSEngine кажется намного проще, чем я ожидал. Для реализации доступно только два метода.

2. Да, внедрение движка TTS несложно. (Намного, намного, намного проще, чем внедрение движка SR.). При этом Microsoft не делает дальнейших инвестиций в SAPI.