#audio #xna #wav #microsoft-translator
#Аудио #xna #wav #microsoft-переводчик
Вопрос:
Я работаю над настольным приложением, созданным с помощью XNA. В нем есть приложение преобразования текста в речь, и я использую Microsoft Translator V2 api для выполнения этой работы. Более конкретно, я использую метод Speak (http://msdn.microsoft.com/en-us/library/ff512420.aspx), и я воспроизводю звук с помощью классов SoundEffect и SoundEffectInstance.
Сервис работает нормально, но у меня возникли некоторые проблемы со звуком. Качество не очень хорошее, а громкость недостаточно громкая.
Мне нужен способ улучшить громкость программно (я уже пробовал некоторые базовые решения в CodeProject, но алгоритмы не очень хороши, и результирующий звук очень низкого качества), или, возможно, использовать другой API.
Существуют ли какие-нибудь хорошие алгоритмы для улучшения звука программно? Существуют ли другие хорошие API преобразования текста в речь с лучшим качеством звука и поддержкой wav?
Заранее спасибо
Ответ №1:
Если вы выполняете автономную обработку звука, вы можете попробовать использовать Audacity. В нем есть очень хорошие инструменты для автономной обработки звука. Если вы обрабатываете потоковое аудио в режиме реального времени, вы можете попробовать использовать SoliCall Pro. Он создает виртуальное аудиоустройство и фильтрует весь звук, который оно записывает.
Комментарии:
1. Спасибо @Jim, я попробовал Audacity, и он отлично работает, но мне нужно решение, которое я мог бы встроить в свое приложение. Похоже, что SoliCall тоже работает, но я не хочу заставлять пользователей устанавливать стороннее программное обеспечение.
2. Взгляните на forum.audacityteam.org/viewtopic.php?f=21amp;t=9456 — Я думаю, это показывает, как использовать API с Audacity.