Воспроизведение записанного микрофонного звука из SpeechRecognition?

#python #python-3.x #nlp #nltk #pyaudio

Вопрос:

Хотя распознавание речи невероятно упрощает транскрипцию речи в текст, я озадачен тем, как воспроизвести записанный звук (тип speech_recognition.AudioData ). Я немного погуглил и попробовал некоторые библиотеки почти наугад (например, playsound, pydub), но это не сработало. Я думаю, что это не проблема при первой записи звука в память в файл, а затем его воспроизведении, но я совершенно ошеломлен тем, что никто никогда не хотел сразу воспроизводить это из памяти (возможно, я переоцениваю свои навыки поиска в Google ^^).

Очевидно, что экземпляр recognizer не требует этой функции, но разве не было бы неплохо проверить, нужно ли настраивать окружающий шум?

 import speech_recognition as sr

# Initialize recognizer class (for recognizing the speech)
rec = sr.Recognizer()

# Reading Microphone as source
# listening the speech and store in audio_text variable
with sr.Microphone() as source: #device_index=1
    print("Talk")
    audio_text = rec.listen(source)
    print("thx")

# TODO: play back 'audio_text'

Вопрос:

Вам также может понравиться

Пользовательский элемент управления, определенный в сборке с ControlTemplates, определенными в другой

Разрешение DNS cname всегда приводит к ошибке

golang: преобразование аудио в формат FLAC без запуска исполняемого файла