#python #python-3.x #nlp #nltk #pyaudio
#python #python-3.x #nlp #nltk #pyaudio
Вопрос:
Хотя распознавание речи невероятно упрощает транскрипцию речи в текст, я озадачен тем, как воспроизвести записанный звук (тип speech_recognition.AudioData
). Я немного погуглил и попробовал некоторые библиотеки почти наугад (например, playsound, pydub), но это не сработало. Я думаю, что это не проблема при первой записи звука в память в файл, а затем его воспроизведении, но я совершенно ошеломлен тем, что никто никогда не хотел сразу воспроизводить это из памяти (возможно, я переоцениваю свои навыки поиска в Google ^^).
Очевидно, что экземпляр recognizer не требует этой функции, но разве не было бы неплохо проверить, нужно ли настраивать окружающий шум?
import speech_recognition as sr
# Initialize recognizer class (for recognizing the speech)
rec = sr.Recognizer()
# Reading Microphone as source
# listening the speech and store in audio_text variable
with sr.Microphone() as source: #device_index=1
print("Talk")
audio_text = rec.listen(source)
print("thx")
# TODO: play back 'audio_text'