#python-3.x #speech-recognition
#python-3.x #распознавание речи
Вопрос:
У меня очень большой файл wav (около 1 часа аудио около 700 МБ), и я хочу извлечь текст из этого файла с помощью python
мой код
from datetime import datetime
start_time = datetime.now()
print("Start Time : " str(start_time))
import speech_recognition as sr
r = sr.Recognizer()
with sr.AudioFile("audio_chunk_1.wav") as source:
audio = r.record(source)
try:
s = r.recognize_google(audio)
print("Text: " s)
except Exception as e:
print("Exception: " str(e))
end_time = datetime.now()
print("End Time : " str(end_time))
print('Duration: {}'.format(end_time - start_time))
это выдавало мне ошибку на моем ноутбуке, поэтому я решил разделить файлы
from pydub import AudioSegment
audio_file= "demo.wav"
audio = AudioSegment.from_wav(audio_file)
audio_chunk=audio[0:300000]
audio_chunk.export( "audio_chunk_{}.wav".format(1), format="wav")
audio_chunk=audio[300001:400000]
audio_chunk.export( "audio_chunk_{}.wav".format(2), format="wav")
audio_chunk=audio[400001:500000]
audio_chunk.export( "audio_chunk_{}.wav".format(3), format="wav")
Я должен случайным образом разбивать файлы wav для извлечения текста. Можете ли вы предложить лучший способ сделать это?
Спасибо