Извлечение текста из очень большого файла wav с использованием распознавания речи

#python-3.x #speech-recognition

#python-3.x #распознавание речи

Вопрос:

У меня очень большой файл wav (около 1 часа аудио около 700 МБ), и я хочу извлечь текст из этого файла с помощью python

мой код

 from datetime import datetime
start_time = datetime.now()
print("Start Time : "   str(start_time))

import speech_recognition as sr

r = sr.Recognizer()

with sr.AudioFile("audio_chunk_1.wav") as source:
    audio = r.record(source)
try:
    s = r.recognize_google(audio)
    print("Text: " s)
except Exception as e:
    print("Exception: " str(e))

end_time = datetime.now()
print("End Time : "   str(end_time))
print('Duration: {}'.format(end_time - start_time))

это выдавало мне ошибку на моем ноутбуке, поэтому я решил разделить файлы

 from pydub import AudioSegment

audio_file= "demo.wav"
audio = AudioSegment.from_wav(audio_file)

audio_chunk=audio[0:300000]
audio_chunk.export( "audio_chunk_{}.wav".format(1), format="wav")

audio_chunk=audio[300001:400000]
audio_chunk.export( "audio_chunk_{}.wav".format(2), format="wav")

audio_chunk=audio[400001:500000]
audio_chunk.export( "audio_chunk_{}.wav".format(3), format="wav")

Я должен случайным образом разбивать файлы wav для извлечения текста. Можете ли вы предложить лучший способ сделать это?

Спасибо

Вопрос:

Вам также может понравиться

Найдите запись, где id не является первичным ключом в fuelphp

Проблема со списком DHTMLX

как получить общие итоговые значения для% м / м и% г / г при использовании поиска или расчета таблицы в таблице