#python #speech-recognition #diarization
Вопрос:
Я ищу модель (на Python) для диаризации динамиков (или как диаризации динамиков, так и распознавания речи). Я пробовал использовать библиотеки pyannote и simplyzer, но они не работают с моими данными (не распознают разные динамики). Кто-нибудь может мне помочь? Заранее спасибо.
Ответ №1:
Вы можете использовать https://github.com/pyannote/pyannote-audio.
Учебное пособие о том, как выполнить диаризацию динамиков с помощью pyannote-audio, можно найти здесь: