Модель диаризации динамиков на Python

#python #speech-recognition #diarization

Вопрос:

Я ищу модель (на Python) для диаризации динамиков (или как диаризации динамиков, так и распознавания речи). Я пробовал использовать библиотеки pyannote и simplyzer, но они не работают с моими данными (не распознают разные динамики). Кто-нибудь может мне помочь? Заранее спасибо.

Ответ №1:

Вы можете использовать https://github.com/pyannote/pyannote-audio.

Учебное пособие о том, как выполнить диаризацию динамиков с помощью pyannote-audio, можно найти здесь:

https://github.com/pyannote/pyannote-audio/blob/master/notebooks/introduction_to_pyannote_audio_speaker_diarization_toolkit.ipynb