Как применить следующее расширение спектральной оболочки для аудио в python?

#python #audio-processing #librosa #spectrogram #data-augmentation

#python #обработка звука #librosa #спектрограмма #увеличение данных

Вопрос:

Ощущение этого преобразования для спектрограммы (где ось x — время, а ось y — частота) каким-то образом растягивает ее вдоль оси y в соответствии с различными значениями альфа, в то время как верхняя (максимальная частота) и нижняя (нулевая частота) остаются неизменными. Но сейчас я действительно не имею представления о том, как это реализовать.

Во-первых, на каком шаге я должен выполнить это частотное искажение? Я использую Librosa для извлечения функций и преобразования аудио в спектрограммы log-mel. Должно ли это быть сделано перед преобразованием в melsectrogram или до / после STFT?

Во-вторых, каким образом я могу сопоставить каждую частоту в соответствии с формулой? Автор упомянул, что они использовали геометрические преобразования изображений OpenCV, но я нашел только аффинное преобразование и преобразование перспективы, которые кажутся связанными, но мне не удалось добиться этого сопоставления с их помощью.

Любые предложения и комментарии приветствуются, большое вам спасибо!

Вопрос:

Комментарии:

Вам также может понравиться

Ошибка при запуске пакета weathercan — фатальное оповещение SSL / TLS (например, сбой рукопожатия))

Discord.js ошибка типа v12: не удается прочитать свойство ‘hasPermission’ неопределенного

Подстроки Oracle SQL в трехсимвольном шаблоне