#audio #machine-learning #classification #feature-extraction
#Аудио #машинное обучение #классификация #функция-извлечение
Вопрос:
Я планирую создать классификатор музыкальных жанров, работающий с файлами mp3, и я хочу протестировать и посмотреть, какие функции лучше всего подходят для этого. Я видел статью, в которой для этого использовался MFCC (кепстральные коэффициенты малой частоты), но, как новичку в машинном обучении, этот метод показался сложным. Я также видел некоторые, которые преобразовывали файлы mp3 в спектрограммы и анализировали их, но безуспешно. Я ищу несколько простых в извлечении функций для классификации файлов mp3. Существуют ли какие-либо другие методы, кроме двух, которые я только что перечислил?
Комментарии:
1. если вы хотите «легко», просто извлеките поле «жанр» из тегов ID3…
2. Файлы, которые я анализирую, не содержат никаких данных в поле жанр.
Ответ №1:
Есть несколько статей по этому вопросу, вы можете легко найти их в Google.
Но самыми простыми функциями будут скорость биения, пропорции высоких / низких частот и т. Д.
Все это можно извлечь с помощью FFT (быстрое преобразование Фурье). Но я боюсь, что это может быть не так просто, если вы не делали этого раньше…