Какие функции я могу попытаться извлечь из mp3-файлов, чтобы классифицировать их?

#audio #machine-learning #classification #feature-extraction

#Аудио #машинное обучение #классификация #функция-извлечение

Вопрос:

Я планирую создать классификатор музыкальных жанров, работающий с файлами mp3, и я хочу протестировать и посмотреть, какие функции лучше всего подходят для этого. Я видел статью, в которой для этого использовался MFCC (кепстральные коэффициенты малой частоты), но, как новичку в машинном обучении, этот метод показался сложным. Я также видел некоторые, которые преобразовывали файлы mp3 в спектрограммы и анализировали их, но безуспешно. Я ищу несколько простых в извлечении функций для классификации файлов mp3. Существуют ли какие-либо другие методы, кроме двух, которые я только что перечислил?

Комментарии:

1. если вы хотите «легко», просто извлеките поле «жанр» из тегов ID3…

2. Файлы, которые я анализирую, не содержат никаких данных в поле жанр.

Ответ №1:

Есть несколько статей по этому вопросу, вы можете легко найти их в Google.

Но самыми простыми функциями будут скорость биения, пропорции высоких / низких частот и т. Д.

Все это можно извлечь с помощью FFT (быстрое преобразование Фурье). Но я боюсь, что это может быть не так просто, если вы не делали этого раньше…