#feature-extraction #mfcc #gmm #sidekit
Вопрос:
Я хочу использовать GMM-UBM для распознавания динамиков с помощью Sidekit, и первым шагом является извлечение функций MFCC из моих аудиофайлов с помощью функции FeaturesExtractor. Однако, когда я просматриваю созданные файлы .h5, все cepstrals всегда равны нулю. Однако я ожидал увидеть, что цепстрали также содержат числа, отличные от нуля.
Я использую следующий код для извлечения функций:
audioDir = 'Data'
fileList = os.listdir(audioDir)
for i in range(0,len(fileList)):
fileList[i] = fileList[i].replace(".wav", "")
# feature extraction configuration (read from fileList and save mfcc features in audio_features folder)
extractor = sidekit.FeaturesExtractor(audio_filename_structure=audioDir "/{}.wav",
feature_filename_structure="./audio_features/{}.h5",
sampling_frequency=44100,
lower_frequency=0,
higher_frequency=20050,
filter_bank="log",
filter_bank_size=32,
window_size=0.01,
shift=0.005,
ceps_number=12,
pre_emphasis=0.97,
save_param=["energy", "cep"],
keep_all_features=True)
# save in audio_features folder
for i in range(0,len(fileList)):
a = './audio_features/' fileList[i] '.h5'
try:
os.remove(a)
except OSError:
pass
extractor.save(fileList[i])
Я ценю любую помощь, которую вы можете мне оказать.