Sidekit FeaturesExtractor предоставляет нули только для информации о цепстрале

#feature-extraction #mfcc #gmm #sidekit

Вопрос:

Я хочу использовать GMM-UBM для распознавания динамиков с помощью Sidekit, и первым шагом является извлечение функций MFCC из моих аудиофайлов с помощью функции FeaturesExtractor. Однако, когда я просматриваю созданные файлы .h5, все cepstrals всегда равны нулю. Однако я ожидал увидеть, что цепстрали также содержат числа, отличные от нуля.

Я использую следующий код для извлечения функций:

 audioDir = 'Data'
fileList = os.listdir(audioDir)
for i in range(0,len(fileList)):
    fileList[i] = fileList[i].replace(".wav", "")

# feature extraction configuration (read from fileList and save mfcc features in audio_features folder)
extractor = sidekit.FeaturesExtractor(audio_filename_structure=audioDir "/{}.wav",
                                      feature_filename_structure="./audio_features/{}.h5",
                                      sampling_frequency=44100,     
                                      lower_frequency=0,            
                                      higher_frequency=20050,       
                                      filter_bank="log",            
                                      filter_bank_size=32,          
                                      window_size=0.01,             
                                      shift=0.005,                  
                                      ceps_number=12,               
                                      pre_emphasis=0.97,            
                                      save_param=["energy", "cep"], 
                                      keep_all_features=True)

# save in audio_features folder
for i in range(0,len(fileList)):
    a = './audio_features/'   fileList[i]  '.h5'
    try:
        os.remove(a)
    except OSError:
        pass
    extractor.save(fileList[i])
    
 

Я ценю любую помощь, которую вы можете мне оказать.