#python #deep-learning #neural-network #conv-neural-network
Вопрос:
У меня есть задание по обучению нейронной сети. У меня есть функция, которая превращает аудиофайл.махните на спектрограмму мэла. Я не хочу превращать его в фотографию, чтобы повысить точность. Вот код функции:
def make_spec(file_path, song_name, save_path, typ,step): scale, sr = librosa.load(file_path '/' song_name) filter_banks = librosa.filters.mel(n_fft=2048, sr=22050, n_mels=10) mel_spectrogram = librosa.feature.melspectrogram(scale, sr=sr, n_fft=2048, hop_length=512, n_mels=10) log_mel_spectrogram = librosa.power_to_db(mel_spectrogram) print(type(log_mel_spectrogram)) print(log_mel_spectrogram.shape) return log_mel_spectrogram
Как я могу сгенерировать набор данных из этих данных, у меня есть два класса (поддельный и истинный) Для обучения я хочу использовать ResNet50 и tenzorflow. Можете ли вы что-то посоветовать и как это реализовать или дать ссылку на необходимую литературу, пожалуйста.
dataset = tf.data.Dataset.from_tensor_slices([1, 2, 3])
Я нашел этот код в документации, но я не понимаю, как сформировать набор данных таким образом, чтобы было реализовано разделение на классы.