преобразование формы звукового сигнала в целочисленную последовательность

#c #audio #waveform

#c #Аудио #форма сигнала

Вопрос:

Мне нужно создать целочисленную последовательность из аудиофайла. Я проверял библиотеки форм сигнала, которые рисуют линейный график. Но я ищу ключевую информацию, каков источник целого числа, которое используется для рисования графика? это амплитуда? частота? или что-то еще? Доступны библиотеки, но мне нужно знать, какую единицу информации мне нужно извлечь, чтобы иметь данные, которые я могу передать на график. Однако рисование графика не является моей целью. Я просто хочу этот необработанный массив целых чисел.

Комментарии:

1. Зависит от типа аудиофайла, о котором вы говорите. .wav довольно просто (амплитуды с фиксированными интервалами). Сжатые форматы более сложны, но большинство из них используют какое-либо преобразование (DCT, FFT и т.д.) Для преобразования отдельных выборок в кодировку на основе частоты.

2. любой тип будет работать, мне просто нужно знать процесс. Я в порядке с wav

3. В этом случае вам нужно будет иметь дело с форматом файла Wave .

Ответ №1:

Конечно, для получения волновой осциллограммы вам нужны амплитуды, и это способ хранения данных PCM, например, в файлах wav (данные, которые идут непосредственно после заголовка файла). Обратите внимание, что существуют 8-битные и 16-битные форматы, последний может быть также с большим или меньшим порядком в зависимости от порядка байтов (просто чтобы вы знали об этом).

Комментарии:

1. Тогда какова роль частоты в музыке? можете ли вы уточнить?

2. Грубо говоря, быстро меняющаяся «локальная амплитуда» создает сигнал, содержащий различные частоты, которые могут быть представлены в виде ряда Фурье. Что касается музыки, 440 Гц — это стандартная частота камертона. В вычислениях форма сигнала — это просто набор дискретных выборок.

Ответ №2:

Аудио — это просто кривая — когда вы строите ее со временем по оси X, тогда ось Y представляет собой амплитуду — аналогично построению математической функции sin — каждая точка на кривой представляет собой число, которое сохраняется в аудиофайле — формат WAV это число обычно представляет собой 16-битное целое число без знака — поэтому игнорируя 44-байтовый заголовок — остальная часть файла представляет собой просто последовательность этих целых чисел. Когда эта кривая быстро меняется вверх и вниз с течением времени, частота выше, чем если бы кривая менялась медленнее с течением времени. Если вы загрузите приложение audio workbench: Audacity, вы сможете просмотреть эту кривую любого аудиофайла (WAV, mp3, …)

Комментарии:

1. и какова роль частоты в музыке? если все это с амплитудой

2. если вы рисуете на листе бумаги один цикл кривой sin — на 360 градусов, используя весь лист бумаги слева направо — давайте считать это низкой частотой по сравнению с тем, когда вы рисуете 10 таких циклов на бумаге — амплитуда — это высота кривой, а частота — это просто подсчет количества точек высокой и низкой амплитуды в единицу времени — количество циклов в секунду — поиск Герц

3. может помочь возможность просмотра звуковых кривых — установите приложение: Audacity и откройте различные аудиофайлы WAV, mp3 — оно позволяет вам слышать, пока оно показывает вам звуковую кривую

4. Короткий ответ — единственная переменная, которую вы контролируете, — это амплитуда, и то, как быстро вы меняете амплитуду, определяет частоту — смотрите Это для деталей: billposer.org/Linguistics/Computation/LectureNotes /…