как декодировать аудио m4a на Android

Я пытаюсь декодировать аудио на Android и получить необработанные данные для применения фильтра.

Я использую MediaExtractor для извлечения закодированных данных из файла, и это, похоже, работает. Затем я попытался смешать код из MediaExtractor docs плюс MediaCodec по синхронной обработке с использованием буферов, чтобы извлечь данные и декодировать их в блоках.

Итак, я сначала настроил декодер в формате, взятом из extractor.getTrackFormat(0);

 MediaExtractor extractor = new MediaExtractor();

String path = "...";

MediaFormat format = extractor.getTrackFormat(0);
mAudioKeyMine = format.getString(MediaFormat.KEY_MIME);


MediaCodec decoder;
decoder = MediaCodec.createDecoderByType(mAudioKeyMine);
decoder.configure(format, null, null, 0);

А затем попытался получить данные:

 public void getData(MediaExtractor extractor)
    int offset = 0;

    ByteBuffer inputBuffer = ByteBuffer.allocate(2048);

    MediaFormat outputFormat = decoder.getOutputFormat();
    Log.v(TAG, "outputFormat: "   outputFormat.toString());

    int index = decoder.dequeueInputBuffer(1000);

    boolean sawInputEOS = false;

    int sample = 0;
    while (sample >= 0)

        int inputBufferId = decoder.dequeueInputBuffer(1000);
        if (inputBufferId >= 0)
            inputBuffer = decoder.getInputBuffer(index);

            sample = extractor.readSampleData(inputBuffer, 0);

            long presentationTimeUs = 0;

            if (sample < 0)
                sawInputEOS = true;
                sample = 0;
                int trackIndex = extractor.getSampleTrackIndex();
                presentationTimeUs = extractor.getSampleTime();

                Log.v(TAG, "trackIndex: "   trackIndex   ", presentationTimeUs: "   presentationTimeUs);
                Log.v(TAG, "sample: "   sample   ", offset: "   offset);
                Log.v(TAG, "inputBuffer: "   inputBuffer.toString());

            decoder.queueInputBuffer(inputBufferId, 0, sample, presentationTimeUs, sawInputEOS ? MediaCodec.BUFFER_FLAG_END_OF_STREAM : 0);

            if (!sawInputEOS)

        MediaCodec.BufferInfo info = new MediaCodec.BufferInfo();

        int outputBufferId = decoder.dequeueOutputBuffer(info, 1000);
        Log.v(TAG, "info: "   info.toString());

        if (outputBufferId >= 0)
            ByteBuffer outputBuffer = decoder.getOutputBuffer(outputBufferId);
            MediaFormat bufferFormat = decoder.getOutputFormat(outputBufferId);

            Log.v(TAG, "option A");
            Log.v(TAG, "outputBufferId: "   outputBufferId);
            if (outputBuffer != null)
                Log.v(TAG, "outputBuffer: "   outputBuffer.toString());
                Log.v(TAG, "outputBuffer: null");
            Log.v(TAG, "bufferFormat: "   bufferFormat.toString());

            if (outputBuffer != null)
                int cont = 0;
                while (outputBuffer.hasRemaining())
                    int pos = outputBuffer.position();
                    byte data = outputBuffer.get();

                    // do something with the data
                    if (cont < 10)
                        Log.v(TAG, "outputBuffer: "   pos   " -> "   data);
                    cont  ;
                Log.v(TAG, "outputBuffer: null");
            decoder.releaseOutputBuffer(outputBufferId, 0);
        else if (outputBufferId == MediaCodec.INFO_OUTPUT_FORMAT_CHANGED)
            Log.v(TAG, "option B");
            outputFormat = decoder.getOutputFormat(); 
            Log.v(TAG, "outputFormat: "   outputFormat.toString());
        Log.v(TAG, "extractor.advance()");
        offset  = sample;
    Log.v(TAG, "end of track");
    extractor = null;

Но я получаю сообщение об ошибке IllegalStateException в строке int outputBufferId = decoder.dequeueOutputBuffer(info, 1000); .

Я искал ошибку и как правильно декодировать m4a, но большая часть решения устарела в api 21, и теперь я застрял на этой ошибке.

Итак, есть пример декодирования аудио для api 26/28, или, пожалуйста, кто-нибудь может объяснить, как это сделать правильно?

Весь проект размещен на GitHub.


1. Похоже, что вы удаляете из очереди входной буфер # 1 ( index ), затем удаляете из очереди входной буфер # 2 ( inputBufferId ), затем ставите в очередь входной буфер # 2. Что случилось с InputBuffer # 1? Вы должны использовать эти вещи по порядку!

Ответ №1:

Я решил вопрос в асинхронном режиме, используя обратные вызовы.

Основной рабочий процесс заключается в:

  • извлеките закодированные данные из файла с помощью MediaExtractor
  • передайте его в MediaCodec для декодирования
  • передайте декодированные данные в AudioTrack для их воспроизведения (или делайте с данными все, что захотите)

Сначала нам нужна некоторая инициализация, я поместил это в конструктор класса, который я использовал для декодирования и воспроизведения файла:

 // inizialize the mediaExtractor and set the source file
mediaExtractor = new MediaExtractor();

// select the first audio track in the file and return it's format
mediaFormat = null;
int i;
int numTracks = mediaExtractor.getTrackCount();
for (i = 0; i < numTracks; i  )
    mediaFormat = mediaExtractor.getTrackFormat(i);
    if (mediaFormat.getString(MediaFormat.KEY_MIME).startsWith("audio/"))
// we get the parameter from the mediaFormat
channelCount = mediaFormat.getInteger(MediaFormat.KEY_CHANNEL_COUNT);
sampleRate = mediaFormat.getInteger(MediaFormat.KEY_SAMPLE_RATE);
duration = mediaFormat.getLong(MediaFormat.KEY_DURATION);
mimeType = mediaFormat.getString(MediaFormat.KEY_MIME);

// we can get the minimum buffer size from audioTrack passing the parameter of the audio
// to keep it safe it's good practice to create a buffer that is 8 times bigger
int minBuffSize = AudioTrack.getMinBufferSize(sampleRate,

// to reproduce the data we need to initialize the audioTrack, by passing the audio parameter
// we use the MODE_STREAM so we can put more data dynamically with audioTrack.write()
audioTrack = new AudioTrack(AudioManager.STREAM_MUSIC,
                            minBuffSize * 8,

В руководстве разработчика метод, который я использовал для инициализации audioTrack , устарел, но у меня он работает, а у нового метода — нет, поэтому для целей этого примера я сохранил этот тип инициализации.

После этапа инициализации нам нужно создать декодер, установить для него обратные вызовы и запустить декодер и аудиодорожку. Обратные вызовы MediaCodec являются:

  • onInputBufferAvailable: вызывается, когда входной буфер становится доступным.
  • onOutputBufferAvailable: вызывается, когда становится доступным выходной буфер.
  • onError: вызывается, когда MediaCodec обнаружил ошибку
  • onOutputFormatChanged: вызывается, когда формат вывода изменился

Итак, нам нужно:

  • используйте экстрактор для извлечения закодированных данных из файла и используйте его для заполнения входных буферов, которые мы получаем из кодека.
  • И после того, как кодек завершит декодирование, мы можем получить декодированные данные из outputBuffer и передать их в AudioTrack.

Мой код:

 // we get the mediaCodec by creating it using the mime_type extracted form the track
MediaCodec decoder = MediaCodec.createDecoderByType(mimeType);

// to decode the file in asynchronous mode we set the callbacks
decoder.setCallback(new MediaCodec.Callback()
    private boolean mOutputEOS = false;
    private boolean mInputEOS = false;

    public void onInputBufferAvailable (@NonNull MediaCodec codec,
                                        int index)
        // if i reached the EOS i either the input or the output file i just skip
        if (mOutputEOS | mInputEOS) return;

        // i must use the index to get the right ByteBuffer from the codec
        ByteBuffer inputBuffer = codec.getInputBuffer(index);

        // if the codec is null i just skip and wait for another buffer
        if (inputBuffer == null) return;

        long sampleTime = 0;
        int resu<

        // with this method i fill the inputBuffer with the data read from the mediaExtractor
        result = mediaExtractor.readSampleData(inputBuffer, 0);
        // the return parameter of readSampleData is the number of byte read from the file
        // and if it's -1 it means that i reached EOS
        if (result >= 0)
            // if i read some bytes i can pass the index of the buffer, the number of bytes
            // that are in the buffer and the sampleTime to the codec, so that it can decode
            // that data
            sampleTime = mediaExtractor.getSampleTime();
            codec.queueInputBuffer(index, 0, result, sampleTime, 0);
            // if i reached EOS i need to tell the codec
            codec.queueInputBuffer(index, 0, 0, -1, MediaCodec.BUFFER_FLAG_END_OF_STREAM);
            mInputEOS = true;

    public void onOutputBufferAvailable (@NonNull MediaCodec codec,
                                         int index,
                                         @NonNull MediaCodec.BufferInfo info)
        // i can get the outputBuffer from the codec using the relative index
        ByteBuffer outputBuffer = codec.getOutputBuffer(index);

        // if i got a non null buffer
        if (outputBuffer != null)

            // i just need to write the outputBuffer into the audioTrack passing the number of
            // bytes it contain and using the WRITE_BLOCKING so that this call will block
            // until it doesn't finish to write the data
            int ret = audioTrack.write(outputBuffer,

        // if the flags in the MediaCodec.BufferInfo contains the BUFFER_FLAG_END_OF_STREAM
        // it mean that i reached EOS so i set mOutputEOS to true, and to assure
        // that it remain true even if this callback is called again i use the logical or
        mOutputEOS |= ((info.flags amp; MediaCodec.BUFFER_FLAG_END_OF_STREAM) != 0);

        // i always need to release the buffer i use so the system can recycle them and use
        // it again
        codec.releaseOutputBuffer(index, false);

        // if i reached the end of the output stream i need to stop and release the codec
        // and the extractor
        if (mOutputEOS)

    public void onError (@NonNull MediaCodec codec,
                         @NonNull MediaCodec.CodecException e)
        Timber.e(e, "mediacodec collback onError: %s", e.getMessage());

    public void onOutputFormatChanged (@NonNull MediaCodec codec,
                                       @NonNull MediaFormat format)
        Timber.d("onOutputFormatChanged: %s", format.toString());

// now we can configure the codec by passing the mediaFormat and start it
decoder.configure(mediaFormat, null, null, 0);
// also we need to start the audioTrack.