Ошибка FFMPEG при поиске потоковой информации с помощью пользовательского авиаконтекста

#c #ffmpeg #libav

Вопрос:

Я пишу программное обеспечение, которое принимает файл в виде потока и декодирует его. У меня есть следующий пользовательский код AVIO для ввода потока:

 /* Allocate a 4kb buffer for copying. */
std::uint32_t bufSize = 4096;
struct vidBuf
{
    std::byte* ptr;
    int size;
};

vidBuf tmpVidBuf = { const_cast<std::byte*>(videoBuffer.data()),
    static_cast<int>(videoBuffer.size()) };
AVIOContext *avioContext =
    avio_alloc_context(reinterpret_cast<std::uint8_t*>(av_malloc(bufSize)),
                       bufSize, 0,
                       reinterpret_cast<void*>(amp;tmpVidBuf),
                       [](void *opaque, std::uint8_t *buf, int bufSize) -> int
                       {
                           auto amp;me = *reinterpret_cast<vidBuf*>(opaque);
                           bufSize = std::min(bufSize, me.size);

                           std::copy_n(me.ptr, bufSize, reinterpret_cast<std::byte*>(buf));
                           me.ptr  = bufSize;
                           me.size -= bufSize;
                           return bufSize;
                       }, nullptr, nullptr);

auto avFormatPtr = avformat_alloc_context();
avFormatPtr->pb = avioContext;
avFormatPtr->flags |= AVFMT_FLAG_CUSTOM_IO;
//avFormatPtr->probesize = tmpVidBuf.size;
//avFormatPtr->max_analyze_duration = 5000000;

avformat_open_input(amp;avFormatPtr, nullptr, nullptr, nullptr);

if(auto ret = avformat_find_stream_info(avFormatPtr, nullptr);
   ret < 0)
    logerror << "Could not open the video file: " << makeAVError(ret) << 'n';
 

Однако, когда я запускаю этот код, я получаю сообщение об ошибке:

 [mov,mp4,m4a,3gp,3g2,mj2 @ 0x55d10736d580] stream 0, offset 0x30: partial file
[mov,mp4,m4a,3gp,3g2,mj2 @ 0x55d10736d580] Could not find codec parameters for stream 0 (Video: h264 (avc1 / 0x31637661), none(tv, bt709), 540x360, 649 kb/s): unspecified pixel format
Consider increasing the value for the 'analyzeduration' (0) and 'probesize' (5000000) options
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from '':
  Metadata:
    major_brand     : isom
    minor_version   : 512
    compatible_brands: isomiso2avc1mp41
    encoder         : Lavf58.76.100
  Duration: 00:04:08.41, start: 0.000000, bitrate: N/A
  Stream #0:0(und): Video: h264 (avc1 / 0x31637661), none(tv, bt709), 540x360, 649 kb/s, SAR 1:1 DAR 3:2, 29.97 fps, 29.97 tbr, 30k tbn, 60k tbc (default)
    Metadata:
      handler_name    : ISO Media file produced by Google Inc. Created on: 01/10/2021.
      vendor_id       : [0][0][0][0]
  Stream #0:1(und): Audio: aac (mp4a / 0x6134706D), 22050 Hz, mono, fltp, 69 kb/s (default)
    Metadata:
      handler_name    : ISO Media file produced by Google Inc. Created on: 01/10/2021.
      vendor_id       : [0][0][0][0]
Assertion desc failed at libswscale/swscale_internal.h:677
 

Обратите внимание на отсутствие части YUV420p в данных видеопотока.

Это странно, так как, если я запускаю свою программу с другим файлом mp4, она отлично работает, эта ошибка возникает только с определенным файлом mp4. Я знаю, что файл mp4 действителен, так как его может воспроизводить mpv, и ffprobe может получить его метаданные:

 Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'heard.mp4':
  Metadata:
    major_brand     : isom
    minor_version   : 512
    compatible_brands: isomiso2avc1mp41
    encoder         : Lavf58.76.100
  Duration: 00:04:08.41, start: 0.000000, bitrate: 724 kb/s
  Stream #0:0(und): Video: h264 (Main) (avc1 / 0x31637661), yuv420p(tv, bt709), 540x360 [SAR 1:1 DAR 3:2], 649 kb/s, 29.97 fps, 29.97 tbr, 30k tbn, 59.94 tbc (default)
    Metadata:
      handler_name    : ISO Media file produced by Google Inc. Created on: 01/10/2021.
      vendor_id       : [0][0][0][0]
  Stream #0:1(und): Audio: aac (LC) (mp4a / 0x6134706D), 22050 Hz, mono, fltp, 69 kb/s (default)
    Metadata:
      handler_name    : ISO Media file produced by Google Inc. Created on: 01/10/2021.
      vendor_id       : [0][0][0][0]
 

Как вы можете видеть по моему коду, я также попытался настроить analyzeduration и probesize, но это не решило проблему.

Я также знаю, что эта ошибка связана с моим пользовательским вводом-выводом, потому что, когда я avformat_open_input открываю файл напрямую, он может быть легко расшифрован. Я новичок в ffmpeg, поэтому, возможно, пропустил что-то простое.

Комментарии:

1. Можете ли вы воспроизвести нерабочий mp4 с помощью ffplay ?

2. @moi Да. ffplay работает просто отлично, и он печатает те же метаданные, что и ffprobe.

3. В вашем сообщении об ошибке говорится, что вы проанализировали конфигурацию (0). Попробуйте передать параметры av-словаря в avformat_open_input с «analyzeduration»,10000000. Если это не решит проблему. Я бы дважды проверил чтение, чтобы убедиться, что возвращает правильные прочитанные байты/размер. И я бы добавил также, чтобы вернуть общий размер, установить текущую позицию и т. Д.

4. @SuRGeoNix Я попробовал решение AVDictionary, но безрезультатно. Знаете ли вы, как реализовать функцию поиска только с таким буфером, как этот? Я могу найти только примеры, в которых используются реальные потоки файлов, а не фактический буфер, и когда я попытался реализовать поиск самостоятельно, я получил ошибку.

5. @SuRGeoNix Неважно, я сам смог разобраться с функцией поиска, и это действительно было проблемой. Мой пользовательский ввод-вывод теперь работает.

Ответ №1:

Как отметил SuRGeoNix, я не реализовал функцию поиска для контекста AVIO; Я думаю, что это испортило FFMPEG, так как он не смог определить размер буфера. Это мой теперь рабочий код:

 std::uint32_t bufSize = 4096;
struct vidBuf
{
    std::byte* ptr;
    std::byte* origPtr;
    int size;
    int fullSize;
};

vidBuf tmpVidBuf = { const_cast<std::byte*>(videoBuffer.data()),
const_cast<std::byte*>(videoBuffer.data()),
static_cast<int>(videoBuffer.size()),
static_cast<int>(videoBuffer.size()), };

AVIOContext *avioContext =
    avio_alloc_context(reinterpret_cast<std::uint8_t*>(av_malloc(bufSize)),
                       bufSize, 0,
                       reinterpret_cast<void*>(amp;tmpVidBuf),
                       [](void *opaque, std::uint8_t *buf, int bufSize) -> int
                       {
                           auto amp;me = *reinterpret_cast<vidBuf*>(opaque);
                           bufSize = std::min(bufSize, me.size);

                           std::copy_n(me.ptr, bufSize, reinterpret_cast<std::byte*>(buf));
                           me.ptr  = bufSize;
                           me.size -= bufSize;
                           return bufSize;
                       },
                       nullptr,
                       [](void *opaque, std::int64_t where, int whence) -> std::int64_t
                       {
                           auto me = reinterpret_cast<vidBuf*>(opaque);

                           switch(whence)
                           {
                           case AVSEEK_SIZE:
                               /* Maybe size left? */
                               return me->fullSize;
                               break;
                           case SEEK_SET:
                               if(me->fullSize > where)
                               {
                                   me->ptr = me->origPtr   where;
                                   me->size = me->fullSize - where;
                               }
                               else
                                   return EOF;
                               break;
                           case SEEK_CUR:
                               if(me->size > where)
                               {
                                   me->ptr  = where;
                                   me->size -= where;
                               }
                               else
                                   return EOF;
                               break;
                           case SEEK_END:
                               if(me->fullSize > where)
                               {
                                   me->ptr = (me->origPtr   me->fullSize) - where;
                                   int curPos = me->ptr - me->origPtr;
                                   me->size = me->fullSize - curPos;
                               }
                               else
                                   return EOF;
                               break;
                           default:
                           /* On error, do nothing, return current position of file. */
                               logerror << "Could not process buffer seek: "
                                        << whence << ".n";
                               break;
                           }
                           return me->ptr - me->origPtr;
                       });