Что такое 6-tap filter и чем они отличаются в разных кодеках?

#filter #filtering #signal-processing #vp8

#Фильтр #фильтрация #обработка сигналов #vp8

Вопрос:

Я нашел в одном исследовании по декодированию VP8 фразу «6-tap filter в любом случае будет 6-tap filter, и разница обычно заключается только в коэффициентах». Итак, что такое 6-tap filter, как он работает?

Итак, кто-нибудь может, пожалуйста, объяснить, что такое 6-tap filter и чем они отличаются в разных кодеках?

Ответ №1:

В видеокодеках есть два места, где обычно используются эти фильтры:

Оценка / компенсация движения

Видеокодеки сжимают намного лучше, чем кодеки для неподвижных изображений, потому что они также устраняют избыточность между кадрами. Они делают это с помощью оценки движения и компенсации движения. Кодировщик разбивает изображение на прямоугольные блоки данных изображения (обычно 16×16), а затем пытается найти блок в ранее закодированном кадре, который максимально похож на блок, который кодируется в данный момент. Затем кодировщик передает только разницу и указатель на то, где он нашел это хорошее соответствие. Это основная причина, по которой видеокодеки получают сжатие примерно 1: 100, в то время как графические кодеки получают сжатие 1: 10. Теперь вы можете представить, что иногда камера или объект в сцене перемещались не на полный пиксель, а фактически на половину или четверть пикселя. В этом случае будет найдено лучшее соответствие, если изображение масштабировано / интерполировано, и для этого используются эти фильтры. Точный способ, которым они выполняют эту фильтрацию, часто отличается для каждого кодека.

Снятие блокировки

Еще одна причина использования такого фильтра заключается в удалении артефактов из используемого преобразования. Как и при кодировании неподвижных изображений, существует преобразование, которое преобразует данные изображения в другое пространство, которое «уплотняет энергию». Например, после этого преобразования те участки изображения, которые имеют одинаковый цвет, например, голубое небо, приведут к данным, имеющим только одно число для обозначения цвета, а затем все нули для остальных данных. Сравнивая это с исходными данными, в которых для всех пикселей сохраняется синий цвет, большая избыточность была удалена. После преобразования (Google для DCT, KLT, целочисленного преобразования) нули обычно выбрасываются, а остальные, не столь релевантные данные, которые остаются, кодируются меньшим количеством битов, чем в оригинале. Во время декодирования изображения, поскольку данные были удалены, это часто приводит к образованию границ между 8×8 или 16×16 соседних блоков. Существует отдельный сглаживающий фильтр, который затем снова сглаживает эти края.

Ответ №2:

Фильтр с 6 отводами — это фильтр FIR 6-го порядка или IIR (возможно, FIR). Коэффициенты будут определять частотную характеристику фильтра. Не зная структуры, коэффициентов и частоты дискретизации, вы не сможете сказать больше о фильтре.