Автоматическая система контроля

Автоматизация технологических процессов

Анализ методов и международных рекомендаций по сжатию изображений

Кодирование неподвижных изображений по рекомендации JPEG

Алгоритм сжатия неподвижных кадров (видеоизображений) основывается в основном на стандарте JPEG (Joint Photographic Experts Group).

В рекомендации JPEG рассмотрены два основных класса алгоритмов сжатия: на основе дискретного косинусного преобразования (ДКП) и дифференциальной импульсно-кодовой модуляции (ДИКМ). Считается что алгоритм с ДКП обеспечивает значительное большее сжатие, чем алгоритм с ДИКМ.

Кодирование изображения по алгоритму JPEG обычно начинается с преобразования цветного пространства в сигнал яркости Y и два цветоразностных сигнала Сb Сr. Такой подход позволяет повысить эффективность сжатия. При этом система сжатия компоненты яркости будет меньше, чем цветоразностных компонентов, так как люди в гораздо меньшей степени замечают изменения в цвете.

После преобразования цветового пространства обычно, но необязательно, производится прореживание данных цветности. При прореживании отбрасываются цветоразностные компоненты строк или столбцов пикселов с определенными номерами (например, каждой второй строки и каждого второго столбца).

Следующий этап процедуры сжатия заключается в преобразовании небольших блоков изображения с помощью двумерного ДКП. Обработка ведется блоками 8x8 пикселов, т.е. сразу обрабатываются 64 пиксела. Выбор блока подобного размера объясняется несколькими причинами. Во-первых, такой блок с большой вероятностью содержит пикселы близкого цвета (яркости); во-вторых, он достаточно большой (чаще всего превышает интервал корреляции). ДКП во многом напоминает дискретное преобразование Фурье.

При выполнении этой операции информация 64 пикселов преобразуется в матрицу из 64 коэффициентов. Важнейшая особенность этой матрицы-то, что в ней основную энергию несут первые коэффициенты, а энергия последующих быстро убывает (максимальные значения коэффициентов ДКП концентрируются в левом верхнем углу матрицы, а минимальные - в нижнем правом). Операция ДКП выполняется раздельно для каналов яркости и цветности.

Использование ДКП объясняется тем, что для большого класса изображений оно хорошо аппроксимирует оптимальное дискретное представление Корунена-Лоэва, имеет алгоритм быстрого преобразования, просто в реализации и обеспечивает при этом существенное сжатие. Сканирование коэффициентов ДКП обычно производится по зигзагу, что облегчает статистическое кодирование, так как наиболее вероятно коэффициенты ДКП будут убывать с увеличением частоты.

Далее преобразованная матрица проходит операцию квантования, применяемую для сокращения разрядности коэффициентов. Фактически квантование означает деление матрицы 8x8 коэффициентов ДКП на матрицу квантования также с размерностью 8x8. При этом результат деления округляется до ближайшего целого. После квантования значения чисел в левом верхнем углу оказываются намного меньше чем ранее, а в правом углу получаются преимущественно нули. Именно здесь происходит основное сжатие и основная необратимая потеря информации. Причем цветоразностные компоненты могут квантоваться более грубо. После этого матрица, представляющая результат квантования, вытягивается в строку данных так, что все последовательности нулей правого нижнего угла оказываются в конце строки.

В некоторых версиях информация о яркости и цвете затем кодируется так, что сохраняются только отличия между соседними блоками, т.е. используется алгоритм ДИКМ. После этого производится статистическое кодирование по методу Хаффмана (метод сжатия без потерь). Сначала анализируется вся последовательность символов. Часто повторяющимся сериям бит присваиваются короткие элементы (маркеры). В частности, последние нули в конце строки могут быть заменены одним символом конца блока. Поскольку все блоки имеют одинаковую длину, всегда известно сколько нулей было опущено. В рекомендациях JPEG предусматривается такое использование арифметического кодирования. При восстановлении (декодировании) данных перечисленные выше операции выполняются в обратном порядке.

Возможная степень сжатия зависит как от вида изображений, так и от применяемых типов матриц квантования. Гладкие полутоновые изображения без мелких деталей сжимаются лучше, чем с мелкими деталями. Например, изображение человеческого лица можно сжимать с большим коэффициентом, чем картинку с текстом. Перейти на страницу: 1 2 3 4 5

Другие статьи по теме

Волноводно-щелевая антенна нерезонансного типа волноводный щелевой антенна Щелевые антенны применяются для передачи энергии из одного волновода в другой, для излучения энергии во внешнее пространство. Компактность и возм ...

Зоновая РРЛ прямой видимости Рязань-Ряжск канал профиль интервал Радиорелейные линии занимают прочное место в сети связи РФ. Они широко используются для передачи сигналов многоканальной телефонии, телевидения, звукового вещания, ...

Антенно-фидерные устройства «Хорошая антенна - лучший усилитель высокой частоты» Радиосвязь между двумя пунктами, расположенными на поверхности Земли осуществляется пространственными и поверхностными волнами. ...