РАЗРАБОТКА И ИССЛЕДОВАНИЕ МЕТОДОВ СЖАТИЯ ИЗОБРАЖЕНИЙ С ПОТЕРЯМИ НА ОСНОВЕ АДАПТИВНОЙ СЕГМЕНТАЦИИ И КВАНТОВАНИЯ

Страница создана Милана Беляева
 
ПРОДОЛЖИТЬ ЧТЕНИЕ
На правах рукописи

                 Лужков Юрий Валерьевич

 РАЗРАБОТКА И ИССЛЕДОВАНИЕ МЕТОДОВ СЖАТИЯ
ИЗОБРАЖЕНИЙ С ПОТЕРЯМИ НА ОСНОВЕ АДАПТИВНОЙ
          СЕГМЕНТАЦИИ И КВАНТОВАНИЯ

   Специальность: 05.13.13 – Телекоммуникационные системы
                           и компьютерные сети

                       Автореферат
          диссертации на соискание ученой степени
                кандидата технических наук

                     Санкт-Петербург
                           2009
2

    Работа выполнена в Санкт-Петербургском государственном университете
информационных технологий, механики и оптики.

    Научный руководитель:              доктор технических наук, профессор
                                       Тропченко А. Ю.

    Официальные оппоненты:             доктор технических наук, профессор
                                       Демин А. В.

                                       доктор технических наук
                                       Матвеев Ю. Н.

    Ведущая организация:               Филиал    ФГУП      “ЦНИИ       “Комета”
                                       “Научно-проектный                  Центр
                                       оптоэлектронных                комплексов
                                       наблюдения” (“НПЦ ОЭКН”) (г. Санкт-
                                       Петербург)

    Защита диссертации состоится 9 июня 2009 г. в 15.50 на заседании
диссертационного      совета    Д 212.227.05     при     Санкт-Петербургском
государственном университете информационных технологий, механики и
оптики по адресу: 197101, Санкт-Петербург, Кронверкский пр., д. 49.

    С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского
государственного университета информационных технологий, механики и
оптики.

    Автореферат разослан 25 апреля 2009 г.

    Ученый секретарь
    диссертационного совета
    к.т.н., доцент                                         Поляков В. И.
3

               ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
    Проблема передачи и хранения информации, представленной в цифровом
виде, является одной из самых важных в вычислительной технике. Для
получения компактного     представления       данных используются различные
технологии сжатия. Их применение позволяет получить значительный выигрыш
в ресурсах при эксплуатации носителей информации и повысить эффективность
передачи данных по каналам связи.
    На    сегодняшний   день   наибольший       объем   данных     соответствует
изображениям, видеоданным и звуку. Как показывает практика, применение
методов сжатия без потерь не приводит к существенному сокращению их
информационного представления, поэтому актуальной задачей становится
исследование методов сжатия с потерями, ориентированных на конкретные
типы данных. Подобные методы сжатия должны использовать индивидуальные
особенности сжимаемого сигнала, включать в себя адаптивные механизмы его
обработки и учитывать особенности восприятия соответствующей информации
человеком.
    За последние десятилетия значительное развитие получили системы
хранения и обработки цифровых изображений. На данный момент уже
существуют    хранилища     данных,   насчитывающие        сотни     миллионов
оцифрованных изображений. Такие базы данных используются в самых
разнообразных областях, например, в медицине (рентгеновские снимки),
криминалистике (отпечатки пальцев), в сервисах для хранения фотографий в
сети Интернет. Вследствие этого, затрачиваются значительные усилия на
разработку новых технологий, позволяющих повысить эффективность сжатия
цифровых изображений. Этой проблеме посвящена данная диссертационная
работа.
    Стоит также отметить, что задача сжатия изображения решается и при
сжатии видеоданных на этапе устранения пространственной избыточности
опорных I-кадров. Наряду с этим, задача сегментации решается и при
устранении временной зависимости – на этапе построения векторов движения.
4

    Цель работы – исследование существующих и разработка новых методов
сжатия цифровых изображений, использующих адаптивные преобразования –
сегментацию на основе иерархической декомпозиции сигнала и процедуру
адаптивного квантования, а также поиск возможных путей повышения
эффективности применения этих методов.
    Выбранное направление работы основано на анализе современных методов
сжатия изображений с потерями. На сегодняшний день, в связи с развитием
средств     вычислительной     техники,    становится   возможной    реализация
комплексных схем сжатия, требующих большого объема вычислений. Так, если
первые     методы     сжатия   опирались    на   простые,   легко   реализуемые
преобразования, то современные алгоритмы сжатия включают в себя составную
адаптивную обработку сжимаемого изображения с применением совокупности
приемов кодирования разного типа.
    Задачи исследования. В рамках диссертационного исследования решались
следующие задачи:
    1. Анализ основных типов адаптивных преобразований, используемых в
          схемах сжатия с потерями.
    2. Повышение эффективности существующих схем сжатия, использующих
          адаптивную сегментацию на основе декомпозиции сигнала за счет
          использования новых подходов к локализации сегментов.
    3. Повышение эффективности схем сжатия, включающих процедуру
          квантования спектральных коэффициентов за счет адаптивного выбора
          шага квантования для каждой спектральной позиции.
    4. Программная реализация алгоритмов сжатия на основе предложенных
          подходов.
    Методы исследования. Диссертационное исследование включает в себя
теоретические и экспериментальные методы. К теоретическим методам
относятся методы теории информации, теории вероятностей. В рамках методов
теории информации отдельно выделяется RD-теория и анализ методов сжатия
данных на ее основе. Экспериментальное исследование включает программную
5

реализацию ряда схем сжатия с последующим сравнением реализованных
алгоритмов с уже существующими схемами сжатия.
    Программная реализация алгоритмов осуществляется в средах Microsoft
Visual Studio (C++), GCC и в среде MatLab.
    На защиту выносятся следующие результаты:
    1. Результаты анализа применения адаптивной сегментации в схемах
       сжатия изображений с потерями.
    2. Метод сжатия на основе иерархической декомпозиции изображения в
       трехмерном пространстве.
    3. Модифицированная схема сжатия, базирующаяся на иерархической
       декомпозиции изображения и геометрической аппроксимации сигнала
       билинейными поверхностями.
    4. Схема сжатия на основе рекурсивного разбиения изображения с
       использованием kd-дерева.
    5. Метод адаптивного квантования спектральных коэффициентов на
       основе весового критерия и его обобщение для схем сжатия с
       адаптивной векторной сегментацией.
    Научная новизна работы:
    1. Предложен      метод    иерархической     декомпозиции    изображения,
       позволяющий создавать улучшенные модификации уже существующих
       схем, использующих адаптивную сегментацию изображений, а также
       синтезировать новые.
    2. Усовершенствована схема сжатия, базирующаяся на иерархической
       декомпозиции изображения и геометрической аппроксимации сигнала
       билинейными поверхностями.
    3. Разработана    схема   сжатия   на    основе   рекурсивного   разбиения
       изображения с использованием kd-дерева для представления структуры
       сегментации.
6

    4. Разработан   метод     адаптивной       генерации   матриц    квантования
       спектральных коэффициентов с использованием весового критерия,
       основанный на адаптивном выборе шага квантования.
    5. Разработан    метод      адаптивного        квантования      спектральных
       коэффициентов на основе весового критерия, пригодный для схем
       сжатия с адаптивной сегментацией на области с неодинаковыми
       линейными размерами.
    Практическая ценность результатов работы заключается в следующем:
    1. Применение    метода    иерархической       декомпозиции     изображения
       позволяет улучшить результаты схем сжатия на основе адаптивной
       векторной сегментации. Так, для схемы на основе геометрической
       аппроксимации сигнала билинейными поверхностями коэффициент
       сжатия увеличивается в среднем на 3-6 %.
    2. Использование компрессора на основе последовательного рекурсивного
       разбиения изображения с применением kd-дерева позволяет достичь
       более высокой степени сжатия, чем при использовании аналогичных
       схем без адаптивной сегментации. Так, схема с дискретным косинусным
       преобразованием и параметрами вторичного сжатия, аналогичными
       схеме JPEG, превосходит эту схему в среднем на 10 %.
    3. Метод адаптивной генерации матриц квантования на основе весового
       критерия позволяет модифицировать компрессоры ряда схем сжатия без
       необходимости вносить изменения в декомпрессор. Так, модификация
       схемы JPEG по указанному методу позволяет улучшить результаты
       сжатия до 20 %.
    Внедрение результатов работы. Основные результаты работы внедрены в
учебном процессе СПбГУ ИТМО, а также в Ленинградском отраслевом научно-
исследовательском институте связи (ФГУП ЛОНИИС).
    Апробация результатов работы. Результаты выполненных исследований
были представлены на IV-й межвузовской конференции молодых ученых,
XXXVII-й научной и учебно-методической конференции СПбГУ ИТМО, V-й
7

всероссийской межвузовской конференции молодых ученых, XXXVIII-й
научной и учебно-методической конференции СПбГУ ИТМО, всероссийской
научно-технической конференции «Прогрессивные технологии в машино- и
приборостроении – 2008», VI-й всероссийской межвузовской конференции
молодых ученых.
     Публикации.       Основные   результаты      диссертационного   исследования
опубликованы в 9-и работах общим объемом 40 страниц: 8 статей [1,3–9] и 1
тезис [2].
     Структура и объем работы. Диссертационная работа состоит из введения,
основной части, содержащей 4 раздела, заключения и списка литературы.
Общий объем работы – 126 страниц. Работа содержит 49 иллюстраций и 9
таблиц. Список литературы включает 105 библиографических источников.

                           СОДЕРЖАНИЕ РАБОТЫ
     Введение      содержит   обоснование       актуальности   рассматриваемых   в
диссертации вопросов. Формулируются цель, задачи и методы исследования,
кратко изложено содержание диссертации.
     В первом разделе рассматриваются общие вопросы сжатия изображений с
потерями. Дается определение сжатию, отмечается, что задача сжатия
изображений с потерями сводится к устранению статистической и визуальной
избыточности в сигнале.
     Выделены следующие три ключевых этапа, характерные для схем сжатия с
потерями:
     1.      Преобразование сигнала с целью его декорреляции.
     2.      Отбрасывание части малозначимой информации.
     3.      Оптимальное (энтропийное) кодирование преобразованных данных.
     При этом проанализированы вносимые искажения и способы их оценки,
включая объективные меры (такие, как MSE, PSNR) и субъективные подходы к
оценке (MOS). На основе проделанного анализа предложена классификация
способов оценки искажения, вносимого при сжатии. Выделены два способа
8

                                                                    V
оценки степени сжатия изображений: коэффициент сжатия K =              , где V и V ′ –
                                                                    V′
размер в байтах исходного и сжатого изображений соответственно, и среднее
                                            8V ′
число бит на пиксель (bits per pixel) b =        , где N и M – горизонтальная и
                                            MN
вертикальная размерности изображения в пикселях.
    В    работе    рассмотрены    основы    RD-теории     (rate   distortion     theory),
необходимые в процессе построения RD-оптимальных схем сжатия. Отмечено,
что наилучшая степень сжатия достигается при минимуме средней взаимной
информации, описаны три варианта задачи RD-оптимизации.

    Рассмотрена классификация методов сжатия изображений. Проведен обзор
основных схем сжатия с потерями.
    Во    втором     разделе     исследуются    методы    компрессии       цифровых
изображений на основе адаптивных преобразовании.
    Отмечено, что суть адаптивных подходов к сжатию заключается в том, что
для повышения эффективности компрессии при обработке сигнала учитываются
его уникальные, индивидуальные особенности (например, распределение
сигнала в пространственной или частотной области).
    В рамках обзора адаптивных методов сжатия представлено введение в
адаптивное   квантование.      Изложены     основные     теоретические         сведения,
необходимые для дальнейшего рассмотрения проблемы.
    Представлен анализ статистических алгоритмов сжатия, проведен ряд
экспериментов. В качестве изображений для тестов взяты портретный рисунок,
изображение с белым шумом и шахматная доска. Показано, что при
использовании энтропийного кодирования следует учитывать корреляцию
смежных групп элементов.
    Представлен анализ подходов к сжатию на основе адаптивной сегментации.
Отмечено, что в основе различных методов сегментации лежит один из двух
подходов: поиск границ и выделение однородных областей. Предложена
классификация методов сегментации, используемых в алгоритмах сжатии, по
9

типу локальных областей. Отмечается, что векторная сегментация позволяет
упростить процесс выделения областей и их последующую обработку.
    Третий раздел посвящен исследованию методов компрессии, основанных
на адаптивной векторной сегментации.
    В ней рассматриваются древовидные структуры, используемые для
сохранения информации о декомпозиции изображения, описываются их
свойства.     Рассматриваются    принципиальные    алгоритмы     декомпозиции
изображения на основе простых квадродеревьев. Излагается метод оптимизации
квадродерева на основе функции цены Лагранжа.
    Выполнен анализ методов кодирования и обработки локальных областей,
получаемых в результате векторной сегментации. Отмечается, что одна из
ключевых проблем обработки сегментов – их оценка и классификация, а
наиболее распространенный подход к ее решению – проверка области на
однородность посредством специального критерия. Формулируются следующие
требования к критерию однородности:
    1.      Значения критерия должны быть неотрицательны и равны нулю для
            области с одинаковыми амплитудами пикселей.
    2.      Критерий однородности должен адекватно отражать как биение
            отдельных пикселей, так и плавное изменение их амплитуд по области
            в целом.
    3.      Значения критерия должны коррелировать с численными оценками
            искажения и степени сжатия.
    Проведен обзор различных способов задания критерия однородности.
Кроме того, проанализирован вопрос оценки выраженности текстуры локальной
области на основе соответствующего критерия.
    Также рассмотрена проблема аппроксимации сегментов, получаемых в
результате сегментации. Описываются бимлет- и веджлет-аппроксимация. Также
рассматривается подход к аппроксимации, основанный на использовании
билинейных поверхностей, строящихся по четырем точкам (см. пример на
рис. 1). Отмечены достоинства и недостатки описанных подходов.
10

    Рассмотрено применение древовидных структур в методах сегментации на
основе   последовательного     разделения    областей,    использование     которых
обусловлено более гибкой локализацией объектов изображения по сравнению с
квадродеревьями. Один из наиболее распространенных типов таких структур –
kd-деревья, составные узлы которых имеют ровно 2 потомка. Рассматривается
вопрос о компромиссе между стоимостью кодирования kd-дерева и гибкостью
локализации сегментов. Изложены принципы сегментации на основе BSP-
деревьев и обобщенных квадродеревьев, отмечены их достоинства и недостатки.

              A                                             Z

                                     N                                            Y

    M                                            X
           Рис. 1. Аппроксимация сигнала билинейной поверхностью
    Разработана JPEG-подобная схема компрессии на основе адаптивной
сегментации с использованием kd-дерева, суть которой заключается в
рекурсивном разбиении области с представлением структуры разбиения
посредством kd-дерева. Для кодирования узлов предложено применять
ортогональное преобразование с последующим статистическим кодированием
спектральных коэффициентов. Пример сегментации, полученный в результате
экспериментов для числа линий разбиения по вертикали и горизонтали

Rnmin = Rm
         min
             = 1 , приведен на рис. 2, а. б – сегментация для Rnmin = Rm
                                                                       min
                                                                           = 7.
11

                                   а                                              б
                             Рис. 2. Примеры сегментации изображений

             В     рамках    экспериментального        исследования               было      выбрано      ДКП,
адаптированное для прямоугольных блоков. Это позволило произвести
сравнение предложенной схемы с популярной схемой JPEG. На рис. 3
представлены результаты сравнения стандартной схемы JPEG (сплошная линия)
с предложенной модификацией (пунктирная линия) для двух изображений.

                    Изображ ение "Oldman"                                    Изображ ение "Lena"
        11                                                     8,4
                                                        RMSE
 RMSE

         9                                                     7,4

         7                                                     6,4

         5                                                     5,4

                                              b                                                            b
         3                                                     4,4
                                         (бит/пикс.)                                                  (бит/пикс.)
             0,6    1,2     1,8   2,4   3                            0,3    0,6    0,9      1,2    1,5

                      Рис. 3. Результаты эксперимента для двух изображений
             Из графиков видно, что предложенная схема превосходит стандартную
схему JPEG: выигрыш по степени компрессии для коэффициентов сжатия K>10
составляет в среднем 10 % при том же значении ошибки RMSE.
             Разработан метод сжатия изображений на основе пространственной
декомпозиции                 сигнала.       Он    основан                  том,       что         изображение
             {
X A = A0,0 , K, AM −1,0 ;K; A0, N ,K , AM −1, N    }      обрабатывается                 как      трехмерный
12

объект,   где    третья     координата            –        амплитуда          пикселей       a.   Элементы
рассматриваемого         пространства         ν m, n , a ,           называемые       вокселями,     могут

принимать значения из множества {0;1} . Тогда в системе координат 0mna можно
выполнять следующие три действия (в той последовательности, которая выгодна
с точки зрения некоторого критерия):
    1.    Усечение амплитуд окрестности.
    2.    Разбиение окрестности плоскостью, параллельной 0ma .
    3.    Разбиение окрестности плоскостью, параллельной 0na .
    Результат разбиения представляется с помощью древовидной структуры.
Одна операция горизонтального разбиения позволяет сократить число разрядов
для представления значений аппроксимации сразу нескольких узлов. Введена
функция для оценки стоимости хранения ветки дерева в битах относительно
некоторого узла:
                                        Nh            Nv            Na
                              f cost = ∑ bih + ∑ biv + ∑ bia ,                                         (1)
                                        i             i              i
где bia – число бит, необходимое для сохранения значения аппроксимации i-го

оконечного      узла,    аналогично,         bih и biv – горизонтальной                  и   вертикальной
декомпозиции      соответственно.           Используя                    горизонтальную      декомпозицию

сигнала, можно уменьшить величины bia и bih .
    Разработана         усовершенствованная                 схема           сжатия,   базирующаяся      на
иерархической декомпозиции изображения и геометрической аппроксимации
сигнала билинейными поверхностями. Функция цены (1) в случае данной схемы
имеет следующий вид:
                                   Nh        Nv                 Na
                                                                     ]
                           f cost = ∑ bih + ∑ biv + 4 ∑ bia − log 2 δ ,         [
                                    i         i                 i

где δ – параметр, задающий максимум ошибки аппроксимации.
    Результаты экспериментов сравнения базовой и модифицированной схемы
для изображения «LENA» представлены на рис. 4.
13

         b (бит/пикс.)
  3,70

  3,20
                                                             Модифицированный
                                                             алгоритм
  2,70
                                                             Базовый алгоритм
  2,20

  1,70

  1,20
                                                        δ
            1     2      3     4    5     6        7

   Рис. 4. Результаты эксперимента: сравнение модифицированной и базовой
                              схемы компрессии

    Согласно         полученным    результатам,        модифицированный      алгоритм
превосходит базовый по степени сжатия на 3-6 %.
    Четвертый         раздел   посвящен   исследованию           методов   адаптивного
квантования. Исследован вопрос выбора RD-оптимального вектора квантования
при условии фиксированного размера окна сканирования. Пусть сигнал
представлен M одинаковыми блоками по N значений в каждом (n – индекс
элемента в данном блоке, m – номер данного блока). Каждый блок может быть
преобразован     в    одномерный   массив      (например,    с    помощью    «зигзаг»-
сканирования).
    Установлено, что возможны два пути определения значения некоторого
параметра компрессии:
    1.     Сравнение результатов компрессии для всех значений данного
           параметра (либо комбинаций параметров) с последующим выбором
           лучшего результата.
    2.     Использование некоторой вспомогательной функции для оценки
           результатов компрессии и выбор значений параметров на ее основе.
14

       Первый подход дает заведомо лучшие результаты, но его реализация не
всегда осуществима, поэтому большое внимание уделяется поиску оценочной
функции.
       Рассмотрен подход к оценке энтропии для схем сжатия, использующих
кодирование длин серий. Представлены описания двух пошаговых схем RD-
оптимизации: однонаправленной и двунаправленной схем. Отмечено, что
двунаправленная оптимизация в целом показывает лучшие результаты, но
требует больше времени на выполнение. В работе как базовая описана схема
оптимизации RD-OPT, предложенная В. Ратнакаром и М. Ливни. В такой схеме
используется способ оценки энтропии, основанный на статистике квантованных
значений. К недостаткам такой схемы можно отнести необходимость
вычисления массива для ряда значений R или D, размерность которого тем
больше, чем выше требования к точности вычислений.
       В качестве альтернативы описанным схемам разработан метод, основанный
на статистическом анализе спектральных коэффициентов. Он может быть
использован при условии, что окно сканирования сигнала имеет постоянный
размер. Идея основана на том, что процедура квантования выполняется с учетом
некоторой     статистической        информации       о   сигнале,      заданном   как
r
   {                }
z = z 0,0 ,K, z N −1, M −1 , собранной от M блоков и уникальной для элементов
                                                                   )
каждого индекса n. В рамках подхода вводится критерий T , называемый весом
                                            )
коэффициента      спектра.     Величина     T       отражает   степень    значимости
соответствующей спектральной позиции n коэффициентов zn,m , m = 0, M − 1 .
                                )
Один из способов вычисления T оперирует средними амплитудами спектра:
                               )    1 M −1
                               Tn =    ∑ z n, m .
                                    M m=0
                                                                                  (2)

       Достоинством данного критерия является отсутствие обязательного
                                                               )
дополнительного прохода по сигналу. Пример значений T , вычисленных по (2)
для коэффициентов ДКП, M = 8 × 8 = 64 , приведен на рис. 5. Слева – результаты
вычислений для компоненты яркости Y двух изображений, справа – для
15

                                                                                                             )
хроматических             компонент        одного           рисунка.        На    графиках       значения    T
                                               )
переиндексированы так, чтобы T не возрастал от n.
       )                                                                    )
 100
       T                                                                    T
                                                                     10
                                      Изображение                                                           Cb
                                      "Lena"                                                                Cr
  10                                                                    1
                                      Изображение
                                      "Oldman"                              1    11   21   31     41   51   61

  1                                                          n       0,1                                         n
       1     11      21      31      41        51   61

 0,1                                                                0,01

0,01                                                               0,001

                                                    )
           Рис. 5. Динамика изменения T для ДКП в логарифмической шкале

                                                        )
       Другой вариант вычисления T использует максимальные амплитуды
коэффициентов:
                                      )
                                      Tn = max z n, m .             (3)
       Итоговое выражение для вычисления функции параметра квантования,
                                                             )
использующее нелинейную функцию от T , имеет следующий вид:
                                   r                r
                      r        f ( z ,n max ) − f ( z , n )
                                  )
                  ∆ ( z , n) = ∆ (T ) = a1 +
                                r                r          (a 2 − a1 ) , (4)
                            f ( z ,n max ) − f ( z ,n min )
    )                               r
где f – корректирующая функция, z – исходный спектральный вектор, a1 и a2 –
константы. Таким образом, функция шага квантования локализована в диапазоне
от a1 до a2.         Варьируя её форму, можно в большей или меньшей степени
подавлять определённые группы коэффициентов. Так, пусть известно, что
                                                                                             )
высокочастотным компонентам соответствуют малые значения T . Тогда, чтобы
                                                                    )
подавить высокие частоты, достаточно задать f в (4) с таким расчётом, чтобы её
энергия на начальном участке была близка к максимальной.
       Предложенный метод применен для адаптивной генерации матриц
квантования в схеме JPEG. При этом использовалась линейная функция
квантования на основе критерия максимальных амплитуд (3). Графики функций
16

шага квантования JPEG приведены на рис. 6, слева. Графики зависимости
размера шага квантования ∆ от номера спектральной позиции n, адаптивно
сгенерированные для изображения «Oldman», показаны на рис. 6, справа.

       ∆                                                                  ∆
 120                                                              120

  80                                                               80

  40                                         Y                                                            Y
                                                                   40
                                             Cb,Cr                                                        Cb,Cr

   0                                                                  0
                                                      n                                                              n
       0            20         40                60                       0          20         40           60

   Рис. 6. Стандартные и сгенерированные функции параметра квантования
                    )
       График T для изображения «Oldman» приведен на рис. 7, слева. Справа
показаны результаты компрессии с применением матриц по умолчанию
(сплошная линия) и матриц, сгенерированных в рамках эксперимента (пунктир).
Эксперименты показали, что увеличение степени сжатия составляет до 20 % в
пользу адаптивного подхода при одинаковых значениях искажения.

   T                                                                          Изаображ ение "Oldman"
1000
                                                      RMSE

                                                             12

 800                                Y
                                    Cr,Cb                     9
 600
                                                              6
 400

                                                              3
 200

   0                                         n                0                                             b
                                                                  0            2      4     6        8 (бит/пикс.)
       1       16        31   46        61

           Рис. 7. Генерация адаптивных матриц квантования для схемы JPEG
17

       Поскольку, как показано в третьем разделе, многие перспективные методы
сжатия используют разбиение сигнала на блоки разного размера, актуальным
становится вопрос об обобщении предложенного метода генерации векторов
квантования. Для этих целей предложено использовать масштабирование
прямоугольной матрицы сегмента, причем данное конкретное спектральное
                                                                    )
значение должно входить в формулу вычисления критерия T с некоторым
коэффициентом, в общем случае зависящим от линейных размеров изображения

( H x × H y ) и данной локальной области ( H xm × H ym ):

                                        (                      )
                                α m = φ H x , H y , H xm , H ym .

       Простейший вариант вычисления α m основан на соотношении площадей

       H xm H ym
αm =               сегмента и рисунка. Поскольку размерность матрицы квантования
        HxH y

в общем случае не равна размерности данного сегмента, каждый спектральный
коэффициент линейно масштабируется на соответствующую позицию матрицы.
       Предложенный подход может быть применен в различных методах сжатия
с сегментацией на основе древовидных структур, использующих квантование
спектральных коэффициентов. Матрица квантования едина для данной цветовой
плоскости, нет необходимости вычислять свою матрицу для каждого сегмента
данного размера, что является существенным преимуществом даже для схем с
сегментацией на основе квадродерева. Кроме того, подход не исключает
использование психовизуальной модели в процессе определения вектора
квантования.
       В заключении приведены основные результаты и выводы по проделанной
работе.

                      ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
     Основные результаты диссертационной работы состоят в следующем.
   1. Выполненный анализ алгоритмов сжатия изображений с потерями
        показал, что наилучшие результаты обеспечивают методы, основанные на
18

  адаптивной обработке исходного сигнала. При этом отмечено, что
  наиболее высокой эффективностью обладают методы сжатия, основанные
  на адаптивной векторной сегментации.
2. Предложена схема, основанная на рекурсивном разбиении изображения с
  использованием kd-дерева для представления структуры сегментации.
3. В результате исследования методов декомпозиции сигнала разработан
  метод     иерархической     декомпозиции         изображения,       позволяющий
  создавать модификации существующих схем сжатия.
4. Предложена усовершенствованная схема сжатия, базирующаяся на
  иерархической       декомпозиции        изображения         и    геометрической
  аппроксимации сигнала билинейными поверхностями.
5. Разработан     метод     адаптивной        генерации     матриц     квантования
  спектральных коэффициентов с использованием весового критерия.
6. Метод адаптивной генерации матриц квантования обобщен на случай
  схем сжатия с адаптивной сегментацией на области с неодинаковыми
  линейными размерами.
7. В    рамках    экспериментальной      части     исследования       осуществлена
  программная реализация предложенных схем сжатия и получены
  численные результаты компрессии различных изображений, согласно
  которым        общий    выигрыш        от      использования        предлагаемых
  модифицированных схем сжатия составляет порядка 35-40 % .

       СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Лужков    Ю. В.   JPEG-подобный        алгоритм        сжатия   изображений    с
  адаптивным выбором локальных областей // Научно-технический вестник
  СПбГУ ИТМО. – 2007. – Вып. 39. – С. 149 – 156.
2. Лужков    Ю.В.    JPEG-подобный        алгоритм    сжатия       изображений    с
  адаптивным      выбором     локальных       областей.     Сборник    тезисов   IV
  межвузовской конференции молодых ученых. СПбГУ ИТМО, 2007 г.,
  с.64.
19

3. Лужков Ю. В. Компрессия изображений с потерями на основе адаптивной
  сегментации // Современные проблемы науки и образования. – 2008. –
  Вып. 6. – C. 15.
4. Лужков Ю. В. Адаптивное квантование и его использование в схемах
  сжатия изображений с потерями // Современные проблемы науки и
  образования. – 2008. – Вып. 6. – C. 16.
5. Лужков Ю. В., Тропченко А. Ю. Исследование алгоритмов сжатия с
  потерями на основе пространственной декомпозиции сигнала // Научно-
  технический вестник СПбГУ ИТМО. – 2008. – Вып. 58. – С. 37 – 42.
6. Лужков Ю. В. Адаптивная генерация матриц квантования в JPEG-
  подобных схемах // Журнал научных публикаций аспирантов и
  докторантов. – 2008. – Вып. 12. – С. 58 – 60.
7. Тропченко А. Ю., Лужков Ю. В. Сжатие изображений на основе
  адаптивной сегментации // Прогрессивные технологии в машино- и
  приборостроении: Сборник статей. – Н. Новгород –Арзамас: НГТУ-
  АГПИ. – 2008.
8. Тропченко А. Ю., Лужков Ю. В. Сжатие изображений с потерями на
  основе адаптивной сегментации // Научно-технический вестник СПбГУ
  ИТМО. – 2009. – Вып. 59. – c. 84 – 91.
9. Лужков Ю. В. Метод адаптивного скалярного квантования в схемах
  необратимого сжатия изображений // Известия вузов. Приборостроение. –
  2009. – Т. 52, Вып. 3. – С. 12 – 16.
Вы также можете почитать