18
Дипломная работа на тему: «Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания» Руководитель: Крапивенко А.В. Дипломник 08-606: Инеев Д.Н. МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ (национальный исследовательский университет)

Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Embed Size (px)

Citation preview

Page 1: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Дипломная работа на тему: «Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для

потокового вещания»

Руководитель: Крапивенко А.В.Дипломник 08-606: Инеев Д.Н.

МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ(национальный исследовательский университет)

Page 2: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

О чем вообще речь?

• Потоковое вещание видео – это непрерывная передача и отображении пользователю цифрового видео от источника потокового вещания.

• Видекодек - программа или алгоритм для сжатия и восстановления видеоданных.

Page 3: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Особенности потокового видео

• Потоковое видео не имеет размера• Качество отображения зависит от

пропускной способности сети вещания• Восприятие видео зависит от величины

сетевой задержки

Page 4: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Реакция на время отклика

• Границы времени отклика по Я. Нильсену:o 0.1 секунды – система отвечает мгновенноo 1 секунда – задержка становится заметнойo 10 секунд – предел внимания пользователяo > 10 секунд – полная потеря внимания

Page 5: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Задержки в потоковом вещании

• Основные причины задержек следующие:– Низкая скорость кодирования/декодирования– Большой размер кодированных кадров– Удалённость сервера вещания– Помехи в сети передачи данных

Page 6: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Почему H.265 (HEVC)?

• Стандарт находится в свободном доступе• H.264, предыдущий стандарт от тех же

авторов – широко распространен• Заявленная цель «уменьшение битовой

скорости на 50%» уже выполняется• Активно развивается, как сам стандарт, так

и его программные реализации

Page 7: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Почему только часть?

• Написание кодека – очень трудоемкая задача

Page 8: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Внутрикадровое предсказание• Кодер формирует предсказание для

X на основе A, B, C• К примеру, P(X) = (2A + B + C)/4 • Затем вычитает P(X) из X и кодирует

полученную разность.• Декодер вычисляет P(X) и прибавляет

к декодированной разности, тем самым получая X

• Для сжатия с потерями вместо A, B, C используется соответствующие A’,B’,C’, уже спрогнозированные

Page 9: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

HEVC: разбиение на блоки

• Всё изображение разбивается на крупные блоки кодового дерева размером 64x64

• Каждый из этих блоков может рекурсивно разбиваться на более мелкие вплоть до размеров 8x8

Page 10: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

HEVC: режимы интрапредсказания

• Всего 35 режимов:– 33 направленных– 1 DC– 1 Planar

• Среди них нужно выбрать лучший

Page 11: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

RD-стоимость

• RD-стоимость – мера вносимых искажений при заданной битовой скорости

• Jm = Dm + λRm

• Jm – RD-стоимость режима m

• Dm – мера искажений, SSD• λ – коэффициент, зависящий от параметра

квантизации• Rm – оценка количество бит, необходимых для

кодирования

Page 12: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Поиск режима предсказания

1. Для каждого режима вычисляется SATD между текущим блоком и предсказанным.

2. Выбирается N (от 3 до 8) режимов с минимальным SATD

3. Из этих N режимов выбирается один с наименьшей RD-стоимостью

Page 13: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Зачем что-то менять?

• Поиск производится для всех возможных подблоков размерами от 64x64 до 4x4

• Получается, что поиск режима предсказания выполняется 11935 раз для каждого блока

• При этом SATD вычисляется 341*35 раз• Оценка количества битов необходимых для

кодирования – 2623 раза• Это много, учитывая размер всего

изображения

Page 14: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Как предлагается это ускорить

• Сократить количество возможных разбиений

• Сократить количество вычислений RD-стоимости

Page 15: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Откуда могут быть проблемы

• При оптимизации скорости поиска режима предсказания могут возникнуть следующие проблемы:1. Изменится качество видео2. Изменится битовая скорость видео

Page 16: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Кодек для программной реализации

• Для модификации был выбран кодек Kvazaar:– Открытые и понятные исходные коды– Свободная лицензия GPLv2– Кроссплатформенный

Page 17: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Наборы настроек кодирования

• fast – быстро кодирует, низкое качество• slow – медленно кодирует, высокое

качество• medium – компромиссный вариант

Page 18: Оптимизация методов внутрикадрового предсказания формата H.265(HEVC) для потокового вещания

Архитектура системы потокового вещания