49
1 Multimedia Communications Chapter 4 Video Compression Techniques (2) 아주대학교 정보및컴퓨터공학부 모바일 멀티미디어통신 연구실 (http://mmcn.ajou.ac.kr) 노병희 ([email protected]) Contents Video Compression Basics Video Compression Standards : H.26x H.261 H.263 MPEG Video Compression Standards MPEG-1 MPEG-2 (H.262) MPEG-4 H.264

05 Video

Embed Size (px)

Citation preview

Page 1: 05 Video

1

Multimedia Communications

Chapter 4Video Compression Techniques (2)

아주대학교 정보및컴퓨터공학부

모바일 멀티미디어통신 연구실 (http://mmcn.ajou.ac.kr)

노병희 ([email protected])

Contents

Video Compression BasicsVideo Compression Standards : H.26x

H.261H.263

MPEG Video Compression StandardsMPEG-1MPEG-2 (H.262)MPEG-4H.264

Page 2: 05 Video

2

MPEG-1 개요

MPEG-1ISO/IEC 11172-1,2,3,4,5

Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s

MPEG 압축 기법 개요

MPEG 표준화ISO의 MPEG (Moving Picture Experts Group)에 의하여 표준화 됨

MPEG 표준 방법들

• MPEG-1– CD-ROM과 같은 디지털 저장 매체에 VHS 테이프 수준의 동영상과

음향을 최대 1.5 Mbps 로 압축 저장하기 위하여 개발

• MPEG-2– MPEG-1의 확장형

– 디지털 TV방송, HDTV, 대화형 TV등 더욱 높은 화질과 음질을필요로 하는 응용 분야에 더 높은 비트율에서 영상과 음향을압축하기 위한 목적으로 개발

• MPEG-4– 높은 비트 효율이 요구되는 원격회의나 관련 응용을 위해 아주

낮은 비트율을 사용하는 압축 표준

Page 3: 05 Video

3

MPEG-1 개요

MPEG-1 표준 개요표준화 추진 기구

• ISO/IEC JTC1 산하의 The Moving Picture Experts Group (MPEG)에서 표준화 작업

• 1988년에 시작하여 1992년에 표준화 완료

디지털 저장 매체를 대상으로 함

• CD, VTR과 같은 디지털저장 매체에 1.5 Mbps 이내로 동영상과음향을 압축하여 다중화 하기 위한 표준

디코더 부분이 표준화 대상

• MPEG 표준은 저장 및 전송을 위한 Syntax를 지정하고, 디코딩프로세스를 정의함

• 인코딩은 표준화 대상이 아님

– 인코더는 표준을 따르는 압축 비트 스트림을 생성하면 되고, 인코딩 메커니즘은 독자적인 방법을 사용 가능

MPEG-1 개요

MPEG-1 표준 구성MPEG-1 Video : at < 1.5 MbpsMPEG-1 Audio : at the rates of 64, 128, 192 kpbs per channelMPEG-1 System : 여러 압축된 A/V 스트림의 다중화 및 동기화.

Medium Specific Decoder

System Decoder

VideoDecoder

AudioDecoder

ISO/IEC 11172-1’92.11

ISO/IEC 11172-3’92.11

ISO/IEC 11172-2’92.11

Clock Control

Decoded Video

Decoded Audio

Digital Storage Medium

Page 4: 05 Video

4

MPEG-1 기본 특징

MPEG-1 비디오 표준 부호화 기법의 기본 특징임의 접근성 (random access)의 제공

• GOP (Group Of Picture) 형식에 의함

편집 가능성

• 화면을 정렬하거나 부분적 사용을 위하여 GOP 단위의 편집 기능 제공

고속의 순방향 탐색, 역방향 탐색 및 역방향 재생

음성-영상 동기화

형태의 유연성

• 부호화 화면의 크기와 프레임율을 조절 가능.

MPEG-1 기본 특징

MPEG-1 비디오 입력 영상스케닝 방식 : progressive scan 만을 사용함.화면 크기 : SIF (source input format)만을 사용

• Y, CB, CR 칼라 표현 방식만 지원

• 4:2:0 칼라 샘플링 방식만 지원

• NTSC, PAL, SECAM등 표준 TV 와 호환성

Size Type NTSC (525) PAL (625)

ITU-R 720x480 720x576 SIF 360x240 360x288

Luminance (Y)

SPA 352x240 352x288 ITU-R 360x240 360x288 SIF 180x120 180x144

Color (Cr, Cb)

SPA 176x120 176x144

SPA (Significant Pixel Area) : MPEG에서의 움직임 보상 단위인 16x16의매크로 블록 크기에 맞춘 실제로 부호화에 유효한 면적

Page 5: 05 Video

5

MPEG-1 화면 형태

MPEG 의 화면 형태I-picture (Intra-coded Picture)

• 다른 픽쳐의 참조없이 자신만을 이용하여 JPEG으로 부호화

• 임의 접근성(random access)을 제공하는 기준 화면

P-picture (Predictive Coded Picture)• 바로 이전의 I- 또는 P-픽쳐로 부터 움직임 예측 및 보상 방식을

사용하여 부호화

• H.261의 inter-frame 모드와 유사

• I-픽쳐에 비하여 비트량이 30-50% 정도임

B-picture (Bidirectionally Predictive Coded Picture)• 바로 이전 이후의 I-또는 P-픽쳐들을 참조하여 부호화

• P-픽쳐에 비하여 비트량이 50% 정도임

D-picture• DCT DC 계수만을 사용하는 특수한 화면

• 고속 탐색등과 같은 기능을 제공하기 위하여 사용

MPEG-1 화면 형태

I

BI-picture: 이전 또는이후 프레임들과 상관

없이 부호화됨

P

B

P

P-picture : 바로 이전의 I 또는 P 프레임을 참조한 움직임 예측을 통하여 부호화됨

B

B-picture : 바로 이전과 이후의 I 또는 P 프레임을 참조한 움직임 예측을 통하여 부호화됨

B

Page 6: 05 Video

6

MPEG-1 화면 형태

B-picture

Interpolated PositionTrajectory

Previous frame (n-1)

Current frame (n)

Futere frame (n+1)

Bidirectional (B) frames = Previous frame - Futere frame + Bidirectinal motion vectors

MPEG-1 화면 형태

전형적인 MPEG의 비트 발생 형태발생 비트수 : I-picture >> P-picture >> B-picture

0

2x104

4x104

6x104

8x104

10x104

12x104

0 50 100 150 200화면 번호

300

화면당

발생

비트수 GOP

B-화면 P-화면

I-화면

Page 7: 05 Video

7

MPEG-1 화면 형태

비트율의 조정일반적으로 다음과 같은 상황에서 좋은 결과가 나옴

• I-picture와 P-picture의 화질을 비슷하게 유지

• B-picture의 화질을 상대적으로 낮게 유지

• 위와 같이 함으로써

– 전체적으로 느껴지는 화질을 일정수준이상 가능하고

– 비트율을 큰 폭으로 감축시킬수 있음

일반적으로

• 일반적인 자연 장면들의 경우

– P-picture 비트수는 B-picture 비트수의 2~5배정도

– I-picture 비트수는 P-picture 비트수의 3배정도

• 움직임이 적은 경우

– I-picture에 더 많은 비트수를 할당

• 움직임이 많은 경우

– I-picture의 비트수를 줄이고, 그만큼을 P-picture에 할당

MPEG-1 화면의 구성

GOP (Group of Pictures)비디오 시퀀스에의 임의 접근 및 독립적인 편집 기능

하나 이상의 픽쳐들의 집합으로 구성

• N : 한 GOP를 구성하는 픽쳐의 수

• M : 인접한 I-화면과 P-화면 사이의 프레임 수

GOP (N=9)

I B B P B B P B B I B B

M=3

P

Page 8: 05 Video

8

MPEG-1 화면 처리 순서

원래 화면 순서

1 2 3 4 5 6 7 8 9 10 11 12

I B B P B B P B B I B B

화면 전송 순서

1 4 2 3 7 5 6 10 8 9 13 11

I P B B P B B I B B P B

P B B

13 14 15

B P B

12 16 14

화면 처리 순서화면이 발생된 순서와 화면이 부호화되고 전송되는 순서는 달라짐

• B-picture의 갯수만큼씩 차이가 남 (지연 발생)• Encoder/Decoder 모두 이를 위한 프레임 버퍼가 필요함

MPEG-1 화면 손실의 효과 (1)

I B B P B B P B B I B B P B B P

loss or damage

B B I B

un-decodable

I B B P B B P

B B I B B P B B P B B

I B

I-picture의 손실

Page 9: 05 Video

9

MPEG-1 화면 손실의 효과 (2)

I B B P B B P B B I B B P B B P

loss or damage

I

B B P B B P B B

I B B P B B P

un-decodable

P-picture의 손실

MPEG-1 화면 손실의 효과 (3)

I B B P B B P B B I B B P B B P

loss or damage

I B

B

P B B P B B I B B P B B P

no effects to other pictures

B-picture의 손실

Page 10: 05 Video

10

MPEG-1 데이터 스트림 구조

MPEG-1 비디오 데이터 스트림 구조 (1)

Slice1 2 3 4 5 6

YCB CR

1 2

3 4

5 6

Macro-Block (4:2:0)

Slice

Block (8x8 pixels)

Picture

GOP

Video Sequence

A Slice

GOP

MPEG-1 데이터 스트림 구조

MPEG-1 비디오 데이터 스트림 구조 (2)비디오 시퀀스 (video sequence)

• 영상 및 부호화의 기본 정보

GOP (Group of Pictures)• 비디오 시퀀스에의 임의 접근 기능

Pictures (픽쳐)• TV또는 모니터에 display의 기본 단위이고 예측 기능

• I, P, B의 세가지 형태의 픽쳐가 존재

Slice (슬라이스)• 픽쳐내에서 하나이상의 연속된 매크로 블럭들로 구성.• 오류(error)를 처리하는데 주요한 역할을 함

– 한 슬라이스에서 비트 스트림에 오류 발생시, 디코더는 다음슬라이스로 skip

• 시간 재동기 기능을 갖음

Page 11: 05 Video

11

MPEG-1 데이터 스트림 구조

MPEG-1 비디오 데이터 스트림 구조 (3)Macro-Block (매크로 블록)

• 16x16 크기의 블록

• 움직임 예측 및 보상의 기본 단위가 됨

Block(블록)• 8x8 크기의 블록

• DCT의 기본 단위가 됨

MPEG-1 : Encoder

MPEG-1 부호화기MPEG-1 표준은 부호기(encoder)를 정의하지 않고복호기(decoder)만 정의한다.

• encoder는 MPEG-1 표준에서 규정된 비트열의 데이터 구조와 의미( syntax와 semantics)에 따라 복호화될 수 있는 적합한 비트열을생성하기만 하면 됨.

MPEG-1 부호화 방식의 세가지 기본 단계

• 대역폭 축소 단계

– 입력 신호원의 해상도를 목표 해상도에 맞추고, 색조의해상도를 주관적으로 만족할 만한 비율로 낮춤

• 손실 압축 단계

– 시간 중복성 제거 : 16x16크기 매크로블록 기반의 움직임 보상

– 공간 중복성 제거 : 8x8 블록 단위 DCT-기반의 압축

• 무손실 압축 단계

– VLC등을 사용하여 정보를 손실없이 비트열로 대응 시킴

Page 12: 05 Video

12

MPEG-1 : Encoder

MPEG-1 부호화기 구조의 예H.261과 유사한 구조

DCT

화면순서

재배열

화면모음(GOP)

+ 양자화

역양자화

VLC

다중화

버퍼

비트열

IDCT+

예측 메모리2

예측 메모리1

움직임 보상

예측움직임 추정

-+

버퍼 제어

MPEG-1 : Decoder

Decoder 모델

VLCDecoder

수신버퍼

비트열

역양자

화면 순서 재배열

출력 화면

예측메모리 및

예측기

IDCT +

부가 정보

움직임 벡터

Page 13: 05 Video

13

MPEG-1 과 H.261의 비교

비교 대상 H.261 MPEG-1

주요 응용 대상 통신 미디어 디지털 저장 미디어 부호화 비트율 Px64 kbps (p = 1~30) 약 1.5 Mbps 까지 복호 시작 시점 통신 개시 GOP 와 화면열 헤더 화면의 부호화 형태 기본적으로 한 종류(P) 세 종류 (I,P.B) 화면의 누락 있음 없음 예측 구조 순방향 예측 순방향/쌍방향 예측 화면내 구조 GOB 슬라이스 매크로블록 위치정보 MBA(macroblock address) MBA 확장(extension) 매크로블록 형태 MB 타입 화면 유형별 MB 타입 양자화 선택 단위 MQUANT MQUANT, 양자화 행렬 움직임 벡터의 단위 정수 화소 단위 반화소 단위 루프 필터 있음 없음 CBP (coded block pattern) 있음 있음 변환 계수 부호화 2 차원 VLC 2 차원 VLC 공간 부호화 DCT DCT

MPEG-2 개요

MPEG-2ISO/IEC 13818-1,2,3,4,5,6,7,9,10

Generic coding of moving pictures and associated audio information

Page 14: 05 Video

14

MPEG-2 개요

MPEG-2 관련 표준들ISO/IEC 13818-1 : SystemISO/IEC 13818-2 : VideoISO/IEC 13818-3 : AudioISO/IEC 13818-4 : Conformance Testing ISO/IEC 13818-5 : Software SimulationISO/IEC 13818-6 : Extension for DSM-CC (Digital Storage Media-

Command and Control)ISO/IEC 13818-7 : Advanced Audio Coding (AAC)ISO/IEC 13818-9 : Extension for Real Time Interface for Systems DecodersISO/IEC 13818-10 : Conformance Extensions for DSM-CC

MPEG-2 개요

Source Delivery

Demux

Video

Audio

ISO/IEC 13818-1’94.11

ISO/IEC 13818-3’94.11

ISO/IEC 13818-2’94.11

ISO/IEC 13818-6’96.7

Interaction

Page 15: 05 Video

15

MPEG-2 비디오 : 압축 개요

입출력 영상scanning mode

• interlaced 와 progressive를 모두 지원

• 디지털 위성방송, 디지털 TV방송, 케이블 TV, 고선명 그래픽, 의료장비, 극장등 다양한 응용분야 적용 가능

color sampling• 4:2:0, 4:2:2, 4:4:4 를 모두 지원함

영상의 크기 및 압축률

• profile/level에 따라 달라짐

• 3~5 Mbps : 일반 방송 (NTSC/PAL/SECAM) 수준

• 8~10 Mbps : CCIR 601 표준에 근접한 화질

– CCIR 601 - 방송 TV 신호의 디지털 표현을 규정

• 40Mbps이상 : HDTV 화질

MPEG-2 비디오 : Profile 과 Level

Profile 과 Level다양한 서비스를 제공하기 위한 부호화기 구현의 선택 범위

Profile• MPEG-2의 여러 기능들중에서 목적별로 필요한 부분만을 모은

집함으로서 알고리즘의 차이로써 나타남

• 영상 비트 스트림의 syntax의 차이, 즉, 기능상의 차이를 표현

Level• 특정 profile에서 관련되는 변수들에 대한 제한 조건을 표현

– 예: 입력영상의 크기, 초당 화면수, 초당 전송 비트량등

표기 예

• MP@ML (Mail Profile at Main Level)

Page 16: 05 Video

16

MPEG-2 비디오 : Profile 과 Level

Profile

– SP는 소프트웨어 디코더를 위함.– MP는 cable TV나 위성 방송등을 위하여 저가의 단일 칩으로

구현 가능한 MPEG 부호화기를 대상으로 함.– Spatial은 HDTV급의 부호화기

profile

features

Simple(SP)

Main(MP)

SpatialScaleable(Spatial)

SNRScaleable

(SNR)

High(HP)

지원 색도

형식

4:2:0 4:2:0 4:2:0 4:2:0 4:2:2 or4:2:0

픽쳐 형태 I, P I, P, B I, P, B I, P, B I, P, B확장성 no no yes yes yes확장 모드 none none SNR SNR or

SpatialSNR orSpatial

MPEG-2 비디오 : Profile 과 Level

확장성(scalability)MPEG-2를 다양한 응용에 적용할 수 있도록 하는 기능

선별적인 서비스 제공이 가능

5가지 scalability• Satial Scalability• Temporal Scalability• SNR (signal to noise ratio) Scalability• Data partitioning Scalability• Hybrid Scalability

Page 17: 05 Video

17

MPEG-2 비디오 : Profile 과 Level

Spatial Scalability• 낮은 해상도를 지원하는 base layer를 높은 해상도를 지원하는

enhanced layer간의 확장성

Temporal Scalability• 공간적으로 해상도는 같으나, 시간 해상도를 높여줌

– 예. base layer(odd field) ->base layer+enhanced layer (even)

base layer enhanced layer

base layer

enhanced layer

MPEG-2 비디오 : Profile 과 Level

SNR (signal to noise ratio) Scalability• 양자화 간격 크기에 따라 영상의 화질과 전송 대역폭이 달라짐

• 예. base layer(큰 양자화 간격) -> enhanced layer(차이신호에 대하여조밀한 양자화기로 부호화)

Data partitioning Scalability• 비디오 비트 스트림을 두개 이상의 계층으로 나눔

• 예. base layer (DCT 저주파 성분) -> enhanced layer (DCT 고주파성분)

Hybrid Scalability• 서로 다른 두가지 형태의 scalability의 조합으로 구성

Page 18: 05 Video

18

MPEG-2 비디오 : Profile 과 Level

LevelLevel

기본적으로, SP@ML 부터 HP@HL 방향으로 forward compatibility가성립된다.모든 Profile/Level의 디코더는 MPEG-1 비디오 데이터를 디코딩 할수 있다.

features Level

전송속도 (Mbits/sec)

화면크기 프레임/초 Application

Low Level (LL)

4 352x240 30 VHS equipment

Main Level (ML)

15 / 20(HP) 720x480 30 Broadcast quality

High-1440 (H14)

60 / 80(HP) 1440x1152 60 HDTV

High Level (HL)

80 / 100(HP) 1920x1080 60 Film production

MPEG-2 비디오 : Profile 과 Level

MP@ML의 주요 특징DVD, DTV-DBS 방송에 적용

항목 내용 해상도 720x480 (59.94 field/sec), 720x576 (50 field/sec)

스캐닝 방식 interlaced, progressive 컬러 샘플링 4:2:0

비트율 up to 15 Mbps 버퍼크기 1.75 Mbits 예측모드 adaptive field/frame, dual prime only for successive P-pictures 호환성 MPEG-1 forward compatibility DCT only 8x8 2D DCT

움직임 추정블록 크기 16x16 (frame mode), 16x8 (field) DCT 계수 스캐닝 zigzag scanning, alternative scanning 입력데이터 표시 8 bits/pixel

scalability 수용하지 않음

Page 19: 05 Video

19

MPEG-2 비디오 : 부호화 주요 특징들

MPEG-2 부호화 구조기본 구조는 MPEG-1과 동일

다양한 응용과 기능 지원을 위하여 세부적으로 MPEG-2 에서확장된 기능을 갖음

입력 영상의 형태MPEG-2에서는 영상을

화면(picture)라는

단위로 표현

픽쳐는 프레임(frame)화면과 필드(field) 화면의 두 종류가 있음

1/30초

1/60 초

홀수필드 짝수필드홀수필드짝수필드

필드구조

프레임구조

시간

Interlacedscanning

Progressivescanning

MPEG-2 비디오 : 부호화 주요 특징들

움직임 예측 및 보상 방법interaced 방식 지원에 의한 네가지 예측 방법이 적용됨

16x8 필드 예측

예측 화면 프레임 구조 필드 구조

필드 예측 MV 2 개 MV 1 개

16×8 필드 예측 − MV 2 개

프레임 예측 MV 1 개 −듀얼 프라임 예측 MV 1 개와 DMV 1 개 MV 1 개와 DMV 1 개

필드 화면에서의16x16매크로 블록

16x8 블록에 대하여각각 움직임 보상

Motion Vector

Motion Vector

Page 20: 05 Video

20

MPEG-2 비디오 : 부호화 주요 특징들

DCT 변환과 Alternate Scan

(a) 프레임 DCT 변환 블록

(b) 필드 DCT 변환 블록

X

Y

alternate scan

MPEG 압축 성능 비교

Picture Quality

Bit rates (Mbps)

10 20 30 405 0 0

5

10

I

IP

IBP

MPEG-2 4:2:2@ML

MPEG-2 MP@ML

MPEG-1

주: 위의 성능 관계는 일반적인 경우에 대한 것이며, profile, GOP등에 따라 달라 질 수 있음

Page 21: 05 Video

21

MPEG-2 비디오 : MPEG-1과의 비교

MPEG-1과 MPEG-2의 비교

MPEG-1 MPEG-2

응용 대상 디지털 저장매체 디지털저장매체, 디저털 TV 방송, 디지털 통신등 다양

입력 영상의 형태 SIF(360x240) 4:2:0

ITU-R 601 (720x480), 최대 1920x1152 4:2:0, 4:2:2, 4:4:4

스캐닝 방식 Progressive Progressive, Interaced

부호화 비트율 약 1.5Mbps 까지 약 100Mbps 까지

확장성 (scalability) 해당사항 없음 공간적 확장성, 시간적 확장성, SNR 확장성

호환성 (compatibility) 해당사항 없음 순방향, 역방향, 상향, 하향 호환성 지원

DCT 방법 non-interlaced scan 을 위한 DCT 프레임 DCT / 필드 DCT

움직임 추정 방법 non-interlaced scan 을 위한 움직임 추정

프레임 예측, 필드 예측, 16×8 필드 예측, 듀얼 프라임 예측

움직임 벡터 P, B-화면에 대해 움직임 벡터 할당

P, B-화면 뿐만 아니라 I-화면에 대해 오류 은닉을 위한 움직임 벡터 할당

DCT 계수 주사 방법 zig-zag scan 방식 zig-zag scan 방식 / 필드 구조를 위한

alternate scanning 방식 지원

MPEG-2 시스템 : DTV 표준

디지털 TV 표준주도 기관 : ATSC (미국), DVB (유럽)비디오 : MPEG-2 (SD급과 HD급으로 분류됨)

• SD : MPEG-2 MP@ML (720x576, 30fps, 4/6 Mbps)• HD : MPEG-2 MP@HL (1920x1080, 60fps)

오디오 : 돌비 AC3 (미국), MPEG-1/2 (유럽)전송 : MPEG-2 TS (Transport Stream)변조방식

• 위성 : QPSK• 케이블 : QAM• 지상파 : 8VSB (미국), COFDM (유럽), BST-OFDM (일본)

Page 22: 05 Video

22

MPEG-2 시스템 : 개요

ISO/IEC IS 13818 Part1 - MPEG-2 Systems디지털 오디오와 비디오 데이터를 동기화하여 다중화하기 위한비트 스트림에 대한 syntax와 semantics를 정의

• 다중화 되는 오디오와 비디오는 MPEG 압축에 대한 제약이 없음

디지털 TV 방송에서의 전송 표준 규격으로 사용됨

다중화되는 신호들간의 동기화를 이룸

• 비디오

• 오디오

• 기타 개별 용도의 데이터

• 시간 동기화 정보

• 서비스와 제어 정보

MPEG-2 시스템 : 다중화 과정

MPEG-2 시스템 다중화 과정

Video Encoder

Multiplexer TS or PS

Digital Video

Digital Audio Audio

Encoder

PES Packetizer

PES Packetizer

Scope Of MPEG-2 System

ES (Elementary

Stream)

PES (Packetized

Elementary Stream)

TS (Transport Stream)PS (Program Stream)

Private DataTime Sync. InformationService and Control Information

Page 23: 05 Video

23

MPEG-2 시스템 : 계층 구조

MPEG-2 시스템 계층 구조ES (Elementary Stream)

• 비디오 또는 오디오 부호기로 부터의 개별 출력

PES (Packetized Elementary Stream)• 비디오 : 한 화면에 대한 압축 비트열에 헤더를 붙여 하나의 PES 패킷

구성

• 오디오: 한 압축 프레임 단위 (MPEG-1 Layer II의 경우 1152 샘플에해당)에 헤더를 붙여 하나의 PES 패킷 구성

비디오1

비디오2

비디오N

오디오1

오디오2

오디오N

ESPES

Header

ESPES Header

MPEG-2 시스템 : 계층 구조

MPEG-2 시스템 계층 구조 (cont’d)PS (Program Stream)

• 한 개의 TV 프로그램에 관련된

– 오디오와 비디오 등의 PES 패킷을 다중화 하고

– 이 프로그램에 관련된 오디오와 비디오등의 PES 패킷들을다중화함

• 전달과정이 단순한 디지털 저장 매체 응용을 전제로 한 MPEG-1 다중화시스템임

TS (Transport Stream)• PES 패킷을 세분화하여 188 바이트의 길이가 되도록 만들어진 패킷

• 4 바이트의 헤더 + 184 바이트의 적응필드와 유료부하 로 구성됨

• 오류가 심한 채널을 통하여 전달하는 것을 목적으로 함

– 오류 복원, 타이밍과 기타 부가 정보를 포함

Page 24: 05 Video

24

MPEG-2 시스템 : 계층 구조

압축계층

PES 패킷계층

PS팩(Pack)

계층

TS패킷계층

시스템계층

TSPS

MPEG-2 시스템 계층 구조

MPEG-2 시스템 :Transport Stream

I-Picture

PES Header

variable

P-Picture

variable variableElementary StreamAccess Unit: Pictures

Packettized Elementary StreamPES Packets

Data from I-Picture PES Header Data from P-Picture

variable variable

Transport StreamTS Packets

TSHeader

Data from PES Packet

fixed

TSHeader

Data from PES Packet

fixed

TSHeader

Data from PES Packet

fixed

TS 패킷 생성 과정

Page 25: 05 Video

25

MPEG-2 시스템 : Transport Stream

MPEG-2 Transprt Packet MPEG-2 Transprt Packet

AAL5 CPCS-PDU Payload CPCS-Trailer

188 bytes 188 bytes

376 bytes 8 bytes

Mapping of MPEG-2 TS to AAL5

MPEG-2 시스템 : Transport Stream

비디오

입력

오디오

입력

비디오

부호기

오디오

부호기

PES패킷화기

PES패킷화기

PES역 패킷화기

PES역 패킷화기

비디오

복호기

오디오

복호기

비디오

출력

오디오

출력

PS,TS

다중화

PS,TS

역다중화PTS, DTS

PTS SCR,PCR

STCSTC

SCR,PCR

PTS

PTS, DTS

송신부 수신부

일정 지연 (constant delay)

전송 채널

STC: System Time Clock PTS: Presentation Time StampSCR: System Clock Reference DTS: Decoding Time StampPCR: Program Clock Reference

타이밍 모델

Page 26: 05 Video

26

MPEG-4

MPEG-4ISO/IEC 14496

Information Technology - Coding of Audio-Visual Objects

MPEG-4 개요

MPEG-4 표준화 배경이전의 통신용 부호화 기법과 고화질 부호화 기법

• 비디오 카메라를 사용하여 얻어진 자연 영상 (natural image)의 압축 및재생을 목적으로 함

새로운 영상 형태의 등장

• 컴퓨터 그래픽에 의한 인공 영상 (artificial image)• 다양한 화면으로 만들어진 합성 영상 (synthetic image)• 새로운 형태의 부호화 기법이 필요

MPEG-4• 새로운 영상 형태에 대한 응용들을 목적으로 함

– 1993 - 표준화 시동

– 1999 - MPEG-4 Visual Part 표준

– 2001 - MPEG-4 Edition 2 표준

– 2003 - H.264/MPEG-4 Part 10 (Advanced Video Coding) 표준

Page 27: 05 Video

27

MPEG-4 개요

MPEG-4 관련 표준들ISO/IEC 14496-1 : SystemISO/IEC 14496-2 : VisualISO/IEC 14496-3 : AudioISO/IEC 14496-4 : Conformance TestingISO/IEC 14496-5 : Reference SoftwareISO/IEC 14496-6 : Delivery Multimedia Integration

Framework (DMIF)ISO/IEC 14496-7 : Optimized Reference SoftwareISO/IEC 14496-8 : Carriage of MPEG-4 Content

Across IP NetworksISO/IEC 14496-9 : Reference Hardware Description

MPEG-4 개요

Overview of the Parts of the MPEG-4 standard

Ref: K. Diepold, S. Moeritz, Understanding MPEG-4, Elsvier, 2005

Page 28: 05 Video

28

MPEG-4 Visual Objects

MPEG-1/2 비디오와의 비교MPEG-1/2 비디오

• 프레임 기반의 부호화 기술

– 사각형의 비디오 프레임이 압축의 기본 단위로 사용됨

• 압축을 최대로 하는 것이 기본 고려 사항

MPEG-4 비디오

• 객체(object) 기반의 부호화 기술

– 객체는 자연적(natural)이거나 인공적(synthetic)일수 있음

• 객체단위의 압축율의 향상 뿐만이 아니라, 디지털 비디오의합성(composition), 조작(manipulation), 인덱싱 (indexing), 검색(retireval)등이 가능함

MPEG-4 Visual Objects

Object-based Representation Architecture (1/2)Production stage

서울-대체로맑음

Mul

tiple

xing

& S

ynch

roni

zatio

n

Compos. Encoder

Object 1 Encoder

Object 2 Encoder

Object N Encoder

Scene Definition

Precoded Objects

Page 29: 05 Video

29

MPEG-4 Visual Objects

Object-based Representation Architecture (2/2)Consumption stage

내일의 날씨

서울-대체로맑음

com

posi

tor

Object M Decoder

Compos. Decoder

Object 1 Decoder

Object 2 Decoder

Object N Decoder

Dem

ultip

lexi

ng

Precoded Objects

Noncoded Objects

MPEG-4 Visual Objects

객체기반 움직임 예측 (1/3)비디오 시퀀스

Page 30: 05 Video

30

MPEG-4 Visual Objects

객체기반 움직임 예측 (2/3)MPEG-1/2의 경우

MPEG-4 Visual Objects

객체기반 움직임 예측 (3/3)MPEG-4의 객체기반 움직임 예측

Page 31: 05 Video

31

MPEG-4 Visual Objects

Four Types of Objects

Ref: J. Watkinson, The MPEG Handbook : MPEG-1, MPEG-2, MPEG-4, 2nd ed., Elsevier, 2004, pp.287

MPEG-4 Natural Video Coding

MPEG-4 비디오 비트스트림의 계층 구조 (1/3)

Visual Object Sequence (VS)

Visual Object (VO)

Video Object Layer (VOL)

Group Of VOPs (GOV)

Video Object Plane (VOP) VOP1 VOPK VOPK+1 VOP1 VOP2

GOV1 GOV2

VOL1 VOL2

VO1 VO2

VS1 VS2

Page 32: 05 Video

32

MPEG-4 Natural Video Coding

MPEG-4 비디오 비트스트림의 계층 구조 (2/3)Visual Object Sequence (VS)

• 2D 또는 3D의 natural 또는 synthetic object를 포함하는 완전한 MPEG-4 visual scene를 포함

Visual Object (VO)• scene 내의 특정 객체로서

• 객체 또는 scene의 배경에 해당하는 arbitrary (nonrectangular) shape일수 있음

Video Object Layer (VOL)• (multilayered) scalable coding 을 지원하기 위한 방법을 제공

• 공간적 해상도나 이미지 품질과 관련됨

Group of Video Object Planes (GOV)• 연속된 VOP들의 집합 (optional level)• GOV는 임의 접근, 재동기화에 사용되는 헤더 정보를 포함

MPEG-4 Natural Video Coding

MPEG-4 비디오 비트스트림의 계층 구조 (3/3)Video Object Plane (VOP)

• 임의의 모양(arbitrary shape)을 갖는 이미지

• VO(visual object)의 모양, 배경, 움직임 파라메터를 반영하는, 특정순간에서의 VO의 모습

time

Visual

Object

(VO) o

f typ

e

video

VOP (YUV) VOP (shape)

Page 33: 05 Video

33

MPEG-4 Natural Video Coding

Video Object Plane (VOP)• Features of MPEG-4 Video Coding

* VLBV (Very Low Bitrate Video)

MPEG-4 Natural Video Coding

Visual Object Example (1/2)Video Scene consisting of three VOs

Page 34: 05 Video

34

MPEG-4 Natural Video Coding

Visual Object Example (2/2)Video Scene composed of VOs from separate sources

MPEG-4 Natural Video Coding

Video Object Plane (VOP)VOP Encoder Structure

Page 35: 05 Video

35

MPEG-4 Natural Video Coding

MPEG-4 Natural Video Coding (1/2)Coding of Rectangular Video ObjectsCoding of Arbitrarily Shaped Video Objects

• Binary Shape Coding• Gray-Level Shape Coding• Coding of Boundary Macroblocks

Scalable Video Coding• Spatial and Temporal Scalability• SNR Fine Granularity Scalability

Special Video Coding Tools• Interlaced Coding• Error-Resilient Coding• Reduced Resolution Coding, Sprite Coding

MPEG-4 Natural Video Coding

MPEG-4 Natural Video Coding (2/2)Visual Texture Coding (VTC)

• VTC tools• Wavelet Coding• Shape-Adaptive Wavelet Coding• Spatial and Quality Scalability• Bitstream Packetization• Tiling

Page 36: 05 Video

36

MPEG-4 Visual SNHC Coding

SNHC (Synthetic and Natural Hybrid Coding)자연 영상 정보와 컴퓨터 그래픽의 합성 정보를 포함한 다양한종류의 멀티미디어 정보를 효율적으로 표현하고 조작하기 위함

• 자연적인 영상 정보에 움직이는 2차원 또는 3차원 컴퓨터 그래픽과인위적으로 만든 영상이나 소리를 융합하는데 그 목적을 두고 있음

인공적으로 소리를 만드는 방법도 제공함. 응용 분야

• 인공의 모델과 동기가 맞추어져 가상 현실을 적용한 비디오 영상 회의, 네트워크 대화 게임, 원격 교육 등에 이용될 수 있음

MPEG-4 Visual SNHC Coding

MPEG-4 SNHC Tools (1/3)2D Mesh Coding

• 그물 객체 (mesh object)– 삼각형 조각들로 분할된 구조

– 시간이 변함에 따라 움직이는 하나의 객체를 표현하는데 적합

• 컴퓨터 그래픽 분야에서 3차원 물체를 표현하기 위하여 널리사용됨

움직임 이전 움직임 이후

Page 37: 05 Video

37

MPEG-4 Visual SNHC Coding

MPEG-4 SNHC Tools (2/3)3D Mesh Coding

• 얼굴 객체 (FO, face object), 신체 객체 (BO, body object)– 인간의 얼굴과 신체를 표현하기 위하여 사용됨

– 아주 낮은 비트율에서 다양한 형태와 표정을 갖는 얼굴 또는신체를 묘사하는 것이 가능

MPEG-4 Visual SNHC Coding

MPEG-4 SNHC Tools (3/3)View-Dependent Scalability

Page 38: 05 Video

38

MPEG-4 System

MPEG-4 System기존의 MPEG-1/2 System

• 오디오와 비디오 정보를 다중화하고 동기화하는 것에 초점을 맞춘시스템 디코더 모델

MPEG-4 시스템

• 오디오, 비디오 컴퓨터그래픽스, 아바타등의 멀티미디어 객체의 가상시공간상의 배치

• 사용자 상호작용의 지원

• 저작권 보호기술과 메타데이터 기술을 통합한 일반적인 멀티미디어컨텐츠의 부호 표준

• BIFS (Binary Formatted Scene Description)– MPEG-4 시스템 분야의 표준

BIFS 응용

양방향 데이터 서비스 (T-DMB)

Page 39: 05 Video

39

BIFS 응용

Hot Spot Service (T-DMB)

MPEG-4 System

DMIFDSM-CC (Digital Storage Media-Command and Control)

• MPEG-2에서의 전송규약

• 혼합망 환경에서 VoD (Video on Demand)와 같은 특정 응용을 목표로함

DMIF (Delivery Multimedia Integration Framework)• MPEG-4의 전송규약

• 방송, 네트워크, 저장 매체등 서로 다른 전송 방식을 통하여 전송되는멀티미디어 스트림들을 응용 프로그램에서 통합하여 사용하는 것을지원하는 보다 일반적인 전송규약

• FlexMux– 미디어 스트림들의 효율적인 멀티플렉싱 기능을 지원

• TransMux– 미디어 스트림의 QoS를 지원

Page 40: 05 Video

40

MPEG-4 System

MPEG-4 System과 DMIF간의 관계

MPEG-4 오디오 MPEG-4 비디오 기타 데이터

MPEG-4 시스템

DMIF

H.223

통신 방송 인터넷 저장미디어

MPEG-2 TS MPEG-2 PSRTP

media-related part

network-related part

MPEG-4 System

MPEG-4 Standard Structure

Delivery Aware, media unaware :14496-6 DMIF14496-1 FlexMux

Media Aware, delivery unaware :14496-2/3 Audio and Visual14496-1 Scene Description and Object Descriptor Protocol

Media and Delivery unaware :14496-1 Systems, adaptation of the MPEG-2 traditional activities

DMIF (Delivery Multimedia Integration Framwork)ESI (Elementary Stream Interface)DAI (DMIF-Application Interface)

DAI

ESI

Delivery Layer

FlexMux Tool

Sync. Layer

Composition

FlexMux FlexMux

Various Transport Protocols (MPEG-2, UDP/IP, ATM, PSTN, DAB, etc)

ODs Scene

CL CL CL

SL SL SL SL SL SL

ES ES ES ES ES ES

DNITransMux Tool

Page 41: 05 Video

41

MPEG-4 System

데이터 전송 (예)

IPheader

UDPheader

RTPheader

FlexMuxheader

SLheader

MPEG4data

UDPheader

RTPheader

FlexMuxheader

SLheader

MPEG4data

RTPheader

FlexMuxheader

SLheader

MPEG4data

FlexMuxheader

SLheader

MPEG4data

SLheader

MPEG4data

MPEG4data

Transport layer

Network layer

Transport layer

FlexMux layer

MPEG-4 compression layer

MPEG-4 sync layerelementary stream

FlexMux stream

SL packet stream

TransMux stream

MPE

G-4

Del

iver

yla

yer

20 8 16 3 3

DMIF

MPEG-4 스트리밍 아키텍쳐

Page 42: 05 Video

42

H.264/MPEG-4 Part 10/H.264

MPEG-4ISO/IEC 14496-10

Advanced Video Coding

MPEG-4 Part10/H.264

H.264ISO/IEC와 ITU-T의 공동 표준

• ISO/IEC MPEG의 JVT(Joint Video Team)– ISO/IEC MPEG-4 Part 10

• ITU-T VCEG (Video COding Experts Group)– ITU-T H.264

초기에 H.26L로 이름이 붙여져 연구가 시작되어 2003년에 완성됨

성능 향상 정도

• MPEG-2에 비하여 50%• H.263+와 MPEG-4의 advanced simple profile에 비하여 30%

MPEG-2보다 월등한 압축 성능으로 HDTV 비디오 컨텐츠를전달하기 위한 강력한 후보로서 여겨지고 있음

Page 43: 05 Video

43

MPEG-4 Part10/H.264

History

MPEG-4 Part10/H.264

H.264 ProfilesCore 기능들

• VLC-based Entory Decoding• Motion Compensation (P-Prediction)• Intra Prediction (I-Prediction)• 4x4 단위의 DCT와 Nonlinear Quantization• In-Loop Deblocking Filters에 의한 주관적 화질의 개선

Baseline Profile 기능들

• 화상회의와 같은 실시간 대화형 응용을 위한 기능들

– Arbitrary Slice Order– Flexible Macroblock Order– Redundant Slices

Page 44: 05 Video

44

MPEG-4 Part10/H.264

H.264 Profiles (계속)Main Profile 기능들

• 방송, 저장매체와 같은 지연에 문제가 없는 응용들을 위하여 최대의압축 효율을 목적으로 함

– B Slices– Context Adaptive Binary Arithmetic Coding– Weighted Prediction

Extended Profile 기능들

• 비디오 스트리밍 응용들을 위하여 설계됨

• 지연을 허용하며, 비트스트림 스위칭 기능, 오류 강인성을 제공함

– B Slices– Weighted Prediction– Slice Data Partitioning– SP and SI Slice Types

MPEG-4 Part10/H.264

H.264 Profiles (계속)

Ref: J. Watkinson, The MPEG Handbook : MPEG-1, MPEG-2, MPEG-4, 2nd ed., Elsevier, 2004

Page 45: 05 Video

45

MPEG-4 Part10/H.264

Performances

Ref: W. Cliff, A Practical Guide to Video and Audio Compression: From Sprockets and Rasters to Macroblocks, Elsevier, 2005 (pp.239)

MPEG-4 Part10/H.264

Comparisons with MPEG-2MPEG-2

Ref: W. Cliff, A Practical Guide to Video and Audio Compression: From Sprockets and Rasters to Macroblocks, Elsevier, 2005 (pp.245)

Page 46: 05 Video

46

MPEG-4 Part10/H.264

Comparisons with MPEG-2H.264

Ref: W. Cliff, A Practical Guide to Video and Audio Compression: From Sprockets and Rasters to Macroblocks, Elsevier, 2005 (pp.246)

MPEG-4 Part10/H.264

Comparisons with MPEG-4 Visual

MPEG-4 Visual H.264

Supported data types

Rectangular Video Frames and Fields

Arbitrary-shpaed Video Objects Still Textures and Sprites Synthetic or Synthetic-Natural Hybrid Video Objects

2D and 3D mesh objects

Rectangular Video Frames and Fields

Number of Profiles 19 3

Compression Efficiency Medium High

Minimum MB size 8x8 4x4

MV accuracy Half or quarter-pixel Quarter-pixel

Transform 8x8 DCT 4x4 DCT approximation

License Payment Yes for commercial implementation

Probably not (for baseline profile) Probably (main and extended profiles)

Page 47: 05 Video

47

MPEG-4 Part10/H.264

MPEG-2

MPEG-4 Simple Profile

H.264 Baseline Profile

MPEG-4 정리

기존 방식과의 비교

기존 방식들 MPEG-4

컨텐츠 생성 (Production)

대부분 2D 컨텐츠 카메라 또는 마이크를 사용한 자연

영상 및 음성 컨텐츠 생성 단계에서 객체들의 혼합

(mixing)이 이루어짐

2D 와 3D 컨텐츠 자연적인 오디오와 비디오와 컴퓨터에 의하여 생

성된 오디오와 비디오가 결합된 컨텐츠 전통적인 사각형 형태와 특정부분만을 갖는 다양

한 형태의 비디오 컨텐츠 분리된 객체들의 임의적 결합을 제공하는 부호화 방식

전달 (Delivery)

제한된 네트워크 (satellite, LAN, ISDN)을 통한 멀티미디어 정보 전

달 가능 네트워크마다 고유의 컨텐츠 표현 방식을 갖음 동종(homogeneous) 네트워크를 통

한 통신 및 전달

모든 네트워크 환경에서의 멀티미디어 정보의 전

달 네트워크에 독립적인 공통적인 컨텐츠 표현 방식

의 제공 여러 종류의 이종(heterogeneous) 네트워크를 통

한 통신과 전달 방식을 제공

소비 (Consumption)

대부분 수동적인 컨텐츠 사전에 제작되어 변경 불가능한 컨

텐츠

소비 단계에서 객체들의 임의 결합에 의한 정보 표현 가능 정보는 상호적(interactive)이고 개인화된

(personalized) 용도로 읽혀지고, 보여지고, 들려질

수 있음

Page 48: 05 Video

48

MPEG-4 정리

Source Delivery

Demux

Video

Audio

ISO/IEC 13818-1’94.11

ISO/IEC 13818-3’94.11

ISO/IEC 13818-2’94.11

ISO/IEC 13818-6’96.7

Interaction

MPEG-1/2 참조 모델

MPEG-4 정리

Source

Delivery

Demux

Video

Animaiton

Interaction

MPEG-4 참조 모델

Audio

BIFS

Text

Com

position

Presentation

Page 49: 05 Video

49

Q&A