13
1 Multimedia Communications Chapter 1 Multimedia Elements 아주대학교 정보및컴퓨터공학부 노병희 ([email protected]) 목차 멀티미디어 정보 요소들 멀티미디어 정보의 표현 디지털화의 필요성 오디오 정보의 디지털화 영상정 보의 디지털화 압축의 필요성

01 Mm

Embed Size (px)

Citation preview

Page 1: 01 Mm

1

Multimedia Communications

Chapter 1Multimedia Elements

아주대학교 정보및컴퓨터공학부

노병희 ([email protected])

목차

멀티미디어 정보 요소들

멀티미디어 정보의 표현디지털화의 필요성

오디오 정보의 디지털화

영상정 보의 디지털화

압축의 필요성

Page 2: 01 Mm

2

1.1 멀티미디어 정보요소들멀티미디어 정보 요소

Voice/Speech 와 Audio 정보의 특징

Image의 특징

Video의 특징

멀티미디어 정보 요소들

멀티미디어 정보 요소들TextData (including Graphics)Voice (with mono-channel)Audio (with multiple-channels)Image (still image)Video (moving pictures)

Page 3: 01 Mm

3

Voice/Speech 와 Audio 의 특징

Voice/Speech 와 Audio

Telephone Speech Music (“CD Quality”)

0 Hz 4kHz 7kHz 20kHz

* 유럽의 경우로서, 미국이나 일본의 경우는 200 – 3200Hz 범위임

768kb/s1648kHz10 ~ 20000HzWideband audio

224kb/s1416kHz50 ~ 7000HzWideband speech

64kb/s88kHz300 ~ 3400Hz*Telephone speech

비트율샘플당 비트수샘플링비율주파수범위구분

Voice/Speech 와 Audio 의 특징

음성 신호의 주파수 범위음성 신호 부호화 방법이 적용되는 범위

• 협대역 : 200 Hz ~ 3.4 kHz• 광대역 : 50Hz ~ 7kHz

기본 음성 신호 부호화 방법

• 파형(waveform) 기반의 방법 (PCM, ADPCM, …)• 분석-합성(analysis-synthesis) 기반의 방법 (LPC, CELP, …)

오디오 신호의 주파수 범위사람의 가청 주파수 범위

• 10 Hz ~ 20 kHz

오디오 압축 방법은 사람의 가청 주파수 범위에 걸치는 모든오디오 성분을 대상으로 함

Page 4: 01 Mm

4

Voice/Speech 와 Audio 의 특징

사람의 청각 특성사람이 청각 능력은 주파수영역에서 고르지 않고, 특정 주파수부근에 집중되는 형태를 보여줌

• 아래 그림은 사람이 모든 주파수의 신호를 동일한 크기로 들을수있도록 하는데 있어서, 주파수에 따라 요구되는 신호의 세기를 보여줌

– 낮은 주파수와 높은 주파수 부분에서는 중간 주파수 보다 더 큰세기의 음성/오디오 신호를 만들어 주어야 함

• 앞으로 배우게 될 sub-band coding (SBC)의 배경이 되는 성질임

영상 정보의 특징

Pixel (화소)picture element 또는 picture cell의 약어 표현

디지털 이미지의 기본 단위로서, 소프트웨어 또는 하드웨어의제어하에서 변경될 수 있는 가장 작은 화면 출력 요소

이미지의 해상도(resolution) 단위는 pixel임

example) 640 x 480 format

가로로 640개의pixel과 세로로480개의 pixel이하나의 이미지또는 스크린화면을 구성됨

Page 5: 01 Mm

5

비디오 정보의 특징

Video (or Moving Pictures)Sequence of still images

• NTSC TV : 30 frames / sec• PAL TV : 25 frames / sec

짧은 프레임간의 간격으로 인하여, 인접한 프레임들간에는 큰상관성(correlation)이 존재함

time

1/30 sec.

1.2 멀티미디어 정보의 표현디지털화의 필요성

Voice/Speech 와 Audio 정보의 디지털 화

Image/Vidoe 정보의 디지털 화

Page 6: 01 Mm

6

멀티미디어 정보의 표현

디지털화의 필요성오디오와 비디오의 근본 source들은 아날로그 형태임

모든 멀티미디어 요소들은 컴퓨터내에서 저장되고 처리되기위하여 디지털화 되어야 함

voice의 정보형태

부분 확장한 모습

오디오 정보의 디지털화

두가지 기본 과정samplingquantization

analog signal- continuous-time- continuous-amplitude

sampled signal- discrete-time- continuous-amplitude

digitized signal- discrete-time- discrete-amplitude

Sampling Quantization

Page 7: 01 Mm

7

오디오 정보의 디지털화

Example (PCM)

영상 정보의 디지털화

Color Space영상 각 pixel의 색을 다른 요소들로 분리하기 위하여 표현하는이론적인 모델임

디지털 비디오에서의 두가지 color space• RGB : 컴퓨터 환경에서 주로 쓰임

• YUV 또는 YCrCb : TV 관련 분야에서 주로 사용

Page 8: 01 Mm

8

RGB Color Space

RGB color space색을 red(R), green (G), blue(B)의 세개 요소의 조합으로 표현

사람의 눈이 인식하는 모든 색을 표현하기 위하여는 RGB 요소는각각 8 bit 이상 되어야 함

• R, G, B 각 8 bits 씩 총 24 bits가 필요

• 224 = 16,777,216개의 서로 다른 색 표현 가능

G

B RG

B R

G

B R

G

Dot Row #1

dot pitchGBR Electronguns

60o

BR

Dot Row #2Dot Row #3

ShadowMask

Monitor Screen

example) CRT 모니터의 색 표현 방법

각 pixel마다 R, G, B의 세가지요소가 표현되고, 사람은 픽셀마다이 세가지 색이합쳐서 나타나는한 가지의 색으로인식하게 됨.

RGB Color Space

RGB color space단점

• 모든 가능한 색을 표현하기 위하여 RGB 각 요소는 같은 비트수를갖추어야 함.

• TV 환경에서는 부적절

– RGB에서는 밝기를 조절하기 위하여는 RGB 모든 요소의 값을동일하게 조절하여야 함

– 최상의 압축을 위하여는 각 색의 요소들이 uncorrelate되어야 함

Page 9: 01 Mm

9

사람 눈(eye)의 시각 특성

눈의 구조보는 (seeing) 동안 눈이 수행하는 두가지 역할

• to recognize details of a scene– the spatial resolution of the scene

• to recognize changes in a scene– a temporal resolution of a scene

사람 눈(eye)의 시각 특성

Photoreceptor의 두가지 형태rod (간상체)

• 흑백을 구분하고, 빛의 강도 (intensity of light)에 민감

cone (원추체)• 색 (color)을 구분함

• red, green, blue등의 색에 민감한 여러 종류의 cone들이 있음

retina (망막)에는 약 120x106개의 rod들과 8x106개의 cone들이있음

• 사람의 눈은 색(color)에는 덜 민감하고, 특히 색의 변화에는 더욱 덜민감하다.

MPEG-2등의 비디오 압축 기법

• 눈의 색에 대한 둔감 정도를 반영하여 이미지당 색에 대한 정보를줄임

• DCT를 사용하여 색의 high frequency change를 줄임

Page 10: 01 Mm

10

YUV color space

YUV color space색을 intensity (Y)와 두개의 색과 관련된 요소들 (U와 V)로 분리함

• Y: 흑/백과 관련된 정보를 표현하고 luminance라고 불림

• U와 V: 색과 관련된 정보를 표현, chrominance라고 불림

intensity와 color의 두 요소를 갖는 사람 눈의 처리 구조를 따름

YCrCb는 ITU-R 601 권고안 (CCIR-601)을 통하여 제정된 디지털비디오 형식의 색 표현에 대한 표준임.

• exmple) NTSC TV에서 RGB를 YUV로 변환하는 방법

– Y = 0.299R + 0.587G + 0.144B– Cb= 0.599R - 0.276G - 0.324B– Cr = 0.212R - 0.528G + 0.311B

Y와 (Cb, Cr) 신호는 uncorrelated 되어 있음.

YUV color space

YUV color spacesampling

• 사람의 시각 특성

– 밝기(luminance)의 변화에는 매우 민감하고,– 색(chrominance)과 색의 변화에는 더욱 덜 민감함.

• YUV를 표현시 픽셀당 Y는 그대로 유지하고, UV는 줄임으로서

– 사람의 시각 특성의 효과는 유지하면서

– 영상을 표현하는 정보량을 줄일수 있음

대표적인 sampling 방법

• 4개의 픽셀에 대하여 표현되는 Y, U, V의 비율로 나타냄

• 4:4:4• 4:2:2• 4:2:0

Y Cb Cr

4:4:4 4:2:2 4:2:0

Page 11: 01 Mm

11

Digital Video Formats

Digital Video FormatsCIF (Common Interchange Format)

• NTSC 또는 PAL 기반의 frame들을 공통된 형식으로 변환하여 화상회의등에 적용하기 위한 H.261 권고안에서의 디지털 비디오 형식

– luminance (Y) 해상도 : 352 x 288– color sampling format : 4:2:0

QCIF (Quarter CIF) : CIF의 1/4 크기 (176x144 pixels)SIF (Source Input Format)

• MPEG-1 영상 압축을 위한 디지털 비디오 형식

– luminance (Y) 해상도

• 360 x 240 pixels (for 30 frameses per sec. system: NTSC)• 360 x 288 pixels (for 25 frames per sec. system: PAL..)

– color sampling format : 4:2:0

1.3 압축의 필요성

Page 12: 01 Mm

12

압축의 필요성

압축안된 멀티미디어 정보의 데이터량비디오

음성/오디오

Format Pixelsper Line

Lines perFrame

Framesper second

Bits perPixel

Megabitsper Second

SVGA 800 600 72 8 276.5NTSC 640 480 30 24 221.2PAL 580 575 25 24 400.2SECAM 580 575 25 24 400.2HDTV 1920 1080 30 24 1,492.8Film 2000 1700 24 32 2,611.2

768kb/s1648kHz10 ~ 20000HzWideband audio

224kb/s1416kHz50 ~ 7000HzWideband speech

64kb/s88kHz300 ~ 3400Hz*Telephone speech

비트율샘플당 비트수샘플링비율주파수범위구분

압축의 필요성

size가 큰 데이터의 두가지 문제점기억

• size가 매우 큰 데이터 object는 매우 큰 저장 용량을 요구한다

• 데이터 기억 장치의 용량이 커질수록, 데이터를 검색하기 위한 접근시간이 증가하게 된다.

전송

• size가 매우 큰 object는 전송을 위하여 크기에 비례하는 만큼의 시간이요구된다.

멀티미디어 데이터들의 효율적 관리를 위하여,데이터 object들의 크기를 줄이기 위한 압축이 요구됨

Page 13: 01 Mm

13

질의/응답