29
MPEG1 Audio Coding Algorithm ISO/IEC JTC1/WG11 ISO/IEC JTC1/WG11 Presented by Presented by Chai-Yeol Rim Chai-Yeol Rim

MPEG1 Audio Coding Algorithm

Embed Size (px)

Citation preview

Page 1: MPEG1 Audio Coding Algorithm

MPEG1 Audio Coding Algorithm

ISO/IEC JTC1/WG11ISO/IEC JTC1/WG11

Presented byPresented by

Chai-Yeol RimChai-Yeol Rim

Page 2: MPEG1 Audio Coding Algorithm

Contents

Physiology of Human Ear Physiology of Human Ear Data ReductionData Reduction Encoding structure of MPEG1 AudioEncoding structure of MPEG1 Audio

Page 3: MPEG1 Audio Coding Algorithm

Physiology of Human Ear (1) PsychoacousticsPsychoacoustics

귀의 구조귀의 구조

Page 4: MPEG1 Audio Coding Algorithm

Physiology of Human Ear (2) PsychoacousticsPsychoacoustics

주파수 분별력 주파수 분별력 1000Hz1000Hz 와 와 1002Hz1002Hz 의 구분의 구분 ??

Loosely coupled brain’s functionLoosely coupled brain’s function좌우 귀가 좌우 뇌와 꼬여 존재좌우 귀가 좌우 뇌와 꼬여 존재좌측 뇌는 좌측 뇌는 Speech, Speech, 우측 뇌는 우측 뇌는 melodicmelodic 정보에 익숙 정보에 익숙

주파수에 주파수에 logarithmiclogarithmic 한 특징을 갖는다한 특징을 갖는다100~200Hz100~200Hz 구간과 구간과 1K~2KHz1K~2KHz 의 구간이 같게 느낌의 구간이 같게 느낌

WideWide 한 한 dynamic rangedynamic range0dB~120dB0dB~120dB 의 인지도의 인지도

Page 5: MPEG1 Audio Coding Algorithm

Physiology of Human Ear (3) Robinson-Dadson equal loudness contourRobinson-Dadson equal loudness contour

Page 6: MPEG1 Audio Coding Algorithm

Physiology of Human Ear (4) Critical BandsCritical Bands

주파수 분별력 주파수 분별력 주파수 고저에 따라 차이주파수 고저에 따라 차이Critical Bandwidth = 24.7(4.37F +1)Critical Bandwidth = 24.7(4.37F +1)

Eberhard Zwicker Eberhard Zwicker 15KHz15KHz 이하에서의 이하에서의 24 critical band24 critical band 를 작성를 작성

Page 7: MPEG1 Audio Coding Algorithm

Physiology of Human Ear (5)

Page 8: MPEG1 Audio Coding Algorithm

Physiology of Human Ear (6) 청각의 청각의 ThresholdThreshold 와 와 MaskingMasking

Page 9: MPEG1 Audio Coding Algorithm

Physiology of Human Ear (7) Masking curveMasking curveA :A : 주파수주파수B :Critical-BandB :Critical-Band

Page 10: MPEG1 Audio Coding Algorithm

Physiology of Human Ear (8) Masking thresholdMasking threshold

sound pressure levelsound pressure level 에 따라 가변에 따라 가변

Page 11: MPEG1 Audio Coding Algorithm

Data Reduction (1) Perceptual codingPerceptual coding

Sampling Sampling 주파수의 변경 주파수의 변경 : Nyquist theorem: Nyquist theorem 에 제한에 제한Dynamic range Dynamic range 변경 변경 : Quantization Noisy: Quantization Noisy 가중가중

Page 12: MPEG1 Audio Coding Algorithm

Data Reduction (2) Two type of frequency domain coderTwo type of frequency domain coder

Transform Coder :Transform Coder :

Good frequency resolutionGood frequency resolution

Poor time resolutionPoor time resolution Subband Coder :Subband Coder :

Poor frequency resolutionPoor frequency resolution

Good time resolutionGood time resolution

Page 13: MPEG1 Audio Coding Algorithm

Data Reduction (3) Basic structure of Encoder / DecoderBasic structure of Encoder / Decoder

Page 14: MPEG1 Audio Coding Algorithm

Data Reduction (4) Sub-Band CoderSub-Band Coder

Page 15: MPEG1 Audio Coding Algorithm

Data Reduction (5) Sub-Band CodingSub-Band Coding 의 과정 의 과정 (1)(1)

Page 16: MPEG1 Audio Coding Algorithm

Data Reduction (6) Sub-Band CodingSub-Band Coding 의 과정 의 과정 (2)(2)

Page 17: MPEG1 Audio Coding Algorithm

Data Reduction (7) Bit allocation Bit allocation

Audible Audible 신호의 크기에 따라서 신호의 크기에 따라서 bitbit 할당할당

Page 18: MPEG1 Audio Coding Algorithm

MPEG1 Audio Encoding 구조 (1) MPEG-1 Audio StandardMPEG-1 Audio Standard

Sampling rate : Sampling rate : 32, 44.1, 48KHz32, 44.1, 48KHz Bit rate : Bit rate : 32~224kbps/channel32~224kbps/channel

64~448kbps for stereo64~448kbps for stereo Background Two AlgorithmBackground Two Algorithm

MUSCAM (Masking-pattern Adaptive SubbaMUSCAM (Masking-pattern Adaptive Subband Coding And Multiplexing)nd Coding And Multiplexing)

ASPEC (Adaptive Spectral Perceptual EntroASPEC (Adaptive Spectral Perceptual Entropy Coding)py Coding)

Page 19: MPEG1 Audio Coding Algorithm

MPEG1 Audio Encoding 구조 (2) MPEG-1 Audio StandardMPEG-1 Audio Standard

3 Layer coding : 3 Layer coding : Layer I, II, IIILayer I, II, III Layer I : Layer I : 상대적으로 상대적으로 High rateHigh rate 인 경우 사용인 경우 사용 Layer II : Layer II :

채널당 채널당 96~128kbps96~128kbps 전송율전송율Layer IIA Layer IIA 는 는 joint stereo versionjoint stereo version

Layer III : Layer III : Low data rate Low data rate 을 대상을 대상 , , 가장 복잡가장 복잡

Layer I,IILayer I,II 는 는 MUSCAMMUSCAM 을 을 Layer IIILayer III 는 는 ASPECASPEC

Page 20: MPEG1 Audio Coding Algorithm

MPEG1 Audio Encoding 구조 (3) MPEG-1 Layer I CodingMPEG-1 Layer I Coding

MUSCAMMUSCAM 방식의 응용방식의 응용 3232 개의 개의 subband codingsubband coding 512 point512 point 의 의 FFTFFT 로 로 psychoacoustic modelipsychoacoustic modeli

ngng Subband dataSubband data 에 대한 에 대한 bit allocationbit allocation 수행수행 12 subband sample 12 subband sample 에 대한 에 대한 codingcoding

Page 21: MPEG1 Audio Coding Algorithm

MPEG1 Audio Encoding 구조 (4)

Page 22: MPEG1 Audio Coding Algorithm

MPEG1 Audio Encoding 구조 (5) MPEG-1 Layer II CodingMPEG-1 Layer II Coding

MUSCAMMUSCAM 방식의 응용방식의 응용 3232 개의 개의 subband codingsubband coding 1024 point1024 point 의 의 FFTFFT 로 로 psychoacoustic mopsychoacoustic mo

delingdeling Subband dataSubband data 에 대한 에 대한 bit allocationbit allocation 수행수행 33 개의 개의 12 subband sample 12 subband sample 에 대한 에 대한 codincodin

gg Layer ILayer I 에 비한 효과적인 에 비한 효과적인 CodingCoding 수행수행

Page 23: MPEG1 Audio Coding Algorithm

MPEG1 Audio Encoding 구조 (6) MPEG-1 MPEG-1

Layer I/II Layer I/II 의 비교의 비교

Page 24: MPEG1 Audio Coding Algorithm

MPEG1 Audio Encoding 구조 (7) MPEG-1 Layer III CodingMPEG-1 Layer III Coding

MUSCAMMUSCAM 과 과 ASPECASPEC 방식의 합성방식의 합성 Layer I,II Layer I,II 비교 좋은 품질의 비교 좋은 품질의 audio coding audio coding 3232 개의 개의 subband codingsubband coding Subband Subband 계수를 계수를 MDCTMDCT 수행수행 1024 point1024 point 의 의 FFTFFT 로 로 psychoacoustic modepsychoacoustic mode

lingling Subband dataSubband data 에 대한 에 대한 bit allocationbit allocation 수행수행 Huffman & Run-length codingHuffman & Run-length coding

Page 25: MPEG1 Audio Coding Algorithm

MPEG1 Audio Encoding 구조 (8)

Page 26: MPEG1 Audio Coding Algorithm

MPEG1 Audio Encoding 구조 (9) MDCT block for Layer III codingMDCT block for Layer III coding

Page 27: MPEG1 Audio Coding Algorithm

MPEG1 Audio Encoding 구조 (10) Psychoacoustic ModelingPsychoacoustic Modeling

512, 1024 FFT 512, 1024 FFT 수행수행 Subband data codingSubband data coding 을 위한 최대 을 위한 최대 SPLSPL 결정결정 QuietQuiet 상태의 상태의 absolute thresholdabsolute threshold 구함구함 TonalTonal 과 과 nontonalnontonal 성분을 구함성분을 구함 Masking thresholdMasking threshold 를 구함를 구함 Global masking thresholdGlobal masking threshold 를 구함를 구함 각 각 subbandsubband 에 대한 에 대한 Minimum masking threshMinimum masking thresh

oldold 를 구함를 구함 NMR = SNR - SMR NMR = SNR - SMR 계산계산

Page 28: MPEG1 Audio Coding Algorithm

MPEG1 Audio Encoding 구조 (11) MPEG1MPEG1

LayerI,II LayerI,II

EncodingEncoding

Flow-chartFlow-chart

Page 29: MPEG1 Audio Coding Algorithm

정리 MPEG1 Layer I,II,III CodingMPEG1 Layer I,II,III Coding

Psychoacoustic modelingPsychoacoustic modelingSubband CodingSubband CodingTransform coding (MDCT)Transform coding (MDCT)Bit allocationBit allocationHuffman entropy codingHuffman entropy coding

MPEG1MPEG1 의 음질의 결정 요인의 음질의 결정 요인Psychoacoustic modelingPsychoacoustic modelingBit allocationBit allocation