Sangwook Lee Deogi High Schooledpia.net/info/materials/2-1.pdf · 2019-06-27 · 4 수치정보의표현(49p) 컴퓨터가저장할수있는글자는0과1뿐이고 이진수는0과1로이루어진수이기때문에

정보

Sangwook LeeDeogi High School

II 자료와 정보

1 자료와 정보의 표현

2 자료와 정보의 분석


1-1 문자의 효율적인 디지털 표현

1-2 그림의 효율적인 디지털 표현

1-3 소리의 효율적인 디지털 표현

3

4

수치 정보의 표현 (49p)

컴퓨터가 저장할 수 있는 글자는 0과 1뿐이고

이진수는 0과 1로 이루어진 수이기 때문에

이것은 컴퓨터가…

이진수를 표현하기 적합한 기계란 것을 의미!

따라서 컴퓨터는…

모든 진법의 수를 이진수로 변환 후 저장!!

5

진법 기본 수각 자리의 단위 값

n번째 자리 넷째 자리 셋째 자리 둘째 자리 첫째 자리

십진법 10 10n-1 103 102 101 100

이진법 2 2n-1 23 22 21 20

팔진법 8 8n-1 83 82 81 80

십육진법 16 16n-1 163 162 161 160

여러 가지 진법의기본 수와 각 자리의 단위 값

2 3 4 5

진법이란? 숫자를 사용하여 수를 적는 방법을 말하며, 사용되는 숫자의 종류와 기본 수를 결정함

기본 수란? 각 자리의 단위 값을 나타내는 거듭제곱의 밑수

6

수치 정보의 표현 (49p)

[1] 문자의 디지털 표현 방법 (51p)

• 자료의 형태

– 수치, 문자, 소리, 그림

• 컴퓨터가 저장 장치에 표현(저장)할 수 있는 값은…

– 0과 1

7

따라서…

문자, 소리, 그림 자료가 컴퓨터에 저장될 때는0과 1의 조합, 즉 이진수로 변환되어 저장


• 문자의 표현(저장) 방법

– 문자별로 미리 약속한 0과 1의 조합으로 표현

– 예

• ‘A’ : 01000001 (65)

• ‘B’ : 01000010 (66)

• ‘1’ : 00110001 (49)

• ‘4’ : 00110100 (52)

8


• 문자 코드

– 문자별로 미리 약속한 0과 1의 조합

• 문자 인코딩

– 문자를 문자 코드로 표현하는 것

– 방식(=종류)

• ANSI, 유니코드, UTF-8 등

9


• 윈도 메모장의 문자 인코딩 방식

– ANSI

– 유니코드

– 유니코드(big endian)

– UTF-8

10



– ANSI

• 알파벳, 숫자, 기호를 표현할 때 8비트를 사용

• 그 외의 문자를 표현할 때 16비트를 사용

11

알파벳, 숫자, 기호 → 8비트

한글 → 16비트

비트(bit)· 정보의 최소 단위· 0 또는 1 하나를 의미



– 유니코드(Big Endian)

• 모든 문자를 한 글자당 16비트를 사용하여 표현

• 알파벳, 숫자, 기호 등을 표현할 때는 ANSI보다 용량이 큼

• UTF-16BE 방식이라고 함

12


한글 → 16비트



– 유니코드(Little Endian)

• UTF-16BE방식과 비트 배열 순서가 다름

• UTF-16LE 방식이라고 함

13

BE(Big Endian)

큰 자릿값의 바이트(8비트)를

앞에(왼쪽에) 나열하는 방식

LE(Little Endian)

작은 자릿값의 바이트(8비트)를

앞에(왼쪽에) 나열하는 방식



– UTF-8

• 알파벳, 숫자, 기호를 표현할 때 8비트를 사용

• 그 외의 문자는 종류에 따라 16, 24, 32비트를 사용하여 표현

• 유니코드 중 하나

14


한글 → 24비트

https://en.wikipedia.org/wiki/UTF-8


• 문자 인코딩 정리

– 문자는 문자 코드로 표현

– 문자 코드란 문자별로 미리 약속한 0과 1의 조합

– 문자 인코딩이란 문자를 문자 코드로 표현하는 것

– 문자 인코딩 방식은 ANSI, UTF-16, UTF-8 등이 있음

– 문자 인코딩 방식에 따라 문자 코드가 달라짐

– n개의 비트로 최대 2n개의 문자를 표현할 수 있음

15

16

[2] 문자열의 효율적인 표현 방법 (52p)

문자열여러 문자가 연속적으로 나열되어 있는 것을 말한

다.

문자열을 표현하려면, 문자의 개수만큼 비트가 필요하지만, 문자열의

규칙이나 반복을 이용하면 문자열을 더 적은 수의 비트로 표현할 수 있다.

반복 규칙을 이용하여 문자열을 줄여서 표현하는 방법에 대해 알아보자.

17


자주 반복되는 문자열 찾아보기

반복되는 문자열을 특수한 문자로 치환하면 여러 문자를 한 개의 문자로

표현할 수 있으므로 전체 문자열의 길이를 줄일 수 있다.

치환을 통해 6개의 문자를 줄일 수 있지만

치환 규칙을 알아야 원래 문자열을 복원할

수 있으므로 치환 사전 4개의 문자를 포함

해야 한다.

18


길게 반복되는 문자열 찾아보기

반복되는 문자열이 길면 반복 횟수가 적어도 전체 문자열의 길이를 줄일

수 있다. 특수한 문자로 치환하는 문자열의 길이가 길수록 효율이 좋다.

치환을 통해 6개의 문자를 더 줄일 수

있지만 치환 규칙을 알아야 원래

문자열을 복원할 수 있으므로

치환 사전 5개의 문자를 추가로 포함해야 한다.





19

[1] 그림의 디지털 표현 방법 (55p)

• 화소

– 픽셀(pixel, Picture Element의 합성어)

– 그림이나 화면을 구성하는 각각의 점

– 색상 정보를 가진 최소 단위

20


• 그림 ‘X’의 표현

21


• 그림 정보의 표현 방식 2가지

– 래스터 방식 (= 비트맵 방식)

– 벡터 방식

22


• 비트맵(bitmap) 방식

23

비트맵(bitmap)이란 용어는…

Microsoft에서 만든

래스터(raster) 방식 파일 이름이지만,

일반적으로 동일한 의미로 사용


• 비트맵(bitmap) 방식

– 픽셀의 색상 정보로 그림을 표현하는 방식

24


• 비트맵 방식으로 만들어진 그림의 특징

– 픽셀이 가지는 색상을 저장한다.

– 부분적인 수정이 어렵다.

– 확대 시 계단 현상이 발생한다.

– 자연스러움(실제의 형상)을 표현하기 쉽다.

– 어도비 포토샵, 코렐 페인터 등에서 사용한다.

25


• 벡터(vector) 방식

– 개체의 모양 정보(위치, 길이, 굵기 등)로 그림을 표현하는 방식

26


• 벡터 방식으로 만들어진 그림의 특징

– 개체를 그리는 명령어를 저장한다.

– 부분적인 수정이 쉽다.

– 확대 시 계단 현상이 발생하지 않는다.

– 자연스러움(실제의 형상)을 표현하기 어렵다.

– 어도비 일러스트레이터, 코렐 드로우 등에서 사용한다.

27

[2] 래스터 그래픽의 종류 (56p)

• BMP

– Microsoft에서 개발

– BITMAP의 약어

– 윈도 표준 그래픽 파일

– 압축을 하지 않아 파일의 크기가 큼

– 1,600만 색상 표현 가능

28


• JPEG (=JPG)

– JPEG에서 개발

– Joint Photographic Experts Group의 약어

– 디지털 카메라 이미지를 위해 개발

– 손실 압축을 하여 압축률이 높지만, 품질이 우수함


29


• GIF

– CompuServe에서 개발

– Graphics Interchange Format의 약어

– 네트워크 상에서 빠른 전송을 위해 개발

– 무손실 압축을 하여 압축률이 낮고, 품질이 우수함

– 표현 가능한 최대 색상 수는 256색

– 움직이는 그림의 표현이 가능

30


• PNG

– W3C에서 개발

– Portable Network Graphics의 약어

– GIF 파일의 특허 문제를 해결하기 위해 개발

– 무손실 압축을 하여 압축률이 낮고, 품질이 우수함


31

32

그림 파일 비교

개발사 압축방식 색상수

BMP Microsoft압축하지 않음

(용량이 큼)1,600만 컬러

(트루컬러)

JPG JPEG 손실 압축1,600만 컬러

(트루컬러)

GIF CompuServe 무손실 압축 256 컬러

PNG W3C(웹 표준개발 국제 컨소시움)

무손실 압축1,600만 컬러

(트루컬러)





33

[1] 소리의 표현 방법 (59p)

• 소리 정보의 표현 방식 2가지

– PCM 방식 (= 웨이브 방식)

– 미디 방식

34


• 웨이브(wave) 방식

35

웨이브(wave, wav)란 용어는…

Microsoft와 IBM에서 만든

PCM(Pulse Code Modulation) 방식 파일 이름이지만,

일반적으로 동일한 의미로 사용


• 웨이브(wave) 방식

– 소리의 진동 값을 저장하는 방식

36


• 웨이브 방식 소리 파일 생성 과정

– 표본화(sampling)

– 양자화(quantization)

– 부호화(encoding)

37


• 표본화(sampling) : (a) → (b)

– 일정한 간격으로 신호 중 일부를 추출하는 것

38


• 양자화(quantization) : (b) → (c)

– 추출한 표본의 실숫값 높이를 정숫값으로 근사화하는 것

39


• 부호화(encoding) : (c) → (d)

– 정숫값으로 근사화한 표본의 높이를 이진수로 나타내는 것

40

41

“소리 파일의 음질은초당 샘플 수(표본화 비율)와

샘플당 비트 수(양자화 비트)에의해 결정”

소리 파일 크기 구하기

• 소리 파일의 크기는..

42

초당 샘플 수 × 샘플당 비트 수 × 시간(초) × 채널 수

Q. 계산 결과 값의 단위는?

A. 비트(bit)

Q. 단위를 바이트(byte)로 바꾸려면?

A. 8로 나눔

43

[문제] 1초에 44,100개의 샘플을 만드는 비율로 16비트 크기의 샘플

을 4분 동안 생성하였다. 저장된 소리 파일의 크기는 몇 바이

트인가? (단, 소리 파일은 스테레오로 생성되었다.)

(풀이)

소리 파일 크기 =

초당 샘플 수 × 샘플당 비트 수 × 시간(초) × 채널 수

44,100 × 16 × 240 × 2

= 338,688,000 (비트)

☞ 338,688,000 ÷ 8 = 42,336,000 (바이트)

≒ 40M (바이트)

44

초당 샘플 수비트레이트

:: 비트레이트 ::소리를 전송(재생)하기 위해 사용하는 초당 비트 수

45

[문제] 초당 샘플 수가 44,100, 샘플당 비트 수가 16, 채널 수가 2인

mp3 파일의 비트레이트는? (단, mp3 파일은 wav 파일을

1/11로 압축하였다고 가정한다.)

(풀이)

비트레이트 =

초당 샘플 수 × 샘플당 비트 수 × 채널 수

44,100 × 16 × 2

= 1,411,200 (비트)

☞ 1,411,200 ÷ 11 = 128,290 (비트)

≒ 128k (비트)


• 미디(midi) 방식

– Musical Instrument Digital Interface의 약어

– MMA에서 개발

– 소리의 연주 정보를 저장하는 방식

– 전자 악기 소프트웨어가 연주

– Tempo, Key 등 연주 정보의 변경이 쉬움

– 음성과 같은 실제의 소리를 표현할 수 없음

– 확장자는 mid

46

http://www.midi.org/

[2] 소리의 효율적인 표현 방법 (60p)

• WAV (Waveform Audio Format)

– Microsoft, IBM에서 개발

– 윈도 기본 오디오 파일 형식

– CD의 오디오 파일을 압축 없이 컴퓨터에 저장한 파일

47

비압축 파일인 WAV는…

용량이 커서 관리나 활용이 불편하기 때문에

다양한 종류의 압축 파일 형식이 존재함


• 압축 방식에 따른 웨이브 파일

– 손실 압축

• MP3

• WMA

• AAC

– 무손실 압축

• FLAC

• ALAC

48<Hi-Fi 플레이어>

<MP3 플레이어>

https://shop.iriver.co.kr/

https://shop.iriver.co.kr/

http://it.donga.com/3476/

http://it.donga.com/3476/


• MP3 (MPEG-1 Audio Layer-3)

– MPEG에서 개발

– WAV를 약 1/10~1/12로 압축한 것

– CD 수준의 음질

• WMA (Windows Media Audio)

– Microsoft에서 개발

– 윈도 미디어 플레이어용 오디오 파일

– MP3의 1/2 크기

49


• AAC (Advanced Audio Coding)

– MPEG, AT&T, 소니, 돌비연구소 등에서 개발

– MP3를 개선하여 MP3보다 압축률이 높음

– 확장자는 aac, m4a 등

50

유튜브, 네이버 동영상 등 영상 스트리밍 서비스와

벅스, 멜론 등 음원 스트리밍 서비스에서 사용


• FLAC (Free Lossless Audio Codec)

– Xiph.org에서 개발

– WAV의 4/5~1/2 크기

– 확장자는 flac, fla, ogg

51

많은 기기 및 소프트웨어에서 사용되는

무손실압축계의 mp3


• ALAC (Apple Lossless Audio Codec)

– 애플에서 개발

– Apple Lossless라고 불림

– 확장자는 m4a, mp4

※ 코덱(codec)이란

– Coder + Decoder

– 영상이나 음성 자료를 압축(인코딩)하고 해제(디코딩)하는 방식또는 이를 위한 하드웨어나 소프트웨어

52

m4a는…

다양한 소리 파일을 담을 수 있는

컨테이너 확장자

동영상

• 동영상 구분

– 비디오 카메라 등을 통해 입력 받은 실세계의 영상

☞ 좁은 의미의 동영상

– 그래픽 프로그램 등을 이용하여 직접 그린 만들어진 영상

☞ 애니메이션

53

전통적인 애니메이션 제작 방식

• 플립북(flip book) 애니메이션

– 여러 개의 이미지를 저장한 후 차례대로 보여줌으로써 움직이는 것과 같은 효과를 만드는 기법

– 예) Gangnam Style

• 셀(cell) 애니메이션

– 투명 플라스틱(셀룰로이드)위에 그림을 그린 후 배경 위에 놓고 촬영하는 기법

– 예) Father and Daughter

54

https://www.youtube.com/watch?v=av5fonYSAsE

https://www.youtube.com/watch?v=-PPJljxZq1M

55

벡터 애니메이션

벡터 애니메이션은…

어도비 플래시와 같은 컴퓨터 프로그램을 사용하여 제작하며

화면 크기를 확대해도 화질 저하가 발생하지 않음

video/xiao3.swf

video/xiao3.swf

Documents

Sangwook Lee Deogi High Schooledpia.net/info/materials/2-1.pdf · 2019-06-27 · 4 수치정보의표현(49p) 컴퓨터가저장할수있는글자는0과1뿐이고 이진수는0과1로이루어진수이기때문에