Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
정보
Sangwook LeeDeogi High School
II 자료와 정보
1 자료와 정보의 표현
2 자료와 정보의 분석
1 자료와 정보의 표현
1-1 문자의 효율적인 디지털 표현
1-2 그림의 효율적인 디지털 표현
1-3 소리의 효율적인 디지털 표현
3
4
수치 정보의 표현 (49p)
컴퓨터가 저장할 수 있는 글자는 0과 1뿐이고
이진수는 0과 1로 이루어진 수이기 때문에
이것은 컴퓨터가…
이진수를 표현하기 적합한 기계란 것을 의미!
따라서 컴퓨터는…
모든 진법의 수를 이진수로 변환 후 저장!!
5
진법 기본 수각 자리의 단위 값
n번째 자리 넷째 자리 셋째 자리 둘째 자리 첫째 자리
십진법 10 10n-1 103 102 101 100
이진법 2 2n-1 23 22 21 20
팔진법 8 8n-1 83 82 81 80
십육진법 16 16n-1 163 162 161 160
여러 가지 진법의기본 수와 각 자리의 단위 값
2 3 4 5
진법이란? 숫자를 사용하여 수를 적는 방법을 말하며, 사용되는 숫자의 종류와 기본 수를 결정함
기본 수란? 각 자리의 단위 값을 나타내는 거듭제곱의 밑수
6
수치 정보의 표현 (49p)
[1] 문자의 디지털 표현 방법 (51p)
• 자료의 형태
– 수치, 문자, 소리, 그림
• 컴퓨터가 저장 장치에 표현(저장)할 수 있는 값은…
– 0과 1
7
따라서…
문자, 소리, 그림 자료가 컴퓨터에 저장될 때는0과 1의 조합, 즉 이진수로 변환되어 저장
[1] 문자의 디지털 표현 방법 (51p)
• 문자의 표현(저장) 방법
– 문자별로 미리 약속한 0과 1의 조합으로 표현
– 예
• ‘A’ : 01000001 (65)
• ‘B’ : 01000010 (66)
• ‘1’ : 00110001 (49)
• ‘4’ : 00110100 (52)
8
[1] 문자의 디지털 표현 방법 (51p)
• 문자 코드
– 문자별로 미리 약속한 0과 1의 조합
• 문자 인코딩
– 문자를 문자 코드로 표현하는 것
– 방식(=종류)
• ANSI, 유니코드, UTF-8 등
9
[1] 문자의 디지털 표현 방법 (51p)
• 윈도 메모장의 문자 인코딩 방식
– ANSI
– 유니코드
– 유니코드(big endian)
– UTF-8
10
[1] 문자의 디지털 표현 방법 (51p)
• 윈도 메모장의 문자 인코딩 방식
– ANSI
• 알파벳, 숫자, 기호를 표현할 때 8비트를 사용
• 그 외의 문자를 표현할 때 16비트를 사용
11
알파벳, 숫자, 기호 → 8비트
한글 → 16비트
비트(bit)· 정보의 최소 단위· 0 또는 1 하나를 의미
[1] 문자의 디지털 표현 방법 (51p)
• 윈도 메모장의 문자 인코딩 방식
– 유니코드(Big Endian)
• 모든 문자를 한 글자당 16비트를 사용하여 표현
• 알파벳, 숫자, 기호 등을 표현할 때는 ANSI보다 용량이 큼
• UTF-16BE 방식이라고 함
12
알파벳, 숫자, 기호 → 16비트
한글 → 16비트
[1] 문자의 디지털 표현 방법 (51p)
• 윈도 메모장의 문자 인코딩 방식
– 유니코드(Little Endian)
• UTF-16BE방식과 비트 배열 순서가 다름
• UTF-16LE 방식이라고 함
13
BE(Big Endian)
큰 자릿값의 바이트(8비트)를
앞에(왼쪽에) 나열하는 방식
LE(Little Endian)
작은 자릿값의 바이트(8비트)를
앞에(왼쪽에) 나열하는 방식
[1] 문자의 디지털 표현 방법 (51p)
• 윈도 메모장의 문자 인코딩 방식
– UTF-8
• 알파벳, 숫자, 기호를 표현할 때 8비트를 사용
• 그 외의 문자는 종류에 따라 16, 24, 32비트를 사용하여 표현
• 유니코드 중 하나
14
알파벳, 숫자, 기호 → 8비트
한글 → 24비트
[1] 문자의 디지털 표현 방법 (51p)
• 문자 인코딩 정리
– 문자는 문자 코드로 표현
– 문자 코드란 문자별로 미리 약속한 0과 1의 조합
– 문자 인코딩이란 문자를 문자 코드로 표현하는 것
– 문자 인코딩 방식은 ANSI, UTF-16, UTF-8 등이 있음
– 문자 인코딩 방식에 따라 문자 코드가 달라짐
– n개의 비트로 최대 2n개의 문자를 표현할 수 있음
15
16
[2] 문자열의 효율적인 표현 방법 (52p)
문자열여러 문자가 연속적으로 나열되어 있는 것을 말한
다.
문자열을 표현하려면, 문자의 개수만큼 비트가 필요하지만, 문자열의
규칙이나 반복을 이용하면 문자열을 더 적은 수의 비트로 표현할 수 있다.
반복 규칙을 이용하여 문자열을 줄여서 표현하는 방법에 대해 알아보자.
17
[2] 문자열의 효율적인 표현 방법 (52p)
자주 반복되는 문자열 찾아보기
반복되는 문자열을 특수한 문자로 치환하면 여러 문자를 한 개의 문자로
표현할 수 있으므로 전체 문자열의 길이를 줄일 수 있다.
치환을 통해 6개의 문자를 줄일 수 있지만
치환 규칙을 알아야 원래 문자열을 복원할
수 있으므로 치환 사전 4개의 문자를 포함
해야 한다.
18
[2] 문자열의 효율적인 표현 방법 (52p)
길게 반복되는 문자열 찾아보기
반복되는 문자열이 길면 반복 횟수가 적어도 전체 문자열의 길이를 줄일
수 있다. 특수한 문자로 치환하는 문자열의 길이가 길수록 효율이 좋다.
치환을 통해 6개의 문자를 더 줄일 수
있지만 치환 규칙을 알아야 원래
문자열을 복원할 수 있으므로
치환 사전 5개의 문자를 추가로 포함해야 한다.
1 자료와 정보의 표현
1-1 문자의 효율적인 디지털 표현
1-2 그림의 효율적인 디지털 표현
1-3 소리의 효율적인 디지털 표현
19
[1] 그림의 디지털 표현 방법 (55p)
• 화소
– 픽셀(pixel, Picture Element의 합성어)
– 그림이나 화면을 구성하는 각각의 점
– 색상 정보를 가진 최소 단위
20
[1] 그림의 디지털 표현 방법 (55p)
• 그림 ‘X’의 표현
21
[1] 그림의 디지털 표현 방법 (55p)
• 그림 정보의 표현 방식 2가지
– 래스터 방식 (= 비트맵 방식)
– 벡터 방식
22
[1] 그림의 디지털 표현 방법 (55p)
• 비트맵(bitmap) 방식
23
비트맵(bitmap)이란 용어는…
Microsoft에서 만든
래스터(raster) 방식 파일 이름이지만,
일반적으로 동일한 의미로 사용
[1] 그림의 디지털 표현 방법 (55p)
• 비트맵(bitmap) 방식
– 픽셀의 색상 정보로 그림을 표현하는 방식
24
[1] 그림의 디지털 표현 방법 (55p)
• 비트맵 방식으로 만들어진 그림의 특징
– 픽셀이 가지는 색상을 저장한다.
– 부분적인 수정이 어렵다.
– 확대 시 계단 현상이 발생한다.
– 자연스러움(실제의 형상)을 표현하기 쉽다.
– 어도비 포토샵, 코렐 페인터 등에서 사용한다.
25
[1] 그림의 디지털 표현 방법 (55p)
• 벡터(vector) 방식
– 개체의 모양 정보(위치, 길이, 굵기 등)로 그림을 표현하는 방식
26
[1] 그림의 디지털 표현 방법 (55p)
• 벡터 방식으로 만들어진 그림의 특징
– 개체를 그리는 명령어를 저장한다.
– 부분적인 수정이 쉽다.
– 확대 시 계단 현상이 발생하지 않는다.
– 자연스러움(실제의 형상)을 표현하기 어렵다.
– 어도비 일러스트레이터, 코렐 드로우 등에서 사용한다.
27
[2] 래스터 그래픽의 종류 (56p)
• BMP
– Microsoft에서 개발
– BITMAP의 약어
– 윈도 표준 그래픽 파일
– 압축을 하지 않아 파일의 크기가 큼
– 1,600만 색상 표현 가능
28
[2] 래스터 그래픽의 종류 (56p)
• JPEG (=JPG)
– JPEG에서 개발
– Joint Photographic Experts Group의 약어
– 디지털 카메라 이미지를 위해 개발
– 손실 압축을 하여 압축률이 높지만, 품질이 우수함
– 1,600만 색상 표현 가능
29
[2] 래스터 그래픽의 종류 (56p)
• GIF
– CompuServe에서 개발
– Graphics Interchange Format의 약어
– 네트워크 상에서 빠른 전송을 위해 개발
– 무손실 압축을 하여 압축률이 낮고, 품질이 우수함
– 표현 가능한 최대 색상 수는 256색
– 움직이는 그림의 표현이 가능
30
[2] 래스터 그래픽의 종류 (56p)
• PNG
– W3C에서 개발
– Portable Network Graphics의 약어
– GIF 파일의 특허 문제를 해결하기 위해 개발
– 무손실 압축을 하여 압축률이 낮고, 품질이 우수함
– 1,600만 색상 표현 가능
31
32
그림 파일 비교
개발사 압축방식 색상수
BMP Microsoft압축하지 않음
(용량이 큼)1,600만 컬러
(트루컬러)
JPG JPEG 손실 압축1,600만 컬러
(트루컬러)
GIF CompuServe 무손실 압축 256 컬러
PNG W3C(웹 표준개발 국제 컨소시움)
무손실 압축1,600만 컬러
(트루컬러)
1 자료와 정보의 표현
1-1 문자의 효율적인 디지털 표현
1-2 그림의 효율적인 디지털 표현
1-3 소리의 효율적인 디지털 표현
33
[1] 소리의 표현 방법 (59p)
• 소리 정보의 표현 방식 2가지
– PCM 방식 (= 웨이브 방식)
– 미디 방식
34
[1] 소리의 표현 방법 (59p)
• 웨이브(wave) 방식
35
웨이브(wave, wav)란 용어는…
Microsoft와 IBM에서 만든
PCM(Pulse Code Modulation) 방식 파일 이름이지만,
일반적으로 동일한 의미로 사용
[1] 소리의 표현 방법 (59p)
• 웨이브(wave) 방식
– 소리의 진동 값을 저장하는 방식
36
[1] 소리의 표현 방법 (59p)
• 웨이브 방식 소리 파일 생성 과정
– 표본화(sampling)
– 양자화(quantization)
– 부호화(encoding)
37
[1] 소리의 표현 방법 (59p)
• 표본화(sampling) : (a) → (b)
– 일정한 간격으로 신호 중 일부를 추출하는 것
38
[1] 소리의 표현 방법 (59p)
• 양자화(quantization) : (b) → (c)
– 추출한 표본의 실숫값 높이를 정숫값으로 근사화하는 것
39
[1] 소리의 표현 방법 (59p)
• 부호화(encoding) : (c) → (d)
– 정숫값으로 근사화한 표본의 높이를 이진수로 나타내는 것
40
41
“소리 파일의 음질은초당 샘플 수(표본화 비율)와
샘플당 비트 수(양자화 비트)에의해 결정”
소리 파일 크기 구하기
• 소리 파일의 크기는..
42
초당 샘플 수 × 샘플당 비트 수 × 시간(초) × 채널 수
Q. 계산 결과 값의 단위는?
A. 비트(bit)
Q. 단위를 바이트(byte)로 바꾸려면?
A. 8로 나눔
43
[문제] 1초에 44,100개의 샘플을 만드는 비율로 16비트 크기의 샘플
을 4분 동안 생성하였다. 저장된 소리 파일의 크기는 몇 바이
트인가? (단, 소리 파일은 스테레오로 생성되었다.)
(풀이)
소리 파일 크기 =
초당 샘플 수 × 샘플당 비트 수 × 시간(초) × 채널 수
44,100 × 16 × 240 × 2
= 338,688,000 (비트)
☞ 338,688,000 ÷ 8 = 42,336,000 (바이트)
≒ 40M (바이트)
44
초당 샘플 수비트레이트
:: 비트레이트 ::소리를 전송(재생)하기 위해 사용하는 초당 비트 수
45
[문제] 초당 샘플 수가 44,100, 샘플당 비트 수가 16, 채널 수가 2인
mp3 파일의 비트레이트는? (단, mp3 파일은 wav 파일을
1/11로 압축하였다고 가정한다.)
(풀이)
비트레이트 =
초당 샘플 수 × 샘플당 비트 수 × 채널 수
44,100 × 16 × 2
= 1,411,200 (비트)
☞ 1,411,200 ÷ 11 = 128,290 (비트)
≒ 128k (비트)
[1] 소리의 표현 방법 (59p)
• 미디(midi) 방식
– Musical Instrument Digital Interface의 약어
– MMA에서 개발
– 소리의 연주 정보를 저장하는 방식
– 전자 악기 소프트웨어가 연주
– Tempo, Key 등 연주 정보의 변경이 쉬움
– 음성과 같은 실제의 소리를 표현할 수 없음
– 확장자는 mid
46
[2] 소리의 효율적인 표현 방법 (60p)
• WAV (Waveform Audio Format)
– Microsoft, IBM에서 개발
– 윈도 기본 오디오 파일 형식
– CD의 오디오 파일을 압축 없이 컴퓨터에 저장한 파일
47
비압축 파일인 WAV는…
용량이 커서 관리나 활용이 불편하기 때문에
다양한 종류의 압축 파일 형식이 존재함
[2] 소리의 효율적인 표현 방법 (60p)
• 압축 방식에 따른 웨이브 파일
– 손실 압축
• MP3
• WMA
• AAC
– 무손실 압축
• FLAC
• ALAC
48<Hi-Fi 플레이어>
<MP3 플레이어>
[2] 소리의 효율적인 표현 방법 (60p)
• MP3 (MPEG-1 Audio Layer-3)
– MPEG에서 개발
– WAV를 약 1/10~1/12로 압축한 것
– CD 수준의 음질
• WMA (Windows Media Audio)
– Microsoft에서 개발
– 윈도 미디어 플레이어용 오디오 파일
– MP3의 1/2 크기
49
[2] 소리의 효율적인 표현 방법 (60p)
• AAC (Advanced Audio Coding)
– MPEG, AT&T, 소니, 돌비연구소 등에서 개발
– MP3를 개선하여 MP3보다 압축률이 높음
– 확장자는 aac, m4a 등
50
유튜브, 네이버 동영상 등 영상 스트리밍 서비스와
벅스, 멜론 등 음원 스트리밍 서비스에서 사용
[2] 소리의 효율적인 표현 방법 (60p)
• FLAC (Free Lossless Audio Codec)
– Xiph.org에서 개발
– WAV의 4/5~1/2 크기
– 확장자는 flac, fla, ogg
51
많은 기기 및 소프트웨어에서 사용되는
무손실압축계의 mp3
[2] 소리의 효율적인 표현 방법 (60p)
• ALAC (Apple Lossless Audio Codec)
– 애플에서 개발
– Apple Lossless라고 불림
– 확장자는 m4a, mp4
※ 코덱(codec)이란
– Coder + Decoder
– 영상이나 음성 자료를 압축(인코딩)하고 해제(디코딩)하는 방식또는 이를 위한 하드웨어나 소프트웨어
52
m4a는…
다양한 소리 파일을 담을 수 있는
컨테이너 확장자
동영상
• 동영상 구분
– 비디오 카메라 등을 통해 입력 받은 실세계의 영상
☞ 좁은 의미의 동영상
– 그래픽 프로그램 등을 이용하여 직접 그린 만들어진 영상
☞ 애니메이션
53
전통적인 애니메이션 제작 방식
• 플립북(flip book) 애니메이션
– 여러 개의 이미지를 저장한 후 차례대로 보여줌으로써 움직이는 것과 같은 효과를 만드는 기법
– 예) Gangnam Style
• 셀(cell) 애니메이션
– 투명 플라스틱(셀룰로이드)위에 그림을 그린 후 배경 위에 놓고 촬영하는 기법
– 예) Father and Daughter
54
55
벡터 애니메이션
벡터 애니메이션은…
어도비 플래시와 같은 컴퓨터 프로그램을 사용하여 제작하며
화면 크기를 확대해도 화질 저하가 발생하지 않음