Upload
rushitech
View
737
Download
2
Embed Size (px)
Citation preview
13.04.23
Кодирование информации.
Двоичное кодирование.
Кодирование информации
Кодирование – это операция преобразования символов или группы символов одного кода в символы или группы символов другого кода.
Кодирование – это запись информации с помощью некоторой знаковой системы (языка).
Код – это система условных знаков для представления информации.
3
Кодирование информации
Зачем кодируют информацию? Зачем кодируют информацию??
кодирование
10101001010
данные (код)
обработка
11111100010
данные (код)
хранение
борьба с помехами (специальные
способы кодирования)
борьба с помехами (специальные
способы кодирования)
передача
передача
Информация передается, обрабатывается и хранится в виде кодов.
4
ЯзыкиЯзык – знаковая система, используемая для хранения
и передачи информации (знаковая форма представления информации).
Естественные языки:1. носят национальный характер (русский,
английский, …);2. есть правила и исключения.Формальные языки:1. интернациональны, понятны всем (язык физики и
т.п.);2. наличие строгих правил.
2mcE program qq;beginwriteln("Привет!");end.
program qq;beginwriteln("Привет!");end.
2816 10000201016
5
КодированиеУпражнение 1. Закодируйте имя ВАСЯ с помощью азбуки Морзе.
ВАСЯ
Код неравномерный, нужен разделитель!
!
6
КодированиеУпражнение 2. Закодируйте имя ВАСЯ с помощью кодовой таблицы (Windows-1251):
0 1 2 3 4 5 6 7 8 9 A B C D E F
C А Б В Г Д Е Ж З И Й К Л М Н О П
D Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
ВАСЯ С2 С0 D1 DF
В А С Я
Код равномерный, разделитель НЕ нужен!!
Грамматика – правила по которым из символов алфавита строятся слова. Синтаксис - правила по которым из слов. строятся предложения. Упражнение 3. Представьте с помощью естественных и нормальных языков следующую информацию
Языки
Информация Формальный
языкЕстественный
язык
Нахождение площади
треугольника
Правило дорожного движения
Призыв о помощи
sin**2
1S ba
8
Кодирование: цели и способыТекст:
в Росии: Привет, Вася! Windows-1251: CFF0E8E2E52C20C2E0F1FF21 передача за рубеж (транслит): Privet, Vasya! стенография: шифрование: Рсйгжу-!Гбта”
Информация (смысл сообщения) может быть закодирована разными способами!
!
Числа: для вычислений: 25 прописью: двадцать пять римская система: XXV
Как зашифровано??
В процессе обмена информацией кроме кодирования информации происходит и ее декодирование:
Источник информации
Кодирующее устройство
Передача информации
Декодирующее устройство
Получатель информации
Пример: как создается новая мелодия
Запись композитором мелодии нотами
Образ мелодии
Передача исполнителю носителя с нотами
Перевод исполнителем нот в звуки
Прослушивание мелодии
Упражнение 4 (устно).
Девочка заменила каждую букву своего имени ее номером в алфавите. Получилось 141261. Как зовут девочку?
Код имени необходимо разделить следующим образом: 14-1-26-1. 14-М, 1-А, 26-Ш.
Имя - Маша
12
Двоичное кодирование
Двоичное кодирование – это кодирование всех видов информации с помощью двух знаков (обычно 0 и 1).
Передача электрических сигналов:
сигнал с помехамисигнал с помехами
время
U
«1»
«0»полезный сигнал
полезный сигнал
сигнал с помехамисигнал с помехами
5 В
U
1 0 1
времяполезный
сигналполезный
сигнал
13
Двоичное кодирование
• в такой форме можно закодировать все виды информации
• нужны только устройства с двумя состояниями• практически нет ошибок при передаче• компьютеру легче обрабатывать данные
• человеку сложно воспринимать двоичные коды
Можно ли использовать не «0» и «1», а другие символы, например, «А» и «Б»?
?
кодировщиккодировщик
числачисла
символысимволы
рисункирисунки
звукзвук
101011011101110110101101011011101110110101
Упражнение 4. Заполните таблицу:
Количество бит 1 2 3 4 5 6 7 8 9 10
Кодируемое количество сообщений
Двоичное кодирование
текстовой
информации
13.04.23
При вводе в компьютер текстовой информации каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.
Традиционно для кодирования одного символа используется количество информации, равное 1 байту (8 битам). Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255, а каждому десятичному коду соответствует 8-разрядный двоичный код от 00000000 до 11111111.Код символа хранится в памяти компьютера, где занимает 1 байт.При таком способе можно закодировать 256 различных символов (256 = 28).Такое количество символов достаточно для представления текстовой информации, включая прописные и заглавные буквы русского алфавита, цифры, знаки, графические символы и т. д.
18
Кодирование символов
Текстовый файл
• на экране (символы)
• в памяти – двоичные коды
10000012 10000102 10000112 10001002
В файле хранятся не изображения символов, а их числовые коды в двоичной системе!
!
65 66 67 68
А где же хранятся изображения?
Таким образом, компьютер различает символы по их коду. Присвоение символу конкретного кода является вопросом соглашения, которое фиксируется в конкретной кодовой таблице.В качестве международного стандарта принята кодовая таблица ASCII. В этой кодовой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке.Расположение цифр также упорядочено по возрастанию значений .
Стандартными в этой таблице кодов ASCII являются только первые 128 символов,т. е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111). Первые 33 кода (с 0 до 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и т.д.).Коды 33 до 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.
Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографикии научных символов.
В национальных кодировках одному и тому же коду соответствуют различные символы. К сожалению, в настоящее время существует 5 различных кодовых таблиц для русских букв, поэтому тексты созданные в одной кодировке, не будут правильно отображаться в другой.
22
Кодировка 1 байт на символ
0 1 254 255127 128
таблица ASCII (международная)
кодовая страница
ASCII = American Standard Code for Information Interchange0-31 управляющие символы:
7 – звонок, 10 – новая строка, 13 – возврат каретки, 27 – Esc.
32 пробелзнаки препинания: . , : ; ! ?специальные знаки: + - * / () {} []48-57 цифры 0..965-90 заглавные латинские буквы A-Z97-122 строчные латинские буквы a-z
Кодовая страница (расширенная таблица ASCII)для русского языка:
CP-866 для системы MS DOSCP-1251 для системы Windows (Интернет)КОИ8-R для системы UNIX (Интернет)
Хронологически одним из первых стандартов кодирования русских букв на компьютерах был код КОИ – 8 («Код обмена информационный – 8 битный»). Эта кодировка применяется в компьютерах с операционной системой UNIX.
Наиболее распространенная кодировка – это стандартная кириллистическая кодировка Microsoft Windows, обозначаемая сокращением CP1251 («CP» означает «Code Page»). Все Windows – приложения, работающие с русским языком, поддерживают эту кодировку.
Для работы в среде операционной системы MS-DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft – кодировка CP 866.
Фирма Apple разработала для компьютеров Macintosh свою собственную кодировку русских букв (Mac)
Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859 – 5.
1. КОИ-8 - UNIX
2. CP1251 («CP» означает «Code Page») - Microsoft Windows
3. CP 866 - MS-DOS
4. Mac - Macintosh
5. ISO 8859 – 5
Стандарты кодировок:Стандарты кодировок:
Таблица кодировки символовДвоичный
код Десятичный
кодКОИ8 CP1251 CP866 Mac ISO
0000 0000 0
………
0000 1000 8 Удаление последнего символа (клавиша Backspace)
………
0000 1101 13 Перевод строки (клавиша Enter)
………
0010 0000 32 Пробел
0010 0001 33 !
………
0101 1010 90 Z
………
0111 1111 127
……… 128 - Ъ А А К
………
1100 0010 194 Б В - - Т
………
1100 1100 204 Л М : : Ь
………
1101 1101 221 Щ Э - Ё Н
………
1111 1111 225 Ь я Нераз. пробел Нераз. пробел п
В последнее время появился новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и поэтому с его помощью можно закодировать не 256 символов, 216=65 536 различных символов. Эту кодировку поддерживает платформа Microsoft Windows&Office97.
31
Кодировка UNICODE (UTF-16)
•Windows, MS Office, …•16 бит на символ
• 65536 или 216 символов в одной таблице
можно одновременно использовать символы разных языков (Интернет)
размер файла увеличивается в 2 раза
Задание : определите символ по числовому коду.• Запустите программу БЛОКНОТ• Нажмите ALT и 0224 (на дополнительной
цифровой клавиатуре).
• Появится символ а.• Повторите эту операцию для числовых кодов
от 0225 до 0233.• Появятся символы в кодировке (CP 1251
Windows).• Запишите их в тетрадь.
Задание 2: определите символ по числовому коду.• Запустите программу БЛОКНОТ• Нажмите ALT и 161 (на дополнительной
цифровой клавиатуре).• Появится символ.• Повторите эту операцию для числовых кодов
160, 169, 226.• Появятся символы в кодировке (CP 866 MS-
DOS).• Запишите их в тетрадь.
- ; II # $ % & I ( ) * + » - /
. зз 34 35 36 3? 38 33 40 41 42 43 44 45 46 47
0 1 2 3 4 5 6 7 8 9 1 < = > 9
. 43 50 51 52 53 54 55 56 5? 58 59 60 61 62 63
■ А В С D Е F G н 1 J К L M N 0
•i 65 66 67 68 63
то
Т1 72 73 74 75 76 77 T8 79
р Q R S
т иV W X Y
z[ \ 3
л
ео 81 82 83 84 85 86 81 88 89 90 91 92 33 94 35
» а b С
ае f Я h j i k 1 m n О
96 зт 38 83 100 101 102 103 104 105 106 107 108 109 110 111
Р q Г S t U V W X У z { I } ~
112 113 1U 115 116 11Т 118 113 120 121 122 123 124 125 126