Curs9. Reprezentarea informatiilor

Curs de informatic (doctorat) Curs 9. Reprezentarea informaiilor Aurelia Prepeli (Profir), dr.,conf. univ. catedra Tehnologii de Programare, U.S.M. Cantitatea de informaie. Unitaile de msur a informaiei. Forme discrete de reprezentare a informaiei. Cuantificarea informaiei. Codificarea i decodificarea informaiei. Sisteme de numeraie. Sistemelebinar, octal, hexazecimal de numeraie. Convertirea datelor din sistemele binar, octal, hexazecimal n sistemul zecimal i invers. Convertirea datelor din sistemul binar n octal, hexazecimal i invers. Reprezentarea informaiilor Cuprins: Cantitatea de informaie. Unitaile de msur a informaiei. Informaia - notiune primara greu de definit. Informaie -tire, caracteristici, cunotine despre obiect, proces sau fenomen.Vom reprezenta o sursa de informatie printr-o variabil S ce poate lua diferite valori distincte {s1, s2, ...,sn }, denumite mesaje posibile. Exist surse cu mesaje continue i surse cu mesaje discrete.Mesajul aduce o clarificare privind starea unui proces care are mai multe stari. Mesajele pot fi continue sau discrete.

Data - forma de reprezentare a informatiei (data = forma;informatia = coninut (semantica)). Not. Date:logice: Adevarat/Fals, Inchis/Deschis, Pornit/Oprit numerice: intregi, nr. fractionare, nr.pozitive/negativealfanumerice: caractere, text multimedia: sunet, imagine (audio/video) date simple structuri de date Cantitatea de informaie. Unitaile de msur a informaiei. Exemple: Semaforul de circulatie poate fi considerat ca o sursa de informaie, mulimea de mesaje posibile ale caruia este {verde, galben, rosu}. Aparatul de telegrafiat reprezinta o sursa de informaie, mulimea de mesajelor posibile ale caruia este: literele A, B, C, ..., Z, cifrele 0, 1, 2, ..., 9 i semnele de punctuaie. Temperatura mediului nconjurtor poate primi o infinitate de valori ntr-un interval limitat (exemplu de mesaj continuu). Surs Canalde transmisie Destinatar Mesaje discrete sau continue Fig. 1. Schema unui sistem de transmisie a informaiei Cantitatea de informaie. Unitaile de msur a informaiei. Cantitatea de informaie - marime dependenta de gradul de dezordine al unui sistem, de numarul maxim de (mesaje) stri posibile (n). Cantitatea de informaie Ia unui mesaj emis de o surs S: I =logan, (1) undenestenumaruldemesajeposibilealesursei.Bazaa= numarul de simboluri folosite,se stabileste prin alegerea unitatii demasuraacantitiideinformaie.Cantitateadeinformaie se masoara cu etalonul (de obicei,se utilizeaza bitul). Un bit este cantitatea de informaie din mesajul unei surse cu numai doua mesaje posibile.ntrucit pentru sursa etalon n=2, din ecuatia (1): log 2 a = 1 (bit) obinem a=2. Formate binare de reprezentare Bit: Unitate binar de informaie (BInary digiT) unitatea elementara de informatie starea unui bistabil sau a unei celule elementare de memorie ce are 2 stri Octet (byte): grup de 8 biti unitatea elementara de adresare la cele mai multe calculatoare actuale (inclusiv Intel x86) poate reprezenta: o valoare numerica, un caracter (cod ASCII), un set de variabile (semnale) logiceCantitatea de informaie. Unitaile de msur a informaiei. 5,322404,32220 5,285394,24819 5,248384,17018 5,209374,08717 5,170364,00016 5,129353,90715 5,087343,80714 5,004333,70013 5,000323,58512 4,954313,45911 4,907303,32210 4,858293,1709 4,807283,0008 4,755272,8077 4,700262,5856 4,644252,3225 4,585242,0004 4,524231,5853 4,459221,0002 4,392210,0001 Log 2 nnLog 2 nn Tabelul 1.1 Valorile functiei log 2 n Cantitatea de informaie. Unitaile de msur a informaiei. Exemple. Cantitatea de informatie a unui mesaj de semafor, n=3, este: I =log 2 3 =1,585 bit. Cantitatea de informatie a unei litere alfabetului latin {A,B,C,..,Z}, n=26, este:

I =log 2 26 =4,700 bit. Cantitatea de informatie a unei litere a alfabetului grec {A,B,I,....,O}, n=24, este: I =log 2 24 =4,585 bit. Cantitatea de informaie. Unitaile de msur a informaiei. Cantitatea total de informaie V emis de surs se determin din relaia: V=N*I , unde N este numrul de mesaje transmise, Ieste cantitatea de informaie ce se conine ntr-un mesaj.Cantiti de informaie exprimate prin multiplii unui bit: 1 Kilobit (Kbit)=210=1024bii (~103bii); 1 Megabit (Mbit)=220=1048576bii (~106bii); 1 Gigabit (Gbit)=230~109bii; 1 Terabit (Tbit)=240~1012bii; 1 Petabit (Pbit)=250bii. Codificarea i decodificarea informaiei. Semn - un element al unei mulimi finite de obiecte distincte. Alfabet - o mulime liniar ordonat de semne. Exemple de alfabete: a) alfabetul cifrelor zecimale: 0, 1, 2, ..., 9; b) alfabetul literelor latine mari: A, B, C, ..., Z; Alfabete binare (semne binare sau cifre binare): cifrele {0,1}; Adevarat/Fals; Inchis/Deschis; Pornit/Oprit. Codificarea i decodificarea informaiei Un ir finit de m semne, dintre care unele se pot repeta,formeaz un cuvnt,m lungimea cuvntului.Cuvinte binare - cuvintele formate din semne binare.Cuvintele pot avea lungime variabil sau constant. n ultimul caz ele se numesc cuvinte m-poziionale.Exemple: 1-poziionale: {0,1}; 2-poziionale: {00, 01, 10, 11}; 3-poziionale: {000, 001, 010, 011, 100, 101, 110, 111}; 4-poziionale: {0000, 0001, , 1110, 1111}. Mulimea cuvintelor m-poziionale include 2m cuvinte distincte. Codificarea i decodificarea informaiei n calculatoarele numerice informaia se reprezint n formdiscret. Pentru reprezentarea, transmiterea, pstrarea irelucrarea mesajelor s1, s2, ...,snale sursei de informaie se utilizeaz cuvintele binare. Regula de transformare a mesajelor n cuvinte se numete cod, iar operaia respectiv codificare. Operaia invers codificrii se numete decodificare.Dispozitivele tehnice care realizeaz operaiile n cauz se numesc, respectiv, codificator i decodificator. SursCodificator Canalde transmisie Decodificator Destinatar Fig.2. Codificarea i decodificarea mesajelor n sistemele de transmisie a informaiei. Mesaje Cuvinte binareMesajeCuvinte binare Codificarea i decodificarea informaiei. S1 S2 0 1 S1 S2 S3 S4 S5 S6 S7 S8 000 001 010 011 100 101 110 111 S1 S2 S3 00 01 10 S1 S2 S3 S4 00 01 10 11 S1 S2 S3 S4 S5 000 001 010 011 100 S1 S2 S3 S4 S5 S6 S7 000 001 010 011 100 101 110 S1 S2 S3 S4 S5 S6 000 001 010 011 100 101 n=2, m=1n=3, m=2n=4, m=2n=5, m=3n=6, m=3 n=7, m=3n=8, m=3 Fig. 3. Coduri de cuvinte cu lungime constanta (coduri m-pozitionale). In figur sunt reprezentate tabelele respective pentru surse cu n=2, 3, 4, 5, 6, 7, 8 mesaje posibile. Codificarea i decodificarea informaiei. Operatiile de codificare i decodificare constau n extragerea datelor necesare din tabel. Decodificarea va fi univoca numai atunci cnd cuvintele binare incluse n tabel snt distincte. Acest lucru este posibil daca lungimea m a cuvintelor de cod satisface inegalitatea 2m n. Dupa logaritmare obtinem: m log2 n. Intrucit expresia log2 n exprima cantitatea de informatie, se poate afirma:Lungimea cuvintelor unui cod pozitional trebuie sa fie maimaresau egala cu cantitatea de informatie a unui mesaj. . Codificarea i decodificarea informaiei Exemplu. Lungimea cuvintelor pentru codificarea literelor mari ale alfabetului latin {A, B, C, ..., Z}, n=26 sedetermina din relatia:m log2 26 = 4,700. Pentru m=5obinem cuvinte binare ale codului 5 pozitional: A-00000 B-00001 C-00010 D-00011 E-00100 Z-11001. Cod propus de filozoful si omul de stat englez Francis Bacon n anul 1580. .

Informatia mesajelor continue Ce este un semnal digital ? Evaluarea cantitaii de informatie n mesajele continue. 012345678910u(t) [V]t012345678910u (t)[V]kt0 0 1 0 0 1 0 1 0 1 1 0 0 1 1 1ts.....................MEMORIESEMNAL ANALOGIC CONTINUUSEMNAL ANALOGIC ESANTIONATSEMNAL DIGITAL MEMORATCUATI FI CAREAInformatiamesajelorcontinuepoate fireprezentataprint-unsetde cuvintebinare.Operaiade transformare a mesajelor continue n eantioanesenumetediscretizare ntimpsaueantionare.Pentru aceasta,cuanteles1,s2,,snse codifica exact la fel ca i oricare alte mesaje discrete. Cel mai frecvent se utiluzeazacodurlenumericedirecte, cuvntulcodreprezentndnumarul cuantei respective.Dispozitivulcaretransformamesajulcontinuuaplicatlaintrare intr-osuccesiunedecuvintedecod senumeteconvertoranalog-numeric. s1 sn ... Informatia mesajelor continue

. Mrimea s reprezinta pasul sau intervalul de cuantificare (depinde de natura fizica a sursei de informatie. Meteorologie: t =1h, tehnic audio: t=5*10-5 s.). Numarul esantioanelor m si numarul cuantelor n se determina din urmatoarele relatii: ; 1 +A=tTm, 1min max+A=SS Snunde T este durata mesajului continuu. Intrucit cuantele s1, s2, ,sn pot fi considerate mesaje discrete,cantitatea de informatie intr-un esantion: , 1 log logmin max2 2||.|

\|+A= =SS Sn Iiar cantitatea de informatie intr-un mesaj continuu: . 1 log 1min max2||.|

\|+A|.|

\|+A= =SS StTmI VInformatia mesajelor continue

. . log 32n m m Iy x=Operatia inversa, i anume transformarea cuvintelor de cod aplicate la intrare n valorile cuantelor respective, se efectueaza cu ajutorul convertoarelor numeric-analogice.Imagine se numeste reprezentarea unui obiect, executata pe o suprafata prin actiunea directa a utilizatoruluisau prin intermediul unui echipament.ntucit culorile pot fi reprezentate prin suprapunerea a trei reprezentari ale aceleiasi imagini in rosu, verde si albastru, cantitatea de informatie dintr-o imagine color (desenele, fotografiile, televiziunea etc) se determina din relatia: Setul de cuvinte binare care reprezinta informatia microzonelor se numeste imagine numerica. Operatia de transformare a imaginii intr-un set de cuvinte binare se numeste cuantizarea imaginii. Cuantizarea imaginilor

In cazul imaginilor monocrone (alb-negru) fiecare zona se descrie prin luminanta sa i poate fi cuantificata. Numarul cuantelor n va caracteriza puterea de rezolutie a echipamentelor pentru producerea sau formarea imaginilor. Cantitatea de informatie a unei imagini monocrome: , log2n m m Iy x=unde mx si my reprezinta numarul de microzone ale rastrului pe orizontala i respectiv pe verticala. O Imagine se mparte n microzone (puncte sau pixeli). Descompunerea unei imagini in pixeli se realizeaza cu ajutorul unui rastru. Rastrul reprezinta o suprafata plana, in general dreptunghiulara, pe care sunt trasate doua seturi de linii paralele, perpendiculare nre ele. Cuantizarea imaginilor

Densitatea liniilor si, respectiv, densitatea punctelor caracterizeaza puterea de rezoluie a echipamentelor pentru reproducerea sau formarea imaginilor. Rastrul vizualizatorului: 640x480, 800x600, 720x400, ..., 1024x1024 de puncte.Imaginile obiectelor n miscare se discretizeaza n timp, de obicei 24(cinematograful), sau 25(televizorul) de cadre pe secunda. Prin urmare cantitatea de informaie a unui film cu durata T se determina din relatia:V=T*f*I, unde f este frecvena cadrelor, iar I cantitatea de informatie dintr-un singur cadru. 25 , 32 , 625 = = = ~ f n m my xUn cadru va contine: n televiziune . 5 , 5 32 log 625 625 32Mbit I ~ =cadre pe secunda. Un film color cu durata de 1,5 ore va conine: V=1,5*3600*25*I = 791 Gbit. Sisteme de numeratie . ... , ...2 1 0 1 1 m n nc c c c c c c N =Sistemele n care semnificatia cifrelor depinde de pozitia ocupta in cadrul numerelor se numesc sisteme de numeratie pozitionale.Presupunem ca nr. N are partea intreaga din n+1 cifre, iar partea fractionara din m cifre.Valoarea acestui numar se evalueaza n functie de baza sistemului dupa cum urmeaza: ( ) . .... .....2211001111mmnnnn bb c b c b c b c b c b c b c N+ + + + + + + + =a) scrierea sub form de sum de puteri ale lui 22310 =16+ 0 +4 +2 +1= 1x24 + 0x23 + 1x22 + 1x21 + 1x20 2310 = 1 0 1 1 12 b) diviziunea repetat cu 2 25 : 2 = 12 rest 1 LSB - cel mai puin semnificativ bit 12 : 2 = 6rest0 6 : 2 = 3rest0 3 : 2 = 1rest1 1 : 2 = 0 rest1 MSB - cel mai semnificativ bit

2510 = 1 1 0 0 12conversia zecimal-binar Conversia numerelor dintr-un sistem in altul (10->2) Conversia numerelor dintr-un sistem in altul (10->2) Exemplu. Sa se transforme numarul zecimal 53,40625 n echivalentul binar: 53 : 2 = 26 + 1\2; 26 : 2 = 13 + 0\2; 13 : 2 = 6 + 1\2; 6 : 2 = 3 + 0\2; 3 : 2 = 1 + 1\2; 1 : 2 = 0 + 1\2; Partea ntreaga a numarului binar va fi: 110101. 0,40625 x 2 = 0,8125; 0,8125 x 2 = 1,625; 0,625 x 2 = 1,25; 0,25 x 2 = 0,5; 0,5 x 2 = 1; Partea fractionara a numarului binar va fi: 01101. (53,40625)10 = (10111,101100)2. Conversiunea numarului 1996,0625 din sistemul zecimal n sistemul octal: 1996 : 8 = 249 + 4\8 249 : 8 = 31 + 1\8 31 : 8 = 3 + 7\8 0,0625 x 8 = 0,5 0,5 x 8 = 4Prin urmare, (1996,0625)10 = (3714,04)8. Conversia numerelor dintr-un sistem in altul (10->8) Conversia numerelor dintr-un sistem in altul (10->16) Sa se transforme numarul 2914,25 din sistemul zecimal nhexazecimal: 2914 : 16 = 182 + 1\16; 182 : 16 = 11 + 6\16; 11 : 16 = 0 + 11\16; 0,25 x 16 = 4 Prin urmare (1914,25)10 = (B62,4)16. Conversii dintr-o baza n alta (regulile de conversie) conversia partii intregi: prin divizare succesiva cu noua baza: exemplu din baza 10 in baza 2: 303010 = 111102 0,48 0,4810=0,0111...2 15rest 00,96rest 0 7rest 11,83rest 1 3rest 11,66rest 1 1rest 11,32rest 1 conversia partii fractionare: prin inmultire succesiva cu noua baza atentie!!!, conversia nu este precisa (univoca) Conversia numerelor dintr-un sistem in altul Conversiunea numarului zecimal (N)10 n echivalentul sau nbaza b se efectueaza conform urmatoarelor reguli: -Se mparte la baza respectiva partea ntreaga i cturile obtinute dupa fiecare impartire, pina cnd se obtine citul 0; rezultatul conversiunii parii intregi este constituit din resturile obtinute, considerate din ordinea inversa in aparitie.-Se nmulteste cu baza partea fractionara, apoi toate partile fractionare obtinute din produsul anterior, pina cind partea fractionara a unui produs = 0 sau pina la obtinerea unui numar de cifre fractionare dorit; rezultatul conversiunii partii fractionare este construit din partile intregi ale produselor, considerate in ordinea aparitiei. ... 23 22 21 20 2-1 2-2 2-3 ... 1 01 1 1 0 1 ponderi poziionale punctbinar cel maisemnificativ bit cel maipuin semnificativbit(MSB) (LSB)BinarCorespondentul zecimal Ponderea 23 = 822 = 421 = 220 = 1 00000 00011 00102 00113 01004 01015 01106 01117 10008 10019 101010 101111 110012 110113 111014 111115 1011.1012 == 1x23 +0x22 +1x21 + 1x20 + 1x2-1 + 0x2-2 +1x2-3 = (8 + 0 + 2 + 1),(0,5 + 0 + 0,125) = 11,62510

Conversia binar zecimal (2->10) ... 83 82 81 80 8-1 8-2 8-3 ... 307 6 5 2 4 ponderi poziionale punctoctal cel maipuin semnificativbit(MSB) (LSB)Sistemul octal (se folosesc8 cifre: 0, 1, 2, ... , 7) cel maisemnificativ bit conversia octal-zecimal: 3728 = 3x82 + 7x81 + 2x80

= 3x64 + 7x8 + 2x1 = 25010 conversia zecimal-octal 266 : 8 = 33rest2LSB 33 : 8 = 4rest1 4 : 8 = 0rest4MSB 26610 = 4128 Conversia numerelor dintr-un sistem in altul (8->10; 10 ->8) HexazecimalZecimalBinar 000000 110001 220010 330011 440100 550101 660110 770111 881000 991001 A101010 B111011 C121100 D131101 E141110 F151111 Conversia hexazecimal-zecimal i zecimal hexazecimal(10->16, 16->10) 2AF16 = 2x162 + 10x161 + 15x160 = 512 + 160 + 15 = 68710 423 : 16 = 26 rest7LSB26 : 16 = 1rest10 A 1 : 16 = 0rest1 MSB 42310 = 1A716 Digit octal01234567 Echivalentul binar000001010011100101110111 Conversia octal-binar i binar-octal 4728 472 100 111010 4728 = 100 111 0102 011010110

326 110101102 = 3268 binar-octal octal-binar110101102 (011)(010)(110)2 Conversia binar hexazecimal (2->16) 4 cifre binare = 1 cifra hexa(zecimala) 101 0 1 110 10 1 10000 2BA C Codificarea informatiilor Ce se urmareste: reprezentarea coerenta, univoca a informatiilor in vederea stocarii, transmiterii si a prelucrarii acestora utilizarea eficienta a spatiului alocat (spatiu minim) detectia (si corectia) erorilor facilitarea(simplificarea) operatiilor de prelucrare, stocare si transmitere securizarea datelor Cum se realizeaza: prin metode/algoritmi/standarde de codificare depinde de tipul de informatie care se codifica Formate binare de reprezentare Bit: binary digit; unitatea elementara de informatie starea unui bistabil, sau a unei celule elementare de memorie Octet (byte): grup de 8 biti unitatea elementara de adresare la cele mai multe calculatoare actuale (inclusiv Intel x86) poate reprezenta: o valoare numerica, un caracter (cod ASCII), un set de variabile (semnale) logiceFormate binare de reprezentare Octet (continuare) D7 - bitul cel mai semnificativ D0 - bitul cel mai putin semnificativ Cuvant (word) D15-D8 - octetul superior (High) D7-D0 - octetul inferior (Low) - folosit pt. reprezentarea intregilor, simpla precizie 76543210151413121110 98 76543210 Formate binare de reprezentare Dublu-cuvant (double word): 32 biti, 4 octeti, 2 cuvinte D31-D16 cuvantul superior D15-D0 cuvantul inferior folosit pentru reprezentarea numerelor in virgula fixa (dubla precizie la sistemele pe 16 biti) sau in virgula flotanta31...... 2423...... 1615...... 87...... 0 Formate binare de reprezentare Cuadruplu-cuvant (quad-word) 64 de biti, 8 octeti, 4 cuvinte, 2 dublucuvinte folosit pentru reprezentarea numerelor in virgula fixa (dubla precizie pt. sist. pe 32 biti) si in virgula flotanta Formate extinse: 80 de biti - pt. reprezentarea numerelor in virgula flotanta (formate interne/intermediare) 630 Reprezentarea numerelor numere pozitive: intervalul de reprezentare:[0.. 2n-1], unde n - nr. de biti numere negative: mai multe metode de reprezentare (codificare): MS, C1, C2 intervalul de reprezentare: [-(2n-1-1) ... (2n-1-1)] bitul cel mai semnificativ - bit de semn: 0 - numar pozitiv 1 - numar negativ Reprezenzarea n virgul fix Reprezentarea n virgul fix poate fi efectuat n trei forme de baz: Prin mrire i semn (cod direct); Prin compliment fa de 1 (cod invers); Prin complement fa de 2 (cod complementar). Toate aceste forme pentru numerele pozitive folosesc una i aceeai reprezentare, care coincide cu macheta:

Reprezenzarea n virgul fix a) numere pozitive00101110+46 b) cod direct10101110-46 c) cod invers11010001-46 d) cod complementar11010010-46 Reprezentarea intern a numerelor +46 i -46 n virgul fix. Reprezentarea n cod complementar a numerelor negative se efectueaz prin scrierea lor n codul invers i apoi adugnd cifra 1 la cifra cea mai puin semnificativ a numrului.Aritmetica in complement fata de 2 7+ 0000.0111+ 7+ -10 1111.0110246 -3 1111.1101253 in C2 operatiile aritmetice sunt identice cu aritmetica numerelor pozitive -> la reprezentarea numerelor negative trebuie sa se precizeze lungimea de reprezentare pt. cresterea lungimii de reprezentare: Extensia de semn 11 11110 1 11111111 Reprezentarea in virgula flotanta scopul: reprezentarea numerelor foarte mari si foarte mici forma de reprezentare: semn, caracteristica si mantisa simpla precizie: 32 de biti 1 Semn, 8 Caracteristica, 23 Mantisa dubla precizie: 64 de biti 1 Semn, 11 Caracteristica, 52 Mantisa caracteristica = exponent + 1/2 (domeniu_exponent) SCaracteristicaMantisa 1 c mReprezentarea in virgula flotanta Formatul reprezentarii: numarul de biti campuri: semn, mantisa, caracteristica SCaracteristica Mantisa SCaracteristica (C)Fracie mantis (f)Total simpl precizie182332 dubl precizie1115264 dubl. precizie extins1158096 quadrupl precizie115112128 Reprezentarea in virgula flotanta Forma de reprezentare Numar de pozitii binare

Domeniu de reprezentare (+_)

Total Caracte ristica Fractie mantisa Cel mai mic numar pozitiv Cel mai mare numar pozitiv Simpla precizie32823 Dubla precizie641152 Dubla precizie extinsa961580 10-38 1038 10-308 10308 10-4932 104932 Bibliografie Ion Bolun, Ion Covalenco. Bazele informaticii aplicate. Editura ASEM, Chiinu, 1999. Anatol Gremalschi, Iurie Mocanu, Ludmila Gremalschi. Informatica. Structura calculatorului. Manual pentru clasa a X-a. Editura tiina, Chiinu, 2004. Www.intel.com pt. procesoare Intel

Documents

Curs9. Reprezentarea informatiilor