49
La codifica dell’informazione La sicurezza informatica Le basi di dati Fondamenti di Informatica La rappresentazione dei dati per le scienze umane Cazzaniga Paolo Dip. di Scienze Umane e Sociali [email protected] Dott. Cazzaniga Paolo Fondamenti di Informatica

La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

  • Upload
    vanlien

  • View
    223

  • Download
    0

Embed Size (px)

Citation preview

Page 1: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

Fondamenti di InformaticaLa rappresentazione dei dati per le scienze umane

Cazzaniga Paolo

Dip. di Scienze Umane e [email protected]

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 2: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

Outline

1 La codifica dell’informazioneLa rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

2 La sicurezza informatica

3 Le basi di dati

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 3: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Outline

1 La codifica dell’informazioneLa rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

2 La sicurezza informatica

3 Le basi di dati

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 4: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Codifica dell’informazione

Trattare l’informazione:rappresentare i dati su un supporto fisico con sequenze disimboli che codificano l’informazioneil supporto fisico viene sottoposto a una trasformazione chemodifica i datii dati ottenuti vengono decodificati generando nuovainformazione

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 5: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Codifica dell’informazione

Perché nei calcolatori tutte le informazioni sono codificate in binario?

I calcolatori moderni:dispongono di supporti fisici bistabili:

memoria centrale (RAM)memoria di massa (disco fisso)

possono rappresentare le informazioni tramite bitqualsiasi tipo di informazione è codificato con sequenze di 0 e 1:

numericatestualegraficasonora

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 6: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Codifica dell’informazione

Esiste un’area di ricerca della Information and CommunicationTechnology che ha come obiettivi principali:

definire tecniche per codificare secondo il sistema binario nuovitipi di informazione (rendendoli quindi trattabili dai calcolatori)definire tecniche di codifica efficienti

minimizzare il numero di simboli utilizzatidiminuire la dimensione dell’informazione (maggiore quantità didati memorizzati e maggiore velocità di trasmissione)

definire tecniche di codifica efficacirendere l’informazione più semplice da trattare da parte di algoritmi(e programmi)

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 7: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Le rappresentazioni non posizionali

Il sistema di numerazione romanosistema additivoè composto da un insieme di simboli letterari a cui vieneassociato un valore numericoun numero è rappresentato da una sequenza di simboli letterariil valore di un numero è dato dalla somma dei valoricorrispondenti ai simboli della sequenza

Il numero romano VIII, composto dai simboli V (=5) e I (=1),rappresenta il numero decimale 8 = 5 + 1 + 1 + 1

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 8: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Le rappresentazioni non posizionali

Nel Medioevo è stata introdotta una notazione più compatta

alfabeto: I, V, X, L, C, D, Mi valori corrispondenti sono: 1, 5, 10, 50, 100, 500, 1000i simboli I, X, C, M possono essere ripetuti fino a 3 volteconsecutive (VIII)i simboli V L D non possono essere ripetuti in sequenzai simboli scritti in ordine decrescente vengono valutati sommandoil loro valorese una coppia di simboli è scritta in ordine crescente, il valore delprimo viene sottratto dal secondouna barra sopra un simbolo ne moltiplica il valore per milledue barre laterali e una sopra un simbolo indicano che il suovalore è moltiplicato per 100.000

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 9: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Esempi di numeri romani

XXVII = 10 + 10 + 5 + 1 + 1 = 27MMVIII = 1000 + 1000 + 5 + 1 + 1 + 1 = 2008IV = 5 - 1 = 4MCMXCIX = 1000 + (1000 - 100) + (100 - 10) + (10 - 1) = 1999

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 10: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

La rappresentazione dei numeri

La notazione posizionale decimale

la cardinalità dell’alfabeto utilizzato è 10i simboli sono le cifre: 0,1,2,3,4,5,6,7,8,9

L’aggettivo posizionale indica che ogni cifra assume un diverso ruoloa seconda della posizione in cui si trova

in un numero naturale si hanno (partendo da destra): unità,decine, centinaia, migliaia, . . .ogni cifra è moltiplicata per una potenza di 10 (partendo dadestra): 100, 101, 102, . . .

10 è la base del nostro sistema di rappresentazione numericaposizionale.

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 11: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

La rappresentazione posizionale decimale

Il numero 7529 è definito da 7 migliaia, 5 centinaia, 2 decine, 9 unità

o in maniera equivalente:

7529 = 7 · 103 + 5 · 102 + 2 · 101 + 9 · 100

Con 4 cifre si possono esprimere 104 numeri naturali:{0, . . . ,9999} ovvero {0, . . . ,104 − 1}...e con n cifre? 10n numeri {0, . . . ,10n − 1}

Utilizzando il separatore decimale (la virgola “,”) si possonorappresentare i sottomultipli delle unità (decimi, centesimi, millesimi)

Il numero 36,482 equivale al somma di 3 decine, 6 unità, 4 decimi, 8centesimi, 2 millesimi

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 12: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

I sistemi posizionali non decimali

Scegliendo un qualsiasi numero b > 1 è possibile rappresentarequalsiasi numero con notazione posizionale in base b, scegliendo bcifre da moltiplicare per le potenze di b

Con n cifre in base b si possono rappresentare bn numeri naturali{0, . . . ,bn − 1}

Quando si indicano numeri in una base diversa da 10 è necessariospecificare la base usata:

14348 è ottale14345 è in base 51434 è decimale

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 13: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

I sistemi posizionali non decimali

E’ ovvio che la stessa sequenza di cifre in basi diverse indica numeridiversi

14348 = 1 · 83 + 4 · 82 + 3 · 81 + 4 · 80 = 796Anche la pronuncia dei numeri cambia

1434 = millequattrocentotrentaquattro14348 = ottale: uno, quattro, tre, quattro

Il sistema esadecimale (base 16, noto in ambito informatico) utilizzaoltre alle cifre 0, . . . ,9 la lettera A per il 10, B per l’undici, . . . , F per il15

1B6FH = 1 · 163 + 11 · 162 + 6 · 161 + 15 · 160 = 7023

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 14: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

La codifica binaria

E’ la codifica usata nei calcolatori

Viene usata una notazione binaria posizionale, i bit 0 e 1 vengonomoltiplicati per le potenze di 2

100101012 = 1 · 27 + 0 · 26 + 0 · 25 + 1 · 24++0 · 23 + 1 · 22 + 0 · 21 + 1 · 20 = 149

Con n bit si possono esprimere 2n numeri naturali (da 0 a 2n − 1)

Con 8 bit, un byte, si possono esprimere 28 = 256 numeri naturali

Con 4 bit, un nibble, si possono esprimere 24 = 16 numeri naturali

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 15: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

La codifica binaria

Sappiamo come si trasforma un numero binario in decimale

Come si fa la trasformazione inversa? Da decimale a binario

al primo passo il dividendo è il numero da convertiresi divide sempre per dueai passi successivi il dividendo è dato dal quoziente delladivisione precedenteil processo termina quando il dividendo è nulloal termine, la sequenza dei resti delle divisioni, trascritti in ordineinverso rispetto a come sono stati generati, costituisce il numerobinario

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 16: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

La codifica binaria

Ad esempio 149 corrisponde a 100101012:149/2 = 74 resto 174/2 = 37 resto 037/2 = 18 resto 118/2 = 9 resto 09/2 = 4 resto 14/2 = 2 resto 02/2 = 1 resto 01/2 = 0 resto 1

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 17: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Codifica analogica e digitale

Codifica analogicarichiede l’individuazione di una grandezza analogaad ogni variazione della prima deve corrispondere unavariazione della seconda

Codifica digitalerichiede l’introduzione di un alfabeto di simbolirichiede regole di codifica per associare una grandezza a unasequenza di simboli

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 18: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Codifica analogica e digitaleEsempio: rappresentazione della quantità di caramelle

analogica: numero di sassolini corrispondente (diciotto sassoliniper diciotto caramelle)digitale: notazione numerica decimale posizionale (la sequenzadi simboli 18)

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 19: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Codifica analogica e digitale

Pro e Control’approccio digitale è più compatto

18453 è meno ingombrante di diciottomilaquattrocentocinquantatresassolini

la codifica analogica contiene meta-informazioniordinale: relazioni d’ordine tra valorimetrico: quantificare le differenze tra valori

analogicotre sassolini rappresentano un valore maggiore di un sassolinotogliendo tre sassolini da un mucchio di cinque ne restano due

digitalesenza regole di codifica non posso sapere chi è il maggiore tra 13e 31non posso sapere che la differenza tra 5 e 3 equivale a 2

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 20: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Grandezze discrete e continue

Grandezze discrete: valori appartenenti all’insieme dei numerinaturaliGrandezze continue: valori appartenenti all’insieme dei numerireali

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 21: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Quantizzazione

Se un valore continuo viene rappresentato con una codificadigitale allora è necessario discretizzarloLa rappresentazione discreta (a gradini) prevede un processo diquantizzazione, caratteristica intrinseca di tutte le codifichedigitaliLa quantizzazione prevede l’individuazione di un numero finito diintervalli e tutti i diversi valori all’interno dello stesso intervallovengono rappresentati con la stessa sequenza di simboli

Nella rappresentazione della temperatura fino ai decimi di grado letemperature 37,51 e 37,54 vengono rappresentate con la stessasequenza di simboli 37,5

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 22: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Campionamento

Per rappresentare l’andamento nel tempo di una grandezzacontinua, usando una codifica digitale, è necessario effettuare uncampionamentoSi divide l’intervallo di osservazione del fenomeno insottointervalliIl valore viene rilevato in un istante predefinito (ad es. all’iniziodel sottointervallo)La frequenza di campionamento è definita come numero dicampioni per unità di tempo

Una frequenza di 7Hz indica che ogni secondo vengono rilevati 7campioni

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 23: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Quantizzazione e campionamento: pro e contro

La quantizzazione porta ad una approssimazione dei valori37,51 e 37,54 −→ 37,5

Anche il campionamento porta ad una approssimazione

0

0.5

1

1.5

2

0 1 2 3 4 5 6 7 8

Quanti

ta'

Tempo

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 24: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Quantizzazione e campionamento: pro e contro

La quantizzazione porta ad una approssimazione dei valori37,51 e 37,54 −→ 37,5

Anche il campionamento porta ad una approssimazione

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

0 1 2 3 4 5 6 7 8

Quanti

ta'

Tempo

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 25: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

La trasmissione dell’informazione digitale

La codifica digitale ha avuto grande successo grazie all’avvento deicalcolatori

I messaggi digitali sono più facili da trasmettere rispetto a quellianalogici

Se la codifica è binaria, avendo solo 2 valori ammissibili, è facilecapire se ci sono stati errori di trasmissione (scostamento daivalori 0 e 1 causati dal rumore)Per individuare gli errori, trasmettitore e ricevitore possonoconcordare meccanismi di ridondanza

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 26: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Schemi di ripetizione

Ogni bit viene trasmesso più volte:il messaggio viene scomposto in blocchi di bit (byte o nibble)ogni blocco viene ripetuto più volte

Il messaggio binario 011011101100 può essere scomposto neiblocchi 0110 0111 1100

Il messaggio verrà inviato come segue: 0110 0110 0111 0111 11001100

Se viene ricevuta la sequenza 0110 0111 0111 0111 1000 1100

Vengono individuati 2 errori MA non possono essere corretti, quindi ilmessaggio deve essere inviato di nuovo

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 27: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Controllo di parità

Viene contato il numero di bit 1 presenti nei blocchi del messaggiose il blocco contiene un numero dispari di 1, viene aggiunto unbit di parità a 1se il blocco contiene un numero pari di 1, viene aggiunto un bit diparità a 0

Per trasmettere il messaggio 0110111011001010, dopo ogni byteviene aggiunto il bit di parità

01101110 seguito da un bit di parità a 1 (perché il numero di bit a 1nel byte è dispari)11001010 seguito da un bit di parità a 0 (perché il numero di bit a 1nel byte è pari)

e gli errori di trasmissione? gli errori singoli vengono identificati, MAse cambiano 2 bit nello stesso byte, il messaggio risulta corretto. Inogni caso gli errori non possono essere corretti dal ricevente

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 28: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

L’informazione non numerica

Codice : sequenza di simboli impiegati per rappresentaresinteticamente oggetti del mondo reale

numero di matricola (cifre decimali - lunghezza variabile)codice fiscale (alfanumerico - 16 caratteri)codice catastale (alfanumerico - 4 caratteri)partita IVA (11 cifre)codice ISBN – International Standard Book Number (11 cifre)numero di telefonocodice IBAN – International Bank Account Number (alfanumerico- 27 caratteri)

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 29: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

L’informazione non numerica

La comunicazione di informazioni codificate è possibile solo semittente e destinatario concordano il tipo di codifica

Nei calcolatori tutti i codici sono costituiti da sequenze di bit

Quante sequenze posso esprimere con n bit? 2n

Quanti bit servono per codificare i giorni della settimana?3 bit→ 23 = 8 sequenze (una resta inutilizzata)

lunedi = 000martedi = 001mercoledi = 010giovedi = 011venerdi = 100sabato = 101domenica = 110

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 30: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Il testoLa codifica del testo viene realizzata associando un codice binario adogni singolo carattere

ASCII - American Standard Code for Information InterchangeOgni carattere è rappresentato da una sequenza di 7 bitE’ stato adottato dall’ISO - International Organization forStandardization

ASCII estesousa una codifica a 8 bitISO ha rilasciato diverse versioni di ASCII esteso

ISO 8859-1 (detto Latin1) che contiene i caratteri dei linguaggidell’Europa occidentaleISO 8859-2 che contiene i caratteri dei linguaggi dell’Europa orientaleISO 8859-5 che contiene i caratteri cirillici

Unicodeusa una codifica a 21 bit - 2 milioni di carattericomprende ASCII esteso (Latin1), caratteri di lingue vive e morte,ideogrammi, Braille; simboli matematici, chimici, cartografici

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 31: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Il testo

E’ necessario distinguere i file memorizzati nella memoria delcalcolatore a seconda del tipo di codifica utilizzato

File txt (SO Windows) - contengono esclusivamente caratteriFile doc (Microsoft Word o OpenOffice Writer) - contengono iltesto e le informazioni sulla formattazione

fontallineamentodimensione delle pagineintestazioni e piè di paginasommario...

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 32: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Il testo

File scritti con linguaggi di marcatura (markup language)HTML - pagine ipertestuali (in Internet costituiscono il World WideWeb)ODT e DOCX - documenti di testo basati su XMLSBML Systems Biology Markup Language

RTF (SO Windows) - sviluppato per supportare lo scambio ditesto tra sistemi e applicazioni (contiene codici di controllo)PostScript - linguaggio di programmazione che consente didescrivere l’impaginazione (diffuso in editoria)PDF (Portable Document Format) - sviluppato da Adobe SystemIncorporated è diventato standard ISO

molto comune per la diffusione di documenti su Internet

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 33: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Le immagini

Metodi di campionamento sono utilizzati anche per larappresentazione di immagini

I dispositivi di acquisizione delle immagini effettuano una codificacampionando l’immagine in una bitmapLa bitmap è una matrice di pixel (picture element)Ogni pixel assume un colore specificato nella codifica

La qualità dell’immagine dipende dalla dimensione dei pixelgrossi→ immagine sgranatapiccoli→ immagine fedele all’originale

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 34: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Le immagini

Anche i metodi di quantizzazione sono utilizzati anche per larappresentazione di immagini

La quantizzazione viene usata per rappresentare i coloriLa profondità di colore (color depth) è il numero di bit usato perrappresentare il colore dei pixelIn un’immagine monocromatica in bianco e nero il colore deipixel viene codificato con un bit (0 nero, 1 bianco)In un’immagine in tonalità di grigio si possono usare 8 bit perrappresentare le 256 tonalità di grigio

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 35: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Le immaginiPer rappresentare i colori vengono combinati alcuni colori primari suvari livelli di intensità

Modelli sottrattivi - a partire dal colore biancoCMYK (Cyan, Magenta, Yellow and Key) - il nero è stato aggiuntoperchè combinando ciano, magenta e giallo si ottiene il marrone

Modelli additivi - a partire dal colore neroRGB (Red, Green, Blue - detto truecolor) - usato nel video delcalcolatore. Non è propriamente additivo perchè ogni pixel è divisoin 3 parti, e la combinazione di rosso, verde e blu dà il coloredesiderato

E’ chiaro che codifiche diverse portano ad ottenere immagini didimensione diversePer un’immagine di 1024×768 pixel:

Monocromatica: 1024 × 768 = 786432 bit = 98304 byte ' 100KBTonalità di grigio: 786432 byte ' 800 KBRGB: 2359296 byte ' 2.3 MB

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 36: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Formato dei file immagini

Formato rasterJPEG (Joint Photographic Experts Group): truecolor,compressione lossyGIF (Graphics Interchange Format): massimo 256 colori,compressione losslessBMP (Windows Bitmap): formato non compresso di WindowsTIFF (Tagged Image File Format): famiglia di formati chesupporta la compressione lossy e losslessPNG (Portable Network Graphics): truecolor, compressionelossless

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 37: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Formato dei file immagini

Formato vettorialerappresentazione tramite primitive geometriche codificate inequazioni matematicheCGM (Computer Graphics Metafile)SVG (Scalable Vector Graphics)WMF (Windows Metafile)

Per riprodurre le immagini vettoriali è necessario un processo dirasterizzazione che permette di sfruttare meglio la risoluzione dellaperiferica usata, ottenendo migliore qualità

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 38: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

Formato dei file immagini

Anche per la visualizzazione dei caratteri:font bitmap o raster: caratteri come matrici di pixelfont outline o vettoriali: rappresentazione vettoriale dei caratteri

PostScript Type 1PostScript Type 3TrueTypeOpenType

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 39: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

I suoni

La codifica binaria di suoni viene tipicamente fatta seguendo lecaratteristiche tipiche dei CD audio:

stereofonia: due segnali che riproducono la distribuzionespaziale delle sorgenti sonorefrequenza di campionamento: 44100 Hzquantizzazione: 65536 livelli (codifica a 16 bit)

I formati audio:WAV (Waveform Audio Format) e AIFF (Audio Interchange FileFormat) formati non compressiMP3 (MPEG-1 Audio Layer 3) formato con compressione lossyAAC (Advance Audio Coding) formato con compressione lossycon qualità migliore di MP3 (è il formato standard di Apple e delleconsole Sony e Nintendo)

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 40: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

I filmati

I filmati digitali sono composti da una serie di fotogrammi (immaginidigitali) mostrati a una frequenza costante (FPS - frame per second)

I formati video:QuickTime: sviluppato da AppleMPEG-2: usato per DVD e Bluray, usa compressione lossy siaper il video che per l’audioFLV (flash video) sviluppato da Macromedia e supporato daAdobe per la fruizione di filmati in Internet (YouTube, GoogleVideo, ...). Usa compressione lossyAVI (Audio Video Interleave) è un contenitore di file che possonoessere codificati in vari formati tramite codec

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 41: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

La compressione

Processo che consiste nella riformulazione del contenuto informativocon una codifica differente che permette di ridurne le dimensioni

Compressione lossless (senza perdita) - WinZip per Windows eGunZip per Linux. Il processo di compressione è reversibile

il rapporto di compressione e la riduzione dell’occupazione dispazio dipendono dal tipo di formato dei dati

Compressione lossy (con perdita) - parte delle informazioniviene persa irreversibilimente

immagini: viene cambiato il colore di alcuni pixel - difficilmenterilevabile dall’occhio umanoaudio: modelli psicoacustici - vengono tolte frequenze molto alte(basse) o suoni a basso volumevideo: anziché memorizzare tutti i frame, vengono memorizzatesolo le differenze tra frame consecutivi

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 42: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

Outline

1 La codifica dell’informazioneLa rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

2 La sicurezza informatica

3 Le basi di dati

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 43: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La legge sulla privacy

La legge individua una serie di misure minime di sicurezza:autenticazione informatica tramite credenziali (dimostrazione diconoscenza, possesso, caratteristiche fisiche)procedure di gestione delle credenziali: lunghezza minima edurata delle password, regolamentazione dell’attivazione,disattivazione, conservazione, ...aggiornamento periodico dell’individuazione dell’ambito deltrattamento consentito ai singoli incaricati e addettiprotezione degli strumenti e dei dati: dispositivi HW e SW per laprotezione contro software maligniprocedure per la custodia di copie di sicurezza, backup eripristino, disaster recoverystesura di un aggiornato documento programmatico sullasicurezza

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 44: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La sicurezza dei dati

riservatezza (privacy): protezione da letture non autorizzateintegrità: protezione da modifiche non autorizzate, per latrasmissione di dati:

autenticità: garanzia dell’identità della sorgente, del destinatario edel contenuto del messaggionon ripudiabilità: garanzia che la sorgente non possa negare diavere inviato un messaggio e che il destinatario non l’abbia ricevuto

disponibilità: protezione da interventi non autorizzati checompromettano la possibilità di accesso ai dati da parte degliutenti autorizzati

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 45: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La crittografia

La crittografia è una tecnica usata per garantire la riservatezza deidati durante la trasmissione. E’ quindi molto importante in ambito ICTe Internet

Algoritmi crittografici a chiave segreta (crittografia simmetrica)tramite un algoritmo di cifratura, il mittente trasforma un messaggioin chiaro in un messaggio cifratoil destinatario è in grado di rigenerare il messaggio originale tramiteun algoritmo di decifraturase il messaggio viene intercettato, anche conoscendo l’algoritmo didecifratura, senza la chiave segreta risulta essere illeggibile

La trasmissione della chiave segreta è critica, se questa vieneintercettata, la riservatezza è compromessa!

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 46: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

La crittografia

Algoritmi crittografici a chiave pubblica (crittografia asimmetrica)prevedono una coppia di chiavi, la conoscenza della prima nonconsente di calcolare la secondal’algoritmo di cifratura usa una delle chiavi e quello di decifratural’altraogni persona in possesso della chiave pubblica può cifrare imessaggi e inviarlisolo la persona in possesso della chiave privata può decifrare imessaggi

Gli stessi algoritmi possono essere usati per la firma elettronicagarantendo:

riservatezza, autenticità, integrità e non ripudiabilità

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 47: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

Outline

1 La codifica dell’informazioneLa rappresentazione dei numeriL’informazione quantitativaLa rappresentazione binaria di informazione non numericaLa compressione

2 La sicurezza informatica

3 Le basi di dati

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 48: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

Le basi di dati

Basi di dati (DB, data base) sono grandi collezioni strutturate di daticon le seguenti caratteristiche:

rappresentazione efficace in un singolo contenitore logico,conservazione affidabile, fruizione efficiente di tutte leinformazionievitare frammentazione, ridondanza e inconsistenza dei datievitare accessi non autorizzati

La gestione viene fatta tramite sistemi di gestione di DB (DataBaseManagement System, es. Oracle, SQL Server):

DDL (Data Definition Language): definire strutture dati e relazioniDML (Data Manipulation Language): modifica e interrogazionedei datiSQL (Structured Query Language): DDL + DML

Dott. Cazzaniga Paolo Fondamenti di Informatica

Page 49: La codifica dell’informazione Le basi di datidinamico2.unibg.it/cazzaniga/files/1314/parte3.pdf · La codifica dell’informazione La sicurezza informatica Le basi di dati La

La codifica dell’informazioneLa sicurezza informatica

Le basi di dati

Le basi di dati

La rappresentazione concettuale dei DB viene fatta usando ModelliEntità-Relazioni

entità: classi di oggetti (persone, cose) che hanno proprietàcomuni ed esistenza autonomarelazioni: legami logici tra entitàattributi: proprietà di entità o relazioni

Dott. Cazzaniga Paolo Fondamenti di Informatica