62
INFORMATICA GENERALE E BASI DI DATI PER ARCHIVI AUDIOVISIVI (PRIMO MODULO) Claudio Piciarelli A.A. 2013/2014

INFORMATICA GENERALE E BASI DI DATI PER ARCHIVI ... · una griglia discreta di punti. ... Luce e radiazioni elettromagnetiche ... L’accensione contemporanea dei tre sottopixel crea

  • Upload
    lykhanh

  • View
    221

  • Download
    0

Embed Size (px)

Citation preview

INFORMATICA GENERALE E BASI DI DATI PER ARCHIVI AUDIOVISIVI (PRIMO MODULO)

Claudio Piciarelli

A.A. 2013/2014

La codifica di dati multimediali

Lezione 2

Continuo e discreto

� Volendo rappresentare un’informazione di tipo multimediale (audio, video, immagini…) si deve affrontare un primo problema:

� I dati multimediali sono per loro natura continui, mentre un computer può memorizzare solo informazione discreta

Continuo e discreto

� Esempio: in un termometro al mercurio la temperatura varia in maniera continua, senza «salti»

� Il termometro può assumere tutti gli infiniti valori compresi da 35 e 42 gradi

Continuo e discreto

� Come posso rappresentare la stessa informazione con un numero finito di bit?

000 35°001 36°010 37°011 38°100 39°101 40°110 41°111 42°

000 35°001 36°010 37°011 38°100 39°101 40°110 41°111 42°

� Anche se usassimo una codifica per le cifre decimali, avremmo comunque un numero finito di rappresentazioni. La temperatura «salta» da un valore all’altro, ad es. da 36 a 37, e non c’è modo di rappresentare i valori intermedi.

� Questo tipo di codifica si dice discreta

Quantizzazione

� Aumentando il numero di bit, si aumenta il numero di intervalli di quantizzazione, per cui la rappresentazione è più fedele (c’è meno perdita di informazione)

000001

110

010011100101

111

� Il processo di trasformazione di un dato continuo in uno discreto si chiama quantizzazione

Domanda: quanti bit servono per codificare la temperatura con una precisione al decimo di grado?Domanda: quanti bit servono per codificare la temperatura con una precisione al decimo di grado?

Campionamento

� E se il dato da quantizzare si estende in maniera continua anche nello spazio o nel tempo?

t

x

y

Un suono si estende nel tempo, un’immagine nello spazio, un video in entrambi.

Campionamento nel tempo

� Si applica l’operazione di quantizzazione un numero discreto di volte. Questa operazione è detta campionamento.

� La frequenza di campionamento si misura in Hertz (Hz) e indica il numero di campioni acquisiti in un secondo

Nota: il processo di campionamento + quantizzazione si chiama digitalizzazione. Consiste infatti nell’assegnare, a un dato fisico, una rappresentazione numerica (digit = cifra)Nota: il processo di campionamento + quantizzazione si chiama digitalizzazione. Consiste infatti nell’assegnare, a un dato fisico, una rappresentazione numerica (digit = cifra)

Esempio: i CD audio

� L’orecchio umano non riesce a sentire suoni dalla frequenza superiore ai 22.000 Hz

� Il teorema del campionamento di Nyquist dice che, campionando un segnale ad almeno il doppio della sua frequenza massima, non si ha perdita di informazione

� Per questo la musica memorizzata nei CD audio è campionata a 44.100 Hz

Esempio: i CD audio

� Frequenza di campionamento: 44100 Hz

� Bit di quantizzazione: 16 (quindi 2�� = 65536

valori possibili per ogni campione)

� Stereo: due canali, destro e sinistro

Quanti bit occupa un CD di un’ora?

16 (bit per campione) x 2 (canali) x 44100 (campioni in un secondo) x 3600 (secondi in un’ora)

= 5.080.320.000 bit635.040.000 byte605,62 MB

Campionamento nello spazio

� L’idea del campionamento viene estesa alle due dimensioni. Un’immagine viene campionata lungo una griglia discreta di punti

���� ���� ���� ���� ����

� � � � �

� � � � �

� � � � �

� � � � �

Campionamento nello spazio

� Ogni campione è detto pixel (PICture ELement), e rappresenta il colore dell’immagine originale in un determinato punto.

Dimensione e risoluzione

� Le dimensioni di un’immagine sono il numero di righe e colonne della griglia di pixel che la rappresenta.

192 pixel

187 pixel

� Sono le dimensioni della griglia di campionamento, se l’immagine è stata campionata (ma potrebbe anche essere stata generata direttamente al computer!)

Dimensione e risoluzione

� La risoluzione fa esplicito riferimento al rapporto tra immagine digitale e immagine fisica. Misura la densità dei pixel nello spazio

� Esempio: un’immagine acquisita alla risoluzione di 300 DPI è stata acquisita con una griglia di campionamento che, in entrambe le direzioni, è composta da 300 punti per pollice (DPI = dots per inch, punti per pollice)

Un pollice = 2,54 cm

Risoluzione

� La risoluzione di un’immagine quindi è legata direttamente ad un supporto fisico. Non ha senso parlare di risoluzione a prescindere dal supporto

� Esempi� La risoluzione di acquisizione di uno scanner

� La risoluzione di una stampa

� La risoluzione di un monitor

Risoluzione

� Più bassa è la risoluzione, maggiore è la quantità di informazione persa (degrado della qualità dell’immagine)

Originale cartaceo: 10x10 cm

Dim: 200x200 pixelRis: 50 dpi

Dim: 100x100 pixelRis: 25 dpi(ingrandita)

Dim: 50x50 pixelRis: 12,5 dpi(ingrandita)

Immagini vettoriali

� Il formato di rappresentazione delle immagini descritto finora è detto raster. È una scelta praticamente obbligata se l’immagine è acquisita (da uno scanner, fotocamera ecc.)

� Ma se l’immagine è creata direttamente all’elaboratore, c’è un’alternativa: la grafica vettoriale

Immagini vettoriali

� Un’immagine vettoriale è composta da elementi geometrici come punti e linee. Si tratta di una rappresentazione utile soprattutto se l’immagine deve subire delle manipolazioni

V = { v1(1,1),v2(1,-1),v3(-1,1),v4(-1,-1) }

E = { e1(v1,v2),e2(v2,v4),e3(v4,v3),e4(v3,v1) }

v1

v2v4

v3

e2

e1

e4

e3

Insieme dei verticiInsieme dei vertici Insieme dei latiInsieme dei lati

Immagini vettoriali

� Le trasformazioni (rotazioni, cambiamenti di scala) di un’immagine vettoriale si possono esprimere come operazioni matematiche sulle coordinate dei vertici, e non causano perdita di informazione

� Trasformazioni di immagini raster invece causano generalmente perdita di informazione

La codifica dei colori

� Il processo di quantizzazione fa sì che i colori associabili ad un pixel siano in numero finito (discretizzazione)

� Si rende quindi necessario un modo per codificare i colori usando un numero finito di bit

� Ma prima definiamo cosa sono i colori…

Luce e radiazioni elettromagnetiche

� La luce visibile dall’occhio umano è una radiazione elettromagnetica

� In particolare, è solo una piccola porzione dello spettro elettromagnetico

Formazione delle immagini

� Tre elementi fondamentali:� La sorgente (emette radiazioni elettromagnetiche)

� Il sensore (rileva radiazioni elettromagnetiche)

� La superficie riflettente (assorbe alcune lunghezze d’onda e ne riflette altre)

Domanda: perché l’erba è verde?

Radiometria e fotometria

� Descrivono la propagazione delle radiazioni elettromagnetiche tra una sorgente e un ricevitore

� La radiometria tratta il problema dal punto di vista puramente fisico

� La fotometria prende in considerazione come tali radiazioni siano percepite dall’uomo (il ricevitore è l’occhio umano)

Quantità radiometriche

E: irradianza, quantità di luce proveniente dalla sorgente e che colpisce la superficieL: radianza, quantità di luce che raggiunge il sensore R: riflettanza, o BRDF (bidirectional reflectance distribution function)

Modello lambertiano di illuminazione: L(x,y) = E(x,y)*R(x,y)

E

L

Fotometria

� La luce che entra nell’occhio umano colpisce la rètina, una zona composta da cellule fotosensibili (fotorecettori)

� I fotorecettori si dividono in bastoncelli (preposti alla visione notturna, monocromatica) e coni (preposti alla visione diurna, a colori)

Fotometria

� Come l’occhio umano percepisce la luce

Fotopica

Scotopica

V(λ)

λ(nm)

Risposta spettrale dell’occhio umano: scotopica (notturna, picco sui 500 nm) e fotopica (diurna, picco sui 550 nm)

Scotopica: visione monocromatica, dovuta ai bastoncelli nella retinaFotopica: a colori, dovuta ai coni nella retina

Fotometria

I coni sono preposti alla visione diurna, a colori

Esistono tre tipi diversi di coni, ognuno con la sua caratteristica risposta spettrale, con picchi sulle lunghezze d’onda dei colori rosso, verde e blu

Modelli colorimetrici

� Sulla base di considerazioni fotometriche e/o radiometriche, sono stati definiti numerosi modelli per la rappresentazione del colore, ad es:

� RGB (red, green, blue)

� CMY(K) (Cyan, Magenta, Yellow, blacK)

� HSV (Hue, Saturation, Value)

� YUV / YIQ / YCbCr (sistemi luma-chroma)

Il modello RGB

� Gli studi fotometrici hanno permesso di definire che la maggior parte dei colori può essere ottenuta come combinazione lineare di tre colori primari:

ROSSO VERDE BLU

(combinazione lineare: � ∗ � + ∗ � + � ∗ �)

Il modello RGB

� I tre colori primari possono essere interpretati come tre dimensioni che definiscono un cubo (detto cubo RGB) contenente tutti i colori possibili

Il punto di coordinate (0,0,0) rappresenta il nero – assenza di tutti e tre i colori primari

Il punto di coordinate (1,1,1) rappresenta il bianco – presenza contemporanea di tutti e tre i colori primari

(assumendo che la «quantità» di colori primari sia rappresentabile con un numero compreso tra 0 e 1)

RGB come modello additivo

� Il modello RGB è detto modello additivo, perché il bianco si ottiene dalla somma di tutti e tre i colori primari

RGB come modello additivo

� Per questo motivo il modello RGB è usato nei dispositivi che emettono luce, come i monitor: ogni pixel è composto da tre sottopixel, rossi verdi e blu

� L’accensione contemporanea dei tre sottopixel crea il colore bianco. Il loro spegnimento mostra il colore nero del monitor

Il modello CMY

� Come RGB, ma i colori di base sono i tre colori complementari Ciano, Magenta e Giallo

� E’ l’ «opposto» di RGB, in quanto è possibile passare da un modello all’altro con la seguente formula:

[C,M,Y] = [1-R, 1-G, 1-Y]

CMY come modello sottrattivo

� Il modello CMY è detto modello sottrattivo, perché il bianco si ottiene dall’assenza di tutti e tre i colori primari (e il nero si ottiene dalla loro somma)

CMY come modello sottrattivo

� E’ un modello adatto a supporti che assorbono luce, come ad esempio la carta

� L’assenza di tutti e tre i colori mostra il colore bianco della carta

� La somma di tutti i colori dà il nero

� Nella pratica le stampanti usano spesso un modello CMYK, con un inchiostro specifico per il nero. In questo modo si ottiene un nero più intenso e si consuma meno inchiostro

Il modello HSV

� Basato su modelli percettivi del colore. Tre componenti:

� Hue: indica il colore «puro» (es. rosso, viola ecc.)

� Saturation: indica la quantità di bianco contenuta in un colore (un rosso saturo al 100% appare come rosso puro, un rosso saturo al 50% appare come rosa)

� Value: misura la luce emessa: valori alti indicano colori luminosi, valori bassi indicano colori scuri

Il modello HSV

� Il modello HSV ricorda ciò che fanno i pittori, che aggiungono bianco o nero ai colori puri per ottenere ombre, sfumature e toni diversi

� Hue = colore di base� Saturation = aggiunta di

bianco� Value = aggiunta di nero

I modelli YUV / YIQ / YCbCr

� Si tratta di modelli diversi, ma che hanno in comune il fatto di essere modelli «luma-chroma», ovvero in cui una componente (la Y) rappresenta la luminanza, e le altre due la crominanza

� Luminanza: luminosità percepita dall’occhio umano (è quella che conserviamo quando convertiamo un’immagine in bianco e nero)

� Crominanza: informazione cromatica

I modelli YUV / YIQ / YCbCr

� Sono modelli usati per la codifica delle trasmissioni televisive. Vantaggi:

� La codifica esplicita della luminanza garantisce il funzionamento dei televisori b/n anche se la trasmissione è a colori

� La codifica esplicita della crominanza permette di trasmettere meno dati grazie al sottocampionamento…

Sottocampionamento della crominanza

� Esempio di sottocampionamento 1:4

� Per trasmettere 4 pixel, invio 4 differenti valori di luminanza, uno per ciascun pixel, ma un solo valore di crominanza, condiviso da tutti e quattro

� Il sottocampionamento della crominanza è accettabile perché l’occhio umano è molto più sensibile alla luminanza che alla crominanza (vedi slide successive)

Sottocampionamento della crominanza

� Immagine originale

Sottocampionamento della crominanza

� Crominanza sottocampionata 1:2

Sottocampionamento della crominanza

� Crominanza sottocampionata 1:4

Sottocampionamento della crominanza

� Crominanza sottocampionata 1:8

Sottocampionamento della crominanza

� Luminanza sottocampionata 1:2

Sottocampionamento della crominanza

� Luminanza sottocampionata 1:4

Sottocampionamento della crominanza

� Luminanza sottocampionata 1:8

Il modello CIE 1931

� Conosciuto anche come modello XYZ, si tratta di un modello studiato per rappresentare tutti i colori percepibili dall’occhio umano

� Si è dimostrato come, per esprimere il modello CIE 1931 in forma additiva, sia necessario scegliere tre colori primari ipersaturi (non visibili dall’occhio umano!)

� Lo spazio CIE 1931 contiene quindi tutti i colori visibili, ma anche alcuni colori non percepibili

Il modello CIE 1931

z1

Colori

invisibili

Colori

Visibili

X e Yindicano tinta

e saturazione

La Z indica la

luminosità

Il modello CIE 1931

I colori lungo la «parabola» superiore sono i colori puri, o spettrali: corrispondono ad una singola lunghezza d’onda della radiazione elettromagnetica, e sono i colori in cui si può scomporre la luce bianca con un prisma (i colori dell’arcobaleno!)

Curiosità: il viola non fa parte di questi colori. E’ quindi detto colore iperspettrale, perché non esiste una singola lunghezza d’onda associata a quel colore

Il Gamut

� Il gamut è l’insieme di tutti i colori rappresentabili da un modello cromatico. Sovrapponendo il gamutdel modello RGB (ma il discorso vale anche per gli altri modelli visti finora) su quello dell’occhio umano, scopriamo qualcosa di sorprendente…

Gamut del modello RGB

Esistono numerosi colori che appartengono al gamut dell’occhio umano (ovvero sono visibili) ma non al gamut RGB.

In altre parole, non è vero che tutti i colori possono essere espressi come combinazione di rosso, verde e blu!

Lo stesso vale per tutti gli altri modelli visti in precedenza. L’unico modo di rappresentare tutti i colori visibili consiste nell’usare il modello CIE 1931, al prezzo di ricorrere a colori primari ipersaturi (invisibili all’occhio umano)

Gamut occhioGamut occhio

Gamut RGBGamut RGB

Quantizzazione cromatica

� Passaggio dagli infiniti colori continui a quelli rappresentabili con un numero finito di bit

� Il numero massimo di colori rappresentabili è detto profondità di colore e dipende dal numero di bit usati per memorizzare l’informazione cromatica

Immagini a scala di grigi

� Analizziamo per ora le immagini a scala di grigi, ovvero immagini in cui si è tenuta la sola componente di luminanza, ignorando la crominanza

Immagini a scala di grigi

� Le immagini a scala di grigi sono dette a un canale, perché ad ogni pixel è associato un solo valore, che indica il grigio che il pixel deve assumere tra tutti i grigi possibili (luminosità).

� Profondità di colore tipica: 8 bpp (bit per pixel)

� 8 bpp = 2�(256) livelli di grigio possibili

Immagini a scala di grigi

8bpp(256 grigi)

4 bpp(16 grigi)

2 bpp(4 grigi)

1 bpp(bianco e nero)

Queste immagini hanno diverse profondità di colore

Immagini a colori

� Sono dette a 3 canali: ad ogni pixel sono associati tre numeri (dipendenti dal modello cromatico adottato, ad esempio RGB)

Immagini a colori

� Profondità di colore tipica per immagini RGB (detta truecolor):� 3 canali, ciascuno da 8 bit

� Ovvero 2� sfumature possibili di rosso, 2� sfumature di verde e 2� sfumature di blu

� Colori totali rappresentabili:

2� ∗ 2� ∗ 2� = 2 � = 16.777.216

Immagini a colori

R G B

Un'immagine a colori RGB è quindi la somma di tre immagini a livelli di grigio che rappresentano l'intensità luminosa dei tre colori principali, rosso verde e blu

Esercizio 1

� Che aspetto avranno i tre canali RGB di questa immagine?

Esercizio 2

� Quanto tempo si impiega a trasmettere un’immagine con dimensione analogica pari a 8”x 11” via fax su un canale ISDN di tipo B (velocità trasmissiva pari a 64 Kbps)? Il fax digitalizza l’immagine in 300 pixel per pollice lineare ed assegna 4 bit a ciascun pixel.

Esercizio 3

� La profondità cromatica hicolor codifica i colori usando 5 bit per il canale rosso, 6 per il canale verde e 5 per il canale blu. Quanti colori è possibile rappresentare in tutto?

� Perché un film in bianco e nero digitalizzato con una profondità cromatica truecolor (24 bpp) rischia comunque di avere una resa cromatica scadente?