Plan de Comunicación Universidad de Jaén - …coello.ujaen.es/Asignaturas/fotodigital/descargas/FD_tema6.pdf · 1 Fotogrametría Digital – Ingeniería en Geodesia y Cartografía

1

Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,

Geodésica y Fotogrametría

Fotogrametría Digital Tema 6 – Preprocesamiento de Imágenes en Fotogrametría Digital

Prof. Dr. Jorge Delgado García

Dpto. Ingeniería Cartográfica, Geodésica y Fotogrametría

Universidad de Jaén

[email protected]

2



Justificación:

• Conocer los sistemas de almacenamiento básicos de imágenes digitales fotogramétricas. • Conocer las estrategias fundamentales de gestión de ficheros de imágenes digitales en el

flujo de trabajo fotogramétrico. • Conocer y analizar las diferentes técnicas de compresión de imágenes digitales, con un

especial hincapié en los efectos que tienen sobre las imágenes.

Objetivos:

La inclusión de este tema se justifica por el hecho de la importancia que tiene en Fotogrametría Digital las tareas de manipulación previa y almacenamiento de las imágenes digitales debido al volumen necesario. Por tanto, es fundamental el conocimiento de las diferentes estrategías de gestión de almacenamiento aplicadas en Fotogrametría Digital así como de las técnicas fundamentales de compresión de imágenes y los efectos que tienen sobre la calidad de las mismas.

3



Estructura del Tema

6.1 Sistemas de Almacenamiento y Manipulación de Imágenes Digitales Fotogramétricas 6.1.1 Sistemas de Almacenamiento de Imágenes Digitales Fotogramétricas 6.1.2 Manipulación de Imágenes Digitales Fotogramétricas 6.2 Compresión de imágenes digitales 6.2.1 Métodos de compresión no degradativos 6.2.2 Métodos de compresión degradativos

Bibliografía

• González y Woods. Tratamiento Digital de Imágenes. Addison-Wesley/Diaz de Santos • Lammi,J. y Sarjakoski, T. (1995). Image Compression by the JPEG Algorithm. PE&RS. 61(10), 1261-1266. • Lizard Tech (1997). Mr SID. White Paper. 13 pág. Información de la compañía. • Lynch, T. (1985). Data Compression Techniques and Applications. Lifetime Learning Publications. Belmont,

California. • Novak, K. y Shanin, F.S. (1996). A Comparison of two Image Compression Techniques for Softcopy

Photogrammetry. PE&RS, 62(6), 695-701. • Rabbani, M. y Jones, P. (1990). Digital Image Compression Techniques. SPIE Optical Engineering Press,

Bellingham, Washington. • Storer, J. (1988). Data Compression: Methods and Theory. Computer Science Press. Rockville, Maryland.

4



Sistemas de almacenamiento de imágenes digitales

• Discos magnéticos: Grabación de datos al modificar la posición del campo magnético. Discos flexibles, Discos duros, Matrices de discos duros (RAID) Ley de Murch: “Cada 18 meses se duplica la capacidad de los discos duros” Sistemas de cintas. DAT, DLT, Exabyte. Velocidad baja. Secuencial. Baterías de cintas. Sistemas robotizados.

• Discos ópticos: Sistemas tipo RAD (información leída y escrita por un láser) WORM: CD/DVD. 120mm diámetro. Capac: 1Gb. Veloc: 7.6Mb/s (x52). 1x=0.2Mb/s DVD: Capac.máxima: 17Gb. Veloc.máxima: x16.

• Sistemas holográficos

5



6



NAS (Network Attached Storage): Tecnología de almacenamiento dedicada a compartir la capacidad de almacenamiento de un servidor con ordenadores personales o servidores clientes a través de una red (normalmente TCP/IP), haciendo uso de un Sistema Operativo optimizado para dar acceso con los protocolos CIFS, NFS, FTP o TFTP. Son dispositivos a los que se accede desde los equipos a través de protocolos de red (normalmente TCP/IP). También se podría considerar que un servidor que comparte sus unidades por red es un sistema NAS, pero la definición suele aplicarse a sistemas específicos. Los protocolos de comunicaciones NAS son basados en ficheros por lo que el cliente solicita el fichero completo al servidor y lo maneja localmente, están por ello orientados a información almacenada en ficheros de pequeño tamaño y gran cantidad. Los protocolos usados son protocolos de compartición de ficheros como NFS, Microsoft Common Internet File System (CIFS). Normalmente, estos dispositivos están dispuestos en RAID (Redundant Arrays of Independent Disks) o contenedores de almacenamiento redundante.

7



RAID (Redundant Arrays of Independent Disks – Redundant Array of Inexpensive Disks) Sistema de almacenamiento que usa múltiples discos duros entre los que distribuye o replica los datos. Los beneficios de un RAID respecto a un único disco son uno o varios de los siguientes: mayor integridad, mayor tolerancia a fallos, mayor throughput (rendimiento) y mayor capacidad. En sus implementaciones originales, su ventaja clave era la habilidad de combinar varios dispositivos de bajo coste y tecnología más antigua en un conjunto que ofrecía mayor capacidad, fiabilidad, velocidad o una combinación de éstas que un solo dispositivo de última generación y coste más alto. En el nivel más simple, un RAID combina varios discos duros en una sola unidad lógica. Así, en lugar de ver varios discos duros diferentes, el sistema operativo ve uno solo. Los RAID suelen usarse en servidores aunque se encuentran también como opción en los ordenadores personales más avanzados. De igual forma, el cambio de «barato» a «independiente» confunde a muchos sobre el pretendido propósito del RAID. Incluso hay algunas implementaciones del concepto RAID que usan un solo disco. Pero en general, diremos que cualquier sistema que emplee los conceptos RAID básicos de combinar espacio físico en disco para los fines de mejorar la fiabilidad, capacidad o rendimiento es un sistema RAID.

http://es.wikipedia.org/wiki/Disco_duro



http://es.wikipedia.org/wiki/Dato

http://es.wikipedia.org/wiki/Integridad_de_datos

http://es.wikipedia.org/wiki/Tolerancia_a_fallos





http://es.wikipedia.org/wiki/Throughput

http://es.wikipedia.org/w/index.php?title=Capacidad_de_almacenamiento&action=edit&redlink=1

http://es.wikipedia.org/w/index.php?title=Unidad_l%C3%B3gica&action=edit&redlink=1



http://es.wikipedia.org/wiki/Sistema_operativo



http://es.wikipedia.org/wiki/Servidor

http://es.wikipedia.org/wiki/Ordenador_personal



8



SAN (Storage Area Network) Es una red concebida para conectar servidores, matrices (arrays) de discos y librerías de soporte. Principalmente, está basada en tecnología fibre channel y más recientemente en iSCSI. Su función es la de conectar de manera rápida, segura y fiable los distintos elementos que la conforman. Su coste es más elevado que un NAS.

http://es.wikipedia.org/wiki/Fibre_channel



http://es.wikipedia.org/wiki/ISCSI

http://upload.wikimedia.org/wikipedia/commons/9/9f/CompSAN.GIF

9



Sistemas de manipulación de imágenes digitales fotogramétricas • Sistema de almacenamiento individual. Coste reducido / Inversión gradual. Capacidad en torno a 1 Tb • Sistema de almacenamiento centralizado. Coste elevado / Gran inversión / Elevado rendimiento / Capacidad varios Tb (20-30) • Sistema de almacenamiento jerárquico (HSM) Diferentes sistemas de coste de almacenamiento variable / Optimización de recursos. • Digitalización/Procesado/Borrado Elevado coste digitalización. Necesidad de repetir ciertos procesos (OI). Deterioro de los negativos originales. El volumen de salvaguarda es un verdadero problema … una empresa de tamaño medio puede generar en torno a 30-40 Tb/año … más de 6000 DVDs.

10



Compresión de imágenes digitales

La compresión de las imágenes digitales es una necesidad para la mayoría de las aplicaciones fotogramétricas, en las que suele existir un número considerable de imágenes de gran tamaño que deben ser almacenadas en un espacio limitado o bien transmitidas de un sistema a otro.

Diferencia entre información y datos (González y Woods,1996): “éste podría ser el caso si una persona muy habladora y otra muy parca en palabras

contasen la misma historia. Aquí la información en la historia; las palabras son los datos necesario para relatar la información. Si las dos personas emplean diferente número de palabras para contar la misma historia se crean dos versiones distintas de la misma, y al menos una de ellas incluye datos no esenciales. Es decir, contienen datos (o palabras) que bien proporcionan información sin relevancia o bien vuelven a decir lo que ya se sabía”.

Objetivo fundamental: Reducción de la cantidad de datos necesarios para la representación de la

información original, eliminando los datos que no aportan información (datos redundantes). Así se consigue la reducción del número de bits requeridos para representar una imagen eliminando las redundancias existentes en la misma.

11



Conceptos básicos de Teoría de la Información

Entropia: Es un parámetro que mide el grado de desorden o caos en un sistema termodinámico. Es una medida del grado de incertidumbre. Es una medida del contenido de información medio por símbolo en una fuente. Es una medida del contenido de información real de una imagen (Lynch, 1983) La cantidad de información I(ai) para un símbolo ai viene dado por la expresión: Siendo su valor medio la entropía: se expresa en bits/simbolo (bits/pixel) y su cálculo requiere el conocimiento propio de la fuente.

)p(alog)p(a

1log)I(a

i2

i

2i

)p(alog)p(a)I(a )p(aEi2iii

N

i

N

i 00

12



Cuantificación de la redundancia: Si n1 y n2 representan el tamaño de dos ficheros que contienen la misma información, la redundancia relativa se define como:

donde CR se denomina relación o tasa de compresión y se define como la relación entre el

número de bits de la imagen original (n1) dividido por el número de bits de la imagen comprimida (n2).

Si n2=n1, CR=1 y RD=0 (no existe información redundante) Si n2<n1, CR>1 y RD≈1 (compresión significativa, redundancia alta) Si n2>>n1, CR≈0 y RD<0 (no existe compresión) Tipos de redundancias: Espacial: Debida a la correlación del ND de un píxeles y los ND de los vecinos. Espectral: Correlación entre los niveles digitales de las diferentes bandas o canales. Temporal: Correlación entre las imágenes tomadas en momentos diferentes (video). Entropía máxima: Hmáx = log2 M, donde M es el número de niveles digitales. R = log2 M - H (Lynch, 1985).

RD

C

11R

2

1R

n

nC

13



• La compresión de imágenes es una necesidad real en Fotogrametría al requerir las imágenes una gran cantidad de información para garantizar un nivel de calidad similar al que tenían las imágenes analógicas.

• La compresión de datos es la técnica que se emplea para la reducción de la redundancia de la representación de los datos para disminuir los requerimientos de almacenamiento y los costes (y tiempos) de transmisión.

• La reducción de los requerimientos de almacenamiento equivale a incrementar la capacidad de los sistemas de almacenamiento y las tasas de transmisión (bandwidth).

• La compresión se considera básica para el desarrollo de los sistemas de comunicación y las aplicaciones multimedia en entorno web.

14



Ventajas:

- Reducción de almacenamiento

- Reducción de los tiempos de transmisión (incremento ancho de banda)

- Mejor acceso a las bases de datos

- Se puede implementar sistemas de seguridad asociados a la compresión

- Reducción de los costes (y tiempos) de backup

Inconvenientes:

- Tiempo de compresión/descompresión

- Compatibilidad de formatos

- Pérdida de información

- Errores en la transmisión

15



Bits/pixel Imagen Aérea Imagen Terrestre

(Carretera) Imagen Marca

(Target) Entropía 5.79 3.36 2.75

Redundancia 2.21 4.64 5.25

La tasa de compresión máxima sin pérdida de información se define como (Storer, 1988):

Esta tasa se alcanza cuando la codificación de la imagen da lugar a una tasa (bits/píxel) similar a la entropía, para ello es necesario eliminar o reducir la correlación entre los píxeles y además codificar los píxeles de una forma tan eficiente como sea posible.

Es importante tener en cuenta que existen diferentes métodos y estrategias de compresión, obteniendo diferentes resultados dependiendo de las características de las imágenes.

H

MlogC 2

máx

16



Proceso de Compresión-Descompresión (CODEC)

a) Lossless: no degradativa (D=D’) b) Lossy: degradativa (existe pérdida de información) (D≠D’) c) Perceptual lossless Objetivo: Compresión máxima dentro de unos niveles de pérdida de información que no afecten a la calidad del trabajo final. Al respecto hay que tener en cuenta que aunque la degradación sea inapreciable al nivel de visión del ojo humano si puede tener importantes efectos cuando esta imagen sea tratada mediante un sistema informático de procesamiento de imágenes.

Imagen original (D) Imagen comprimida c(D) Imagen restaurada (D´) Compresión Descompresión

Tipos de Compresión-Descompresión (CODEC)

17



Etapas de la compresión

1) Elección del tipo de compresión (degradativa – no degradativa) 2) Elección del modelo de compresión:

a) Estático: con códigos fijos y predeterminados b) Dinámico: con códigos que se ajustan a la fuente (adaptativos)

3) Reducción de la redundancia de los datos: transformación de los datos 4) Reducción de la entropía: cuantización Medida de la calidad de la imagen comprimida

1) Medidas subjetivas MOS: Mean observers score (mean opinion score). Valoración de 1 a 5

2) Medidas objetivas

3) Tiempo de compresión 4) Complejidad de la compresión

M

1i

N

1j

2

j)(i,I'j)I(i,MN

1RMSE

M

1i

N

1j

2

M

1i

N

1j

2

10

M

1i

N

1j

2

10

j)(i,I'j)I(i,

j)(i,Ilog 10

RMSE

j)(i,IMN

1

log 20SNR

RMSE

255log 20PSNR

10

18



Estándares de compresión

1) Imagen fija International Organization of Standarization (ISO) International Telecommunication Union –Telecommunication Sector-(ITU-T) 1992: Joint Photographic Expert Group (ISO/IEC IS 10918-1; ITU-T T-81) 2) Video

MPEG: MPEG 1 ISO 11172 (1994) -> 1.5 Mbps MPEG 2 ISO 13818 (1995) -> 6 Mbps … MPEG 21

3) Audio MPEG: MPEG 1 Layer III (MP3) MPEG 2 – MPEG 4 4) Texto Lempel-Ziv (LZ): LZ77, LZ78, LZZZ, LZW, LZC, LZWAJ, ZIP, GZIP, PKZIP, PKUNZIP

19



Métodos de compresión no degradativos (lossless compression)

Se utilizan cuando se requiere que la imagen reconstruida sea idéntica a la imagen original. Por ejemplo: Imágenes médicas en las que las variaciones de niveles digitales pueden modificar el diagnóstico final.

La compresión no degradativa también es frecuentemente aplicada en Teledetección, donde

las características espectrales de las imágenes deben ser preservadas. Como es lógico esperar, las tasas de compresión de este tipo de métodos son sensiblemente inferiores comparadas con los métodos degradativos (Rabbani y Jones, 1990).

Los métodos de compresión no degradativos más frecuentemente empleados son: - run lenght encoding (RLE) - codificación Huffman - codificación Huffman modificada

20



Es un método muy simple. Emplea la redundancia existente entre datos consecutivos, así por ejemplo, en las imágenes suelen existir áreas niveles digitales constantes (series de valores repetitivos que son denominadas runs), y son representadas en la imagen comprimida mediante un valor que indica el número de veces que se repite el dato y el propio dato:

AAAABBBBBCCCCCCCCDEEEE (Long: 22 bytes) 4A5B8C1D4E (Long: 10 bytes) Es importante tener en cuenta que si no existen cadenas consecutivas con el mismo valor, el

tamaño del fichero comprimido resultante será mayor que el original, al requerir dos valores para cada píxel (número de repeticiones y dato).

RLE modificado (formato MacPaint): Consiste en la introducción de un código adicional (en nuestro

ejemplo, el carácter +) que indica cuando se está empleando la codificación. Así resultaría: ABCDDDDDDDDEEEEEEEEE (Long: 20 bytes) ABC+8D+9E (Long: 9 bytes) Inconveniente: 3 valores para cada cadena. Ventaja: Flexibilidad para compresión de imágenes que presentan zonas homogéneas y

heterogéneas. RLE: Formatos PCX, GEM, TIFF y TGA.

Run Lenght Encoding (RLE)

21



Método de Huffman (1952)

Se basa en el empleo de códigos de longitud variable que sustituyen a los valores originales de la imagen. La longitud del código de codificación es inversamente proporcional a la frecuencia de aparición del dato en la imagen digital. Es la misma filosofía que el empleado de Morse … la longitud de cada carácter es proporcional a la frecuencia de aparición del mismo. Ejemplo: E se codifica como . ; Q se codifica como - - . -

Los códigos Huffman se calculan a partir del análisis de los datos de la imagen original y

asignando códigos de menor longitud a los datos más frecuentes, siendo el objetivo la reducción del número medio de bits por carácter empleado para la codificación.

Así si se considera el siguiente párrafo: “Ésta era la inscripción que había en la puerta de cristal de una tiendecita, pero naturalmente sólo

se veía así cuando se miraba a la calle, a través del cristal, desde el interior en penumbra.” (La historia interminable, Michael Ende)

Se calcularía el histograma de frecuencia de caracteres.

22



Símbolo Frec.Abs. Código Long.Cód. Símbolo Frec.Abs. Código Long.Cód.

Espacio 34 000 3 p 4 001000 6

A 24 010 3 o 4 001001 6

E 22 100 3 , 3 011110 6

R 12 0110 4 i 3 011111 6

L 11 1010 4 b 3 011100 6

N 11 1011 4 m 3 011101 6

S 10 1100 4 v 2 111110 6

T 10 1101 4 ó 2 111111 6

I 10 1110 4 h 1 1111010 7

C 7 00101 5 q 1 1111011 7

D 7 00110 5 É 1 1111000 7

U 6 00111 5 é 1 1111001 7

23



Símbolos con mayor frecuencia: Spc (34), a (24) y e (22). Longitud que reciben los códigos Huffman más= cortos (longitud igual a 3). Ejemplo de codificación: Palabra separada por letras: c - r - i - s - t - a – l Códigos de cada letra: 00101 - 0110 - 1110 - 1100 - 1101 - 010 - 1010 Almacenamiento: 1 byte/carácter. Total: 56 bits (7 bytes). Compresión: Espacio: 28 bits, TC: 2.0, E: 99.29%, H: 3.9717 bits/símbolo, Espacio mínimo:

27.8019 bits. Obtención de códigos: 1) Ordenar las probabilidades de los símbolos que componen el alfabeto de la fuente de mayor a

menor. 2) comenzando por los símbolos con menores probabilidades pa y pb crear un nuevo nodo, cuya

probabilidad sea la suma de pa y pb (reducción de la fuente). 3) repetir el proceso utilizando el nuevo nodo hasta que quede uso solo con probabilidad igual a 1. 4) etiquetar cada rama situada a la izquierda con un 0 y cada rama en la derecha con un 1

(asignación de códigos). 5) el código de cada símbolo original será determinado por la sucesión de los códigos impuestos

desde la raíz hacía las ramas.

24



Símbolo<Espacio>

aerln

sticdupo,íbmv

óhqÉé

Frec.Abs.342422121111

1010107764433332

21111

Total: 192

1342422121111

1010107764433332

2211

2342422121111

1010107764433332

222

3342422121111

1010107764443333

22

4342422121111

1010107764444333

3

5342422121111

1010107766444433

6342422121111

101010776664444

7342422121111

10101087766644

8342422121111

1010108877666

9342422121211

1110101088776

10342422131212

1111101010887

11342422151312

1211111010108

12342422181513

121211111010

13342422201815

1312121111

14342422222018

15131212

15342423222220

181513

16342824242222

2018

17383428242422

22

18443834282424

194844383428

2062484438

21826248

2211082

Símbolo<Espacio>

aerlnsticdupo,íbmvóhqÉé

Cód000010100011010101011110011011110

001010011101110

001000001001011110011111011100011101111110111111

1111010111101111110001111001

1000010100011010101011110011011110

001010011101110

00100000100101111001111101110001110111111011111111110011110101111011

2000010100011010101011110011011110

001010011101110

001000001001011110011111011100011101111110111111111100111101

3000010100011010101011110011011110

001010011101110

00100000100111110

011110011111011100011101111110111111

4000010100011010101011110011011110

001010011101110

0010000010011111011111

011110011111011100011101

5000010100011010101011110011011110

00101001100011101110

0010000010011111011111

011110011111

600 001 010 0011010101011110011011110

001 010 0110001110111001111

0010000010011111011111

70000101000110101010111100110111101111

0010100110001110111001111

001000001001

800 001 010 00110101010111100110111101111

001 00001 010 0110001110111001111

900001010001100111101010111100110111101111

00100001010011000111

1000 001 010 0001101100111101010111100110111101111

001 00001 01

110000101000010001101100111101010111100110111101111

12000010100111

00100011011001111010101111001101

13000010100110111

001000110110011110101011

14000010100101110111

0010001101100111

15000010011100101110111

00100011

16000001010011100101110111

1711

000001010011100101

181011

000001010011

19011011

00 000 1

2000011011

2110001

2201

25



Condiciones de los códigos Huffman: a) Condición de prefijo: dos códigos no pueden tener el mismo prefijo, no necesitando carácter

de fin de código en el proceso de compresión/descompresión. Ejemplo: Si la u tiene el código 00111, no puede existir ningún código que comience con los dígitos 00111.

b) Dos símbolos no pueden recibir el mismo código. c) La longitud de un código dado nunca puede ser menor que la de un código más probable.

0

5

10

15

20

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Número Digital

Frecuencia Relativa (%)

26



Decodificación: 1111-000110-000110-0000-010-010-100-001...110-100-010-001-1011 0 1 1 5 8 8 9 7 ... 10 9 8 7 4

ND Prob. 7 0.1474 8 0.1420 6 0.1264 9 0.119610 0.1066 5 0.088411 0.0608

4 0.0524 0 0.0395 3 0.0339 2 0.0241 1 0.018312 0.014213 0.012814 0.011015 0.0025

1 0.1474 0.1420 0.1264 0.11960.10660.08840.0608

0.05240.03950.03390.02410.01830.01420.01350.0128

2 0.1474 0.1420 0.1264 0.11960.10660.08840.0608

0.05240.03950.03390.02630.02410.01830.0142

3 0.1474 0.1420 0.1264 0.11960.10660.08840.0608

0.05240.03950.03390.03250.02630.0241

4 0.1474 0.1420 0.1264 0.11960.10660.08840.0608

0.05240.05040.03950.03390.0325

5 0.1474 0.1420 0.1264 0.11960.10660.08840.0664

0.06080.05240.05040.0395

6 0.1474 0.1420 0.1264 0.11960.10660.08990.0884

0.06640.06080.0524

7 0.1474 0.1420 0.1264 0.11960.11320.10660.0899

0.08840.0664

8 0.15480.1474 0.1420 0.1264 0.11960.11320.1066

0.0899

90.1965 0.15480.1474 0.1420 0.1264 0.11960.1132

100.23680.1965 0.15480.1474 0.1420 0.1264

110.26840.23680.1965 0.15480.1474

120.30220.26840.23680.1965

130.42930.30220.2684

140.57060.4293

ND Prob. Cód 7 0.1474 001 8 0.1420 010 6 0.1264 011 9 0.1196 10010 0.1066 110 5 0.0884 000011 0.0608 1010

4 0.0524 1011 0 0.0395 1111 3 0.0339 00010 2 0.0241 11101 1 0.0183 00011012 0.0142 00011113 0.0128 11100114 0.0110 111000015 0.0025 1110001

1 001 010 011 100 110 0000 1010

1011 11110001011101000110000111111000111001

2 001 010 011 100 110 0000 1010

1011 1111000101110011101000110000111

3 001 010 011 100 110 0000 1010

1011 11110001000011 1110011101

4 001 010 011 100 110 0000 1010

1011 1110 11110001000011

5 001 010 011 100 110 0000 0001

1010 1011 1110 1111

6 001 010 011 100 110 111 0000

0001 1010 1011

7 001 010 011 100 101 110 111

0000 0001

8 000 001 010 011 100 101 110

111

9 11 000 001 010 011 100 101

10 10 11 000 001 010 011

11 01 10 11 000 001

12 00 01 10 11

13 1 00 01

14 0 1

Tamaño original: 131072 bytes, H: 3.5185 bits/símbolo, Tamaño mínimo sin pérdida de información: 115294 bits. Long.media código ponderada en función de la frecuencia: 3.5415 bits/símbolo Espacio requerido: 116048 bits, Tc: 1.13, E: 97.68%.

27



Inconveniente del método Huffman: Requiere realizar dos pasadas sobre cada imagen. 1) Histograma, 2) Compresión. Alternativa: Codificación Huffman con códigos estándares (peor compresión, menos tiempo) Otros métodos de compresión no degradativa: 1. Método de READ modificado: es una modificación del método de Huffman en la que se divide la imagen en

líneas y se aplica codificación Huffman a cada grupo de líneas. Cada porción de imagen es codificada de acuerdo a estas codificaciones.

2. Método LZW: Apareció en 1984 (aunque las bases aparecieron en 1977) y supuso la pérdida de la hegemonía del método de Huffman. Se basa en la codificación a nivel de cadena en lugar de a nivel de dato. El algoritmo es muy simple … aunque su implementación es bastante compleja. Se basa en la búsqueda de cadenas de caracteres con códigos simples que se almacenan en una tabla de consulta. La mayor parte de los programas que emplean LZW utilizan códigos de 12 bits por lo que existen 4096 códigos disponibles, de los cuales los 256 (0-255) primeros se emplean para la codificación de los caracteres individuales y los restantes (256-4095) para representar combinaciones de datos que presenten repetibilidad.

3. Codificación aritmética: Se diferencia de los métodos anteriores en que se realiza la codificación de cadenas completas en un sólo código de tipo real de punto flotante. A mayor longitud de la cadena, se necesitara un mayor número de dígitos y, por tanto, una mayor precisión del número empleado como código. Este sistema requiere realizar dos lecturas de la imagen, una en la que se calculan las frecuencias y otra en la que se realiza la codificación propiamente dicha.

28



0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0 0.46

0.45

0.44

0.43

0.42

0.41

0.40

0.39

0.380.380

0.37

0.385

0.390

0.395

0.400

0.3781

0.3779

0.3777

0.3775

0.3773

0.3771

0.3769

0.3767

0.3765

1 1 1 1

2 2 2 2

3 3 3 3

4 4 4 4

5 5 5 5

0.4033 0.37819

0.376300.3763Ejemplo de codificación aritmética

29



Métodos de compresión degradativos La diferencia principal entre las técnicas degradativas y no degradativas es la inclusión de un

proceso de cuantificación en las primeras. Mediante este proceso se reduce el número de símbolos, produciendo la degradación de la imagen y aumentando la tasa de reducción al reducir el número de bits necesario para el almacenamiento de cada símbolo.

Las técnicas de compresión degradativa constan típicamente de tres etapas: Descomposición o transformación de la imagen. Transformación de la imagen en un nuevo

dominio, el dominio de la frecuencia, para reducir el rango dinámico de la señal (valores de gris) y para eliminar las correlaciones entre los valores de gris originales.

Cuantificación. Los valores transformados se convierten a un conjunto finito de datos más reducidos, para reducir el número de bits necesarios para el almacenamiento. El tipo y grado de cuantificación es el factor clave, tanto en la tasa de compresión y en la calidad de la imagen restaurada.

Codificación de los símbolos. Los símbolos resultantes deben ser codificados empleando para ello algún método óptimo, como, por ejemplo, la codificación Huffman o la codificación aritmética.

30



JPEG

El estándar JPEG define tres sistemas básicos de compresión: 1. el sistema básico de tipo degradativo y que se basa en la aplicación de la transformación

de coseno discreto y es el más difundido debido a sus amplias posibilidades de utilización

2. el sistema de codificación extendida, para aplicaciones de mayor compresión o mayor precisión

3. el sistema de codificación independiente sin pérdidas de tipo degradativo y que se emplea para compresiones reversibles, que es poco empleado.

Se divide en cuatro etapas:

1. División de la imagen original en subbloques de tamaño 8x8 pixels 2. Transformación de Coseno Discreto (FDCT) 3. Cuantificación (sólo en el método JPEG degradativo) 4. Codificación de entropía (Huffman o Aritmética)

31



Bloque 8x8Imagen Original

TransformaciónCoseno Discreto

DirectaCuantización

CodificaciónHuffman

Datos de la imagencomprimida

Bloque 8x8 Imagen Descomprimidal

TransformaciónCoseno Discreto

InversaDecuantización

DecodificaciónHuffman

Datos de la imagencomprimida

a) La transformación DCT

Comienza con la división de la imagen en porciones de tamaño 8x8 píxeles (tiles), que se procesan de izquierda a derecha y de arriba abajo, modificando sus niveles digitales al restarle el valor 2n-1, es decir, 128 para las imágenes usuales de 256 tonos de gris -n=8 bits-.

52 55 61 66 70 61 64 73 -76 -73 -67 -62 -58 -67 -64 -55

63 59 66 90 19 85 69 72 -65 -69 -62 -38 -19 -43 -59 -56

62 59 68 11 14 10 66 73 -66 -69 -60 -15 16 -24 -62 -55

63 58 71 12 15 10 70 69 -65 -70 -57 -6 26 -22 -58 -59

67 61 68 10 12 88 68 70 -61 -67 -60 -24 -2 -40 -60 -58

79 65 60 70 77 68 58 75 -49 -63 -68 -58 -51 -65 -70 -53

85 71 64 59 55 61 65 83 -43 -57 -64 -69 -73 -67 -63 -45

87 79 69 68 65 76 78 94 -41 -49 -59 -60 -63 -52 -50 -34

Imagen original Imagen original - 128

32



Cada porción se transforma al dominio de la frecuencia empleando la función de DCT.

1N

0x

1N

0yN2

v1y2cos

N2

u1x2cosy,xfvuv,uC

1N

0x

1N

0yN2

v1y2cos

N2

u1x2cosv,uCvuy,xf

para u,v = 0, 1, 2, ..., N-1 y su correspondiente inversa es:

donde α(u),α(v)= para u,v=0 y para u,v=1, ...,N-1. DCT es un método muy aplicado para la compresión al ser simple y rápido. Se trata de un método independiente de la imagen. No supone pérdida de información sino que modifica el tipo de representación de la imagen compactando la información en unos pocos coeficientes.

N

1N

2

-415 -29 -62 25 55 -20 -1 3

7 -21 -62 9 11 -7 -6 6

-46 8 77 -25 -30 10 7 -5

-50 13 35 -15 -9 6 0 3

11 -8 -13 -2 -1 1 -4 1

-10 1 3 -3 -1 0 2 -1

-4 -1 2 -1 2 -3 1 -2

-1 -1 -1 -2 -1 -1 0 -1

33



b) Cuantificación.

Sólo se aplica si se desea una compresión degradativa (lo que equivale en la mayor parte de los casos, una mayor tasa de compresión). Consiste en la normalización de los coeficientes obtenidos de la DCT, aplicando una normalización predefinida en la normativa del estándar, que será la misma para todos los bloques. Cada componente de la matriz de normalización Q(u,v) es un entero 8-bit (0 a 256) que determina el grado de cuantización. Dichos componentes son calculados de forma que los pequeños valores estén asociados con frecuencias bajas y los valores elevados con frecuencias altas. El nivel de compresión de la imagen puede ser modificado mediante la introducción de cambios en esta matriz, mediante el producto por una constante. Así, a diferentes matrices de normalización le corresponden diferentes tasas de compresión.

Los coeficientes normalizados son cuantificados mediante la aplicación de un redondeo al número entero más próximo, así, por ejemplo, para el primer coeficiente (0,0), el resultado sería:

T (0,0) = Redondeo [ -415 / 16 ] = -26

16 11 10 16 24 40 51 61

12 12 14 19 26 58 60 55

14 13 16 24 40 57 69 56

14 17 22 29 51 87 80 62

18 22 37 56 68 109 103 77

24 35 55 64 81 104 113 92

49 64 78 87 103 121 120 101

72 92 95 98 112 100 103 99

-26 -3 -6 2 2 0 0 0

1 -2 -4 0 0 0 0 0

-3 1 5 -1 -1 0 0 0

-4 1 2 -1 0 0 0 0

1 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

JPEG-75 Cuantificación y redondeo

34



Es la etapa donde se produce una mayor reducción del tamaño a la vez que la pérdida de información más importante, reduciendo el número de valores distintos. El coeficiente superior izquierda es denominado DC, mientras que el resto reciben la denominación de AC. La cuantificación de los coeficientes AC produce numerosos ceros, especialmente para las frecuencias más altas. Para aprovechar este hecho, la matriz bidimensional de coeficientes se transforma en una vector unidimensional mediante su ordenación en zig-zag. Esta ordenación ordena los coeficientes cuantificados en un orden aproximadamente descendente, la mayoría de los coeficientes de la zona final son ceros.

-26

1

-3

-4

1

0

0

0

-3

-2

1

1

0

0

0

0

-6

-4

5

2

0

0

0

0

2

0

-1

-1

0

0

0

0

2

0

-1

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

DC

Por tanto, la secuencia final sería: [-26 -3 1 -3 -2 -6 2 -4 1 -4 1 1 5 0 2 0 0 -1 2 0 0 0 0 0 -1 -1 EOB] siendo EOB un carácter especial de fin de bloque –end of block–.

35



c) Codificación de entropía Consiste en la codificación de los coeficientes normalizados, para ello se resta al DC el correspondiente DC del bloque anterior, dando lugar a un DC diferencial que es un valor bajo debido a la elevada correlación entre los bloques. Cada DC diferencial es codificado mediante la aplicación de un método de código de longitud variable, así como cada valor de AC. Compresión de imágenes en color El esquema básico para la compresión se basa en el trabajo con imágenes de 8 bits, pero puede ser aplicado a imágenes a color. Esta compresión se realiza mediante la compresión de cada uno de los canales de información, pudiéndose aplicar a cualquier tipo de modelo de color, si bien es aconsejable aplicarlo al modelo YUV (Y: iluminancia, UV: cromacidad) en la que cada uno de los canales es independiente. Compresión de imágenes de gran tamaño La descompresión es un proceso largo, para evitar esperas excesivas se suele dividir en elementos de menor tamaño y posteriormente se almacena un catálogo de forma que se permita un rápido acceso a cada una de las partes de la imagen. Esto permite además que sólo se descomprima el fragmento de imagen en la que deseemos trabajar, lo que supone un gran ahorro de tiempo ya que aunque el proceso de compresión sea más lento, éste usualmente sólo se realiza una vez, mientras que el de descompresión suele ser más frecuente.

36



ProcesoCompresión

Catálogo

Bloques de tamaño variable

Imagen Fraccionada

Efectos geométricos de la compresión JPEG En Fotogrametría es esencial la calidad geométrica. La calidad se puede empeorar en un proceso de compresión de la imagen en dos formas:

1) Por perdida de calidad radiométrica (cuando el posicionamiento de los elementos se realiza en una imagen borrosa)

2) Por deformación de los objetos en alguna (o las dos) direcciones. Estas degradaciones pueden ser en ambos casos locales o globales.

La pérdida de calidad geométrica de la imagen depende de diversos factores:

- método y cantidad de compresión - distribución de ND en la imagen digital - la calidad de la imagen original

37



De los métodos considerados dentro del estándar JPEG, únicamente el método de no degradativo asegura el mantenimiento de la calidad geométrica y radiométrica de la imagen, si bien como demuestran Mikhail et al (1984) la compresión DCT produce el desplazamiento máximo de 0.5 píxeles de los elementos cuando se aplica una tasa de compresión de 1:16 a una imagen de 8 bits.

Lammi y Sarjakoski (1995): Influencia de la compresión en la calidad geométrica de imágenes color.

Precisión (medida de la calidad interna o repetibilidad de las medidas) Exactitud (medida de la calidad externa -global- de las medidas comparadas con alguna

referencia considerada como representativa de la realidad). Escáner Sharp JX-600 (600ppp) y tres tasas 1:7 (Excelente), 1:15 (Alta) y 1:66 (Regular).

Calidad visual: 1:7 (Muy buena); 1:15 (Buena – se observan los efectos); 1:66 (Mala). Calidad geométrica: 50 elementos (tamaño mayor de 8 píxeles). 20 medidas en la imagen

original y 10 medidas en las comprimidas con precisión de subpixel.

Imagen (Nivel de compresión) Emax RSME V

Excelente (1:7) 0.27 0.12 99

Alta (1:15) 0.73 0.18 99

Regular (1:66) 2.76 0.50 99

Diferencias expresadas en píxeles

38



Efectos de la compresión JPEG. Se puede observar el efecto de la división en subbloques

39



Codificación Jerárquica Predictiva (HPC): Se utiliza para la compresión para imágenes de video. El algoritmo comienza con la creación de

una representación a escala a distintos niveles de la imagen original. Así por ejemplo, una imagen de un tamaño de 1024x1024 píxeles se descompone en cinco imágenes correspondientes a cinco niveles de escala: 512x512, 256x256, 128x128 y 64x64. La pirámide se crea mediante la convolución de las imágenes de mayor resolución mediante la aplicación de un operador gausiano y el aumento del tamaño del píxel al doble.

Se calculan las imágenes diferencia entre los niveles. Las diferencias representan los

componentes de alta frecuencia del nivel previo de la pirámide. La imagen original puede ser reconstruida a partir de su representación en el nivel de menor resolución (64x64 píxeles) y de las imágenes diferencia. Los valores diferencia son normalmente pequeños y pueden ser codificados y almacenados en un número reducido de bits, de forma que se alcanza una compresión sin pérdida de información, no obstante para obtener mayor tasa de compresión se utiliza la cuantificación, que produce degradación de la imagen y una compresión más eficaz pero con pérdida de calidad.

40



El algoritmo de la HPC consta de las siguientes etapas: - Creación de una pirámide gausiana con kernel 3x3 - Calculo de las imágenes diferencia - Almacenamiento en profundidad de color variable (8:5:3:1) La tasa de compresión es de 3.6 (8:5:3:1). Para obtener mayores tasas las imágenes

diferencia deben ser almacenadas con menor número de bits, aunque con la desventaja de un mayor riesgo de degradación de la imagen.

41



Es un método más rápido que el método JPEG, Novak y Shanin (1996) realizan un estudio comparativo entre ambos métodos, tanto en lo relativo a tasas de compresión, como a calidad de las imágenes restauradas y velocidad de ejecución.

La tasa de compresión está relacionada con el método empleado: JPEG-75, tasa de 5.9 HPC-8.5.3.1, tasa de 3.6 JPEG-40, tasa de 12.5 HPC-8.3.3.1, tasa de 4.5 JPEG-25, tasa de 42.

alcanzándose errores medios cuadráticos inferiores al píxel en todos los métodos, con máximos inferiores al píxel en los métodos JPEG-75 y HPC-8.5.3.1.

Tiempo de ejecución: 1Mb imagen HPC: 5 s (Sun Sparcstation2) JPEG: 20s

Una ventaja adicional del HPC es contar con una imagen de resolución variable para los cálculos de carácter iterativo.

42



IMAGEN ORIGINAL

1024x1024

512x512

256x256

128x128

64x64

Cuantización 1 bit

Cuantización 3 bit

Cuantización 5 bit

Cuantización 8 bit

PIRÁMIDE DE IMÁGENES IMÁGENES DIFERENCIA

Imagen Nivel 4 (64x64). Ampliada 16 vecesImagen Original (Nivel 0) (1024x1024)

43



Cuantificación vectorial Al igual que el JPEG, comienza con la división de la imagen en bloques de tamaño n x n píxeles,

si bien en este caso no existe ninguna predefinición en cuanto al tamaño de los mismos, si bien es frecuente el empleo de tamaño de 4x4 píxeles.

Estos bloques son comparados con un conjunto predefinido de bloques representativos (codebook), la comparación se establece mediante el cálculo de la sumatoria de las diferencias de cada elemento del bloque con cada elemento de cada uno de los bloques incluidos en el libro de códigos. Aquel código que presente una suma de diferencias menor será elegido como representativo y el bloque de la imagen original será sustituido por el índice del bloque seleccionado.

Las relaciones de compresión son elevadas, así por ejemplo, para una imagen de 24 bits/píxel (color RGB) es necesario un espacio de 384 bits para un bloque de 4x4 píxeles que pueden comprimirse en 10 bytes si se emplea una tabla de códigos de 1024 posibilidades (Tc=38.4).

La parte más compleja del método es la definición de los bloques codificados predefinidos. A priori, la solución más acertada podría parecer escoger como bloques aquellas porciones de la imagen que aportan más información (por ejemplo, bordes) si bien es necesario tener en cuenta que la frecuencia de aparición de dichos elementos en la imagen global es baja, con lo cual la imagen comprimida tendrá poca calidad.

44



Compresión fractal Supone una ruptura total con la filosofía actual en cuanto a técnicas de compresión de

imágenes. En ella se almacenan son las fórmulas que nos van a dar lugar a la imagen. Por tanto, estas técnicas son independientes de la resolución de la imagen.

Las tasas de compresión son muy elevadas (en torno a 100) y con muy buenos resultados con

imágenes naturales. Se basan en la división de la imagen original en porciones más pequeñas, y dichas porciones en

otras más pequeñas y sucesivamente, estableciendo de una forma analítica las relaciones existentes entre las diferentes porciones, denominadas regiones del dominio. Las regiones son definidas en función de técnicas clásicas de análisis de imágenes tales como detección de bordes, análisis textural, ... . Al igual que el resto de los métodos degradativos, la compresión fractal introduce efectos en la imagen tales como suavizado y eliminación de detalles, no siendo, en principio aconsejable su utilización cuando el objetivo del trabajo fotogramétrico sea la restitución.

45



Transformaciones de wavelet discretas

Son técnicas que tienen actualmente un gran auge. La más conocida es MrSID (Multiresolution Seamless Image Database), que está implementado en software de Fotogrametría y Teledetección y que es empleado por organismos como el FBI (base de datos de huellas dactilares).

Obtiene tasas en torno a 70:1 (color), es decir, 3 veces más que con otros métodos similares –

JPEG-. Mr.SID presenta en cuanto a su estructura general ciertas analogías con el método JPEG, con la diferencia de que en el caso de Mr.SID se aplica una transformación de wavelet discreta (DWT) en lugar de una transformación de coseno discreto (DCT).

La principal ventaja de DWT frente a DCT es su carácter no local, con lo que proporciona mejores

tasas de compresión y una menor degradación de la imagen. DCT se basa en una transformación Fourier e intenta describir la imagen como una superposición de ondas de cosenos. Estas ondas son infinitas, por lo que requiere partir la imagen en bloques de tamaño reducido (8x8) y aplicar la transformación en cada bloque (teselado en la imagen comprimida).

46



El principal problema que presenta la DWT frente a la DCT es la cantidad de memoria requerida en la transformación. La división en bloques de la DCT aunque puede llegar a producir efectos indeseados en la imagen es muy eficiente (considera al bloque individualmente). DWT requiere el acceso a la imagen completa (complicado con imágenes de gran tamaño -> división de la imagen en bloques).

Una ventaja muy importante de DWT es que es una transformación multirresolución, incorporando

la posibilidad de la descompresión selectiva de porciones de la imagen. Esto facilita de una forma muy importante la visualización a todas las escalas de trabajo en especial las pequeñas y medianas, con tiempos de descompresión mucho más reducidos que los de LZW o JPEG.

47



JPEG2000

Se trata de un nuevo estándar de compresión que se basa en el empleo de DWT en lugar de DCT. Ventajas: - Superior rendimiento de compresión: PSNR= 0.25 bits/pixel - Permite comprimir imágenes de tono continuo y bitono - Perfectamente adaptado a imágenes de más de 8 bits/canal (preparado para 38 bits) - Permite comprimir imágenes de (232-1) x (232-1) con tan sólo 214 componentes - Puede ser definido como degradativo o no degradativo - Se puede predefinir el tamaño de la imagen comprimida - Permite la codificación a nivel de ROI - Muy robusto - Permite incorporar metainformación JPX - Permite incorporar sistemas de seguridad

Documents

Plan de Comunicación Universidad de Jaén - …coello.ujaen.es/Asignaturas/fotodigital/descargas/FD_tema6.pdf · 1 Fotogrametría Digital – Ingeniería en Geodesia y Cartografía