Upload
hahanh
View
221
Download
0
Embed Size (px)
Citation preview
1
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Fotogrametría Digital Tema 6 – Preprocesamiento de Imágenes en Fotogrametría Digital
Prof. Dr. Jorge Delgado García
Dpto. Ingeniería Cartográfica, Geodésica y Fotogrametría
Universidad de Jaén
2
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Justificación:
• Conocer los sistemas de almacenamiento básicos de imágenes digitales fotogramétricas. • Conocer las estrategias fundamentales de gestión de ficheros de imágenes digitales en el
flujo de trabajo fotogramétrico. • Conocer y analizar las diferentes técnicas de compresión de imágenes digitales, con un
especial hincapié en los efectos que tienen sobre las imágenes.
Objetivos:
La inclusión de este tema se justifica por el hecho de la importancia que tiene en Fotogrametría Digital las tareas de manipulación previa y almacenamiento de las imágenes digitales debido al volumen necesario. Por tanto, es fundamental el conocimiento de las diferentes estrategías de gestión de almacenamiento aplicadas en Fotogrametría Digital así como de las técnicas fundamentales de compresión de imágenes y los efectos que tienen sobre la calidad de las mismas.
3
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Estructura del Tema
6.1 Sistemas de Almacenamiento y Manipulación de Imágenes Digitales Fotogramétricas 6.1.1 Sistemas de Almacenamiento de Imágenes Digitales Fotogramétricas 6.1.2 Manipulación de Imágenes Digitales Fotogramétricas 6.2 Compresión de imágenes digitales 6.2.1 Métodos de compresión no degradativos 6.2.2 Métodos de compresión degradativos
Bibliografía
• González y Woods. Tratamiento Digital de Imágenes. Addison-Wesley/Diaz de Santos • Lammi,J. y Sarjakoski, T. (1995). Image Compression by the JPEG Algorithm. PE&RS. 61(10), 1261-1266. • Lizard Tech (1997). Mr SID. White Paper. 13 pág. Información de la compañía. • Lynch, T. (1985). Data Compression Techniques and Applications. Lifetime Learning Publications. Belmont,
California. • Novak, K. y Shanin, F.S. (1996). A Comparison of two Image Compression Techniques for Softcopy
Photogrammetry. PE&RS, 62(6), 695-701. • Rabbani, M. y Jones, P. (1990). Digital Image Compression Techniques. SPIE Optical Engineering Press,
Bellingham, Washington. • Storer, J. (1988). Data Compression: Methods and Theory. Computer Science Press. Rockville, Maryland.
4
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Sistemas de almacenamiento de imágenes digitales
• Discos magnéticos: Grabación de datos al modificar la posición del campo magnético. Discos flexibles, Discos duros, Matrices de discos duros (RAID) Ley de Murch: “Cada 18 meses se duplica la capacidad de los discos duros” Sistemas de cintas. DAT, DLT, Exabyte. Velocidad baja. Secuencial. Baterías de cintas. Sistemas robotizados.
• Discos ópticos: Sistemas tipo RAD (información leída y escrita por un láser) WORM: CD/DVD. 120mm diámetro. Capac: 1Gb. Veloc: 7.6Mb/s (x52). 1x=0.2Mb/s DVD: Capac.máxima: 17Gb. Veloc.máxima: x16.
• Sistemas holográficos
5
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
6
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
NAS (Network Attached Storage): Tecnología de almacenamiento dedicada a compartir la capacidad de almacenamiento de un servidor con ordenadores personales o servidores clientes a través de una red (normalmente TCP/IP), haciendo uso de un Sistema Operativo optimizado para dar acceso con los protocolos CIFS, NFS, FTP o TFTP. Son dispositivos a los que se accede desde los equipos a través de protocolos de red (normalmente TCP/IP). También se podría considerar que un servidor que comparte sus unidades por red es un sistema NAS, pero la definición suele aplicarse a sistemas específicos. Los protocolos de comunicaciones NAS son basados en ficheros por lo que el cliente solicita el fichero completo al servidor y lo maneja localmente, están por ello orientados a información almacenada en ficheros de pequeño tamaño y gran cantidad. Los protocolos usados son protocolos de compartición de ficheros como NFS, Microsoft Common Internet File System (CIFS). Normalmente, estos dispositivos están dispuestos en RAID (Redundant Arrays of Independent Disks) o contenedores de almacenamiento redundante.
7
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
RAID (Redundant Arrays of Independent Disks – Redundant Array of Inexpensive Disks) Sistema de almacenamiento que usa múltiples discos duros entre los que distribuye o replica los datos. Los beneficios de un RAID respecto a un único disco son uno o varios de los siguientes: mayor integridad, mayor tolerancia a fallos, mayor throughput (rendimiento) y mayor capacidad. En sus implementaciones originales, su ventaja clave era la habilidad de combinar varios dispositivos de bajo coste y tecnología más antigua en un conjunto que ofrecía mayor capacidad, fiabilidad, velocidad o una combinación de éstas que un solo dispositivo de última generación y coste más alto. En el nivel más simple, un RAID combina varios discos duros en una sola unidad lógica. Así, en lugar de ver varios discos duros diferentes, el sistema operativo ve uno solo. Los RAID suelen usarse en servidores aunque se encuentran también como opción en los ordenadores personales más avanzados. De igual forma, el cambio de «barato» a «independiente» confunde a muchos sobre el pretendido propósito del RAID. Incluso hay algunas implementaciones del concepto RAID que usan un solo disco. Pero en general, diremos que cualquier sistema que emplee los conceptos RAID básicos de combinar espacio físico en disco para los fines de mejorar la fiabilidad, capacidad o rendimiento es un sistema RAID.
8
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
SAN (Storage Area Network) Es una red concebida para conectar servidores, matrices (arrays) de discos y librerías de soporte. Principalmente, está basada en tecnología fibre channel y más recientemente en iSCSI. Su función es la de conectar de manera rápida, segura y fiable los distintos elementos que la conforman. Su coste es más elevado que un NAS.
9
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Sistemas de manipulación de imágenes digitales fotogramétricas • Sistema de almacenamiento individual. Coste reducido / Inversión gradual. Capacidad en torno a 1 Tb • Sistema de almacenamiento centralizado. Coste elevado / Gran inversión / Elevado rendimiento / Capacidad varios Tb (20-30) • Sistema de almacenamiento jerárquico (HSM) Diferentes sistemas de coste de almacenamiento variable / Optimización de recursos. • Digitalización/Procesado/Borrado Elevado coste digitalización. Necesidad de repetir ciertos procesos (OI). Deterioro de los negativos originales. El volumen de salvaguarda es un verdadero problema … una empresa de tamaño medio puede generar en torno a 30-40 Tb/año … más de 6000 DVDs.
10
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Compresión de imágenes digitales
La compresión de las imágenes digitales es una necesidad para la mayoría de las aplicaciones fotogramétricas, en las que suele existir un número considerable de imágenes de gran tamaño que deben ser almacenadas en un espacio limitado o bien transmitidas de un sistema a otro.
Diferencia entre información y datos (González y Woods,1996): “éste podría ser el caso si una persona muy habladora y otra muy parca en palabras
contasen la misma historia. Aquí la información en la historia; las palabras son los datos necesario para relatar la información. Si las dos personas emplean diferente número de palabras para contar la misma historia se crean dos versiones distintas de la misma, y al menos una de ellas incluye datos no esenciales. Es decir, contienen datos (o palabras) que bien proporcionan información sin relevancia o bien vuelven a decir lo que ya se sabía”.
Objetivo fundamental: Reducción de la cantidad de datos necesarios para la representación de la
información original, eliminando los datos que no aportan información (datos redundantes). Así se consigue la reducción del número de bits requeridos para representar una imagen eliminando las redundancias existentes en la misma.
11
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Conceptos básicos de Teoría de la Información
Entropia: Es un parámetro que mide el grado de desorden o caos en un sistema termodinámico. Es una medida del grado de incertidumbre. Es una medida del contenido de información medio por símbolo en una fuente. Es una medida del contenido de información real de una imagen (Lynch, 1983) La cantidad de información I(ai) para un símbolo ai viene dado por la expresión: Siendo su valor medio la entropía: se expresa en bits/simbolo (bits/pixel) y su cálculo requiere el conocimiento propio de la fuente.
)p(alog)p(a
1log)I(a
i2
i
2i
)p(alog)p(a)I(a )p(aEi2iii
N
i
N
i 00
12
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Cuantificación de la redundancia: Si n1 y n2 representan el tamaño de dos ficheros que contienen la misma información, la redundancia relativa se define como:
donde CR se denomina relación o tasa de compresión y se define como la relación entre el
número de bits de la imagen original (n1) dividido por el número de bits de la imagen comprimida (n2).
Si n2=n1, CR=1 y RD=0 (no existe información redundante) Si n2<n1, CR>1 y RD≈1 (compresión significativa, redundancia alta) Si n2>>n1, CR≈0 y RD<0 (no existe compresión) Tipos de redundancias: Espacial: Debida a la correlación del ND de un píxeles y los ND de los vecinos. Espectral: Correlación entre los niveles digitales de las diferentes bandas o canales. Temporal: Correlación entre las imágenes tomadas en momentos diferentes (video). Entropía máxima: Hmáx = log2 M, donde M es el número de niveles digitales. R = log2 M - H (Lynch, 1985).
RD
C
11R
2
1R
n
nC
13
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
• La compresión de imágenes es una necesidad real en Fotogrametría al requerir las imágenes una gran cantidad de información para garantizar un nivel de calidad similar al que tenían las imágenes analógicas.
• La compresión de datos es la técnica que se emplea para la reducción de la redundancia de la representación de los datos para disminuir los requerimientos de almacenamiento y los costes (y tiempos) de transmisión.
• La reducción de los requerimientos de almacenamiento equivale a incrementar la capacidad de los sistemas de almacenamiento y las tasas de transmisión (bandwidth).
• La compresión se considera básica para el desarrollo de los sistemas de comunicación y las aplicaciones multimedia en entorno web.
14
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Ventajas:
- Reducción de almacenamiento
- Reducción de los tiempos de transmisión (incremento ancho de banda)
- Mejor acceso a las bases de datos
- Se puede implementar sistemas de seguridad asociados a la compresión
- Reducción de los costes (y tiempos) de backup
Inconvenientes:
- Tiempo de compresión/descompresión
- Compatibilidad de formatos
- Pérdida de información
- Errores en la transmisión
15
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Bits/pixel Imagen Aérea Imagen Terrestre
(Carretera) Imagen Marca
(Target) Entropía 5.79 3.36 2.75
Redundancia 2.21 4.64 5.25
La tasa de compresión máxima sin pérdida de información se define como (Storer, 1988):
Esta tasa se alcanza cuando la codificación de la imagen da lugar a una tasa (bits/píxel) similar a la entropía, para ello es necesario eliminar o reducir la correlación entre los píxeles y además codificar los píxeles de una forma tan eficiente como sea posible.
Es importante tener en cuenta que existen diferentes métodos y estrategias de compresión, obteniendo diferentes resultados dependiendo de las características de las imágenes.
H
MlogC 2
máx
16
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Proceso de Compresión-Descompresión (CODEC)
a) Lossless: no degradativa (D=D’) b) Lossy: degradativa (existe pérdida de información) (D≠D’) c) Perceptual lossless Objetivo: Compresión máxima dentro de unos niveles de pérdida de información que no afecten a la calidad del trabajo final. Al respecto hay que tener en cuenta que aunque la degradación sea inapreciable al nivel de visión del ojo humano si puede tener importantes efectos cuando esta imagen sea tratada mediante un sistema informático de procesamiento de imágenes.
Imagen original (D) Imagen comprimida c(D) Imagen restaurada (D´) Compresión Descompresión
Tipos de Compresión-Descompresión (CODEC)
17
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Etapas de la compresión
1) Elección del tipo de compresión (degradativa – no degradativa) 2) Elección del modelo de compresión:
a) Estático: con códigos fijos y predeterminados b) Dinámico: con códigos que se ajustan a la fuente (adaptativos)
3) Reducción de la redundancia de los datos: transformación de los datos 4) Reducción de la entropía: cuantización Medida de la calidad de la imagen comprimida
1) Medidas subjetivas MOS: Mean observers score (mean opinion score). Valoración de 1 a 5
2) Medidas objetivas
3) Tiempo de compresión 4) Complejidad de la compresión
M
1i
N
1j
2
j)(i,I'j)I(i,MN
1RMSE
M
1i
N
1j
2
M
1i
N
1j
2
10
M
1i
N
1j
2
10
j)(i,I'j)I(i,
j)(i,Ilog 10
RMSE
j)(i,IMN
1
log 20SNR
RMSE
255log 20PSNR
10
18
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Estándares de compresión
1) Imagen fija International Organization of Standarization (ISO) International Telecommunication Union –Telecommunication Sector-(ITU-T) 1992: Joint Photographic Expert Group (ISO/IEC IS 10918-1; ITU-T T-81) 2) Video
MPEG: MPEG 1 ISO 11172 (1994) -> 1.5 Mbps MPEG 2 ISO 13818 (1995) -> 6 Mbps … MPEG 21
3) Audio MPEG: MPEG 1 Layer III (MP3) MPEG 2 – MPEG 4 4) Texto Lempel-Ziv (LZ): LZ77, LZ78, LZZZ, LZW, LZC, LZWAJ, ZIP, GZIP, PKZIP, PKUNZIP
19
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Métodos de compresión no degradativos (lossless compression)
Se utilizan cuando se requiere que la imagen reconstruida sea idéntica a la imagen original. Por ejemplo: Imágenes médicas en las que las variaciones de niveles digitales pueden modificar el diagnóstico final.
La compresión no degradativa también es frecuentemente aplicada en Teledetección, donde
las características espectrales de las imágenes deben ser preservadas. Como es lógico esperar, las tasas de compresión de este tipo de métodos son sensiblemente inferiores comparadas con los métodos degradativos (Rabbani y Jones, 1990).
Los métodos de compresión no degradativos más frecuentemente empleados son: - run lenght encoding (RLE) - codificación Huffman - codificación Huffman modificada
20
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Es un método muy simple. Emplea la redundancia existente entre datos consecutivos, así por ejemplo, en las imágenes suelen existir áreas niveles digitales constantes (series de valores repetitivos que son denominadas runs), y son representadas en la imagen comprimida mediante un valor que indica el número de veces que se repite el dato y el propio dato:
AAAABBBBBCCCCCCCCDEEEE (Long: 22 bytes) 4A5B8C1D4E (Long: 10 bytes) Es importante tener en cuenta que si no existen cadenas consecutivas con el mismo valor, el
tamaño del fichero comprimido resultante será mayor que el original, al requerir dos valores para cada píxel (número de repeticiones y dato).
RLE modificado (formato MacPaint): Consiste en la introducción de un código adicional (en nuestro
ejemplo, el carácter +) que indica cuando se está empleando la codificación. Así resultaría: ABCDDDDDDDDEEEEEEEEE (Long: 20 bytes) ABC+8D+9E (Long: 9 bytes) Inconveniente: 3 valores para cada cadena. Ventaja: Flexibilidad para compresión de imágenes que presentan zonas homogéneas y
heterogéneas. RLE: Formatos PCX, GEM, TIFF y TGA.
Run Lenght Encoding (RLE)
21
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Método de Huffman (1952)
Se basa en el empleo de códigos de longitud variable que sustituyen a los valores originales de la imagen. La longitud del código de codificación es inversamente proporcional a la frecuencia de aparición del dato en la imagen digital. Es la misma filosofía que el empleado de Morse … la longitud de cada carácter es proporcional a la frecuencia de aparición del mismo. Ejemplo: E se codifica como . ; Q se codifica como - - . -
Los códigos Huffman se calculan a partir del análisis de los datos de la imagen original y
asignando códigos de menor longitud a los datos más frecuentes, siendo el objetivo la reducción del número medio de bits por carácter empleado para la codificación.
Así si se considera el siguiente párrafo: “Ésta era la inscripción que había en la puerta de cristal de una tiendecita, pero naturalmente sólo
se veía así cuando se miraba a la calle, a través del cristal, desde el interior en penumbra.” (La historia interminable, Michael Ende)
Se calcularía el histograma de frecuencia de caracteres.
22
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Símbolo Frec.Abs. Código Long.Cód. Símbolo Frec.Abs. Código Long.Cód.
Espacio 34 000 3 p 4 001000 6
A 24 010 3 o 4 001001 6
E 22 100 3 , 3 011110 6
R 12 0110 4 i 3 011111 6
L 11 1010 4 b 3 011100 6
N 11 1011 4 m 3 011101 6
S 10 1100 4 v 2 111110 6
T 10 1101 4 ó 2 111111 6
I 10 1110 4 h 1 1111010 7
C 7 00101 5 q 1 1111011 7
D 7 00110 5 É 1 1111000 7
U 6 00111 5 é 1 1111001 7
23
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Símbolos con mayor frecuencia: Spc (34), a (24) y e (22). Longitud que reciben los códigos Huffman más= cortos (longitud igual a 3). Ejemplo de codificación: Palabra separada por letras: c - r - i - s - t - a – l Códigos de cada letra: 00101 - 0110 - 1110 - 1100 - 1101 - 010 - 1010 Almacenamiento: 1 byte/carácter. Total: 56 bits (7 bytes). Compresión: Espacio: 28 bits, TC: 2.0, E: 99.29%, H: 3.9717 bits/símbolo, Espacio mínimo:
27.8019 bits. Obtención de códigos: 1) Ordenar las probabilidades de los símbolos que componen el alfabeto de la fuente de mayor a
menor. 2) comenzando por los símbolos con menores probabilidades pa y pb crear un nuevo nodo, cuya
probabilidad sea la suma de pa y pb (reducción de la fuente). 3) repetir el proceso utilizando el nuevo nodo hasta que quede uso solo con probabilidad igual a 1. 4) etiquetar cada rama situada a la izquierda con un 0 y cada rama en la derecha con un 1
(asignación de códigos). 5) el código de cada símbolo original será determinado por la sucesión de los códigos impuestos
desde la raíz hacía las ramas.
24
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Símbolo<Espacio>
aerln
sticdupo,íbmv
óhqÉé
Frec.Abs.342422121111
1010107764433332
21111
Total: 192
1342422121111
1010107764433332
2211
2342422121111
1010107764433332
222
3342422121111
1010107764443333
22
4342422121111
1010107764444333
3
5342422121111
1010107766444433
6342422121111
101010776664444
7342422121111
10101087766644
8342422121111
1010108877666
9342422121211
1110101088776
10342422131212
1111101010887
11342422151312
1211111010108
12342422181513
121211111010
13342422201815
1312121111
14342422222018
15131212
15342423222220
181513
16342824242222
2018
17383428242422
22
18443834282424
194844383428
2062484438
21826248
2211082
Símbolo<Espacio>
aerlnsticdupo,íbmvóhqÉé
Cód000010100011010101011110011011110
001010011101110
001000001001011110011111011100011101111110111111
1111010111101111110001111001
1000010100011010101011110011011110
001010011101110
00100000100101111001111101110001110111111011111111110011110101111011
2000010100011010101011110011011110
001010011101110
001000001001011110011111011100011101111110111111111100111101
3000010100011010101011110011011110
001010011101110
00100000100111110
011110011111011100011101111110111111
4000010100011010101011110011011110
001010011101110
0010000010011111011111
011110011111011100011101
5000010100011010101011110011011110
00101001100011101110
0010000010011111011111
011110011111
600 001 010 0011010101011110011011110
001 010 0110001110111001111
0010000010011111011111
70000101000110101010111100110111101111
0010100110001110111001111
001000001001
800 001 010 00110101010111100110111101111
001 00001 010 0110001110111001111
900001010001100111101010111100110111101111
00100001010011000111
1000 001 010 0001101100111101010111100110111101111
001 00001 01
110000101000010001101100111101010111100110111101111
12000010100111
00100011011001111010101111001101
13000010100110111
001000110110011110101011
14000010100101110111
0010001101100111
15000010011100101110111
00100011
16000001010011100101110111
1711
000001010011100101
181011
000001010011
19011011
00 000 1
2000011011
2110001
2201
25
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Condiciones de los códigos Huffman: a) Condición de prefijo: dos códigos no pueden tener el mismo prefijo, no necesitando carácter
de fin de código en el proceso de compresión/descompresión. Ejemplo: Si la u tiene el código 00111, no puede existir ningún código que comience con los dígitos 00111.
b) Dos símbolos no pueden recibir el mismo código. c) La longitud de un código dado nunca puede ser menor que la de un código más probable.
0
5
10
15
20
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Número Digital
Frecuencia Relativa (%)
26
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Decodificación: 1111-000110-000110-0000-010-010-100-001...110-100-010-001-1011 0 1 1 5 8 8 9 7 ... 10 9 8 7 4
ND Prob. 7 0.1474 8 0.1420 6 0.1264 9 0.119610 0.1066 5 0.088411 0.0608
4 0.0524 0 0.0395 3 0.0339 2 0.0241 1 0.018312 0.014213 0.012814 0.011015 0.0025
1 0.1474 0.1420 0.1264 0.11960.10660.08840.0608
0.05240.03950.03390.02410.01830.01420.01350.0128
2 0.1474 0.1420 0.1264 0.11960.10660.08840.0608
0.05240.03950.03390.02630.02410.01830.0142
3 0.1474 0.1420 0.1264 0.11960.10660.08840.0608
0.05240.03950.03390.03250.02630.0241
4 0.1474 0.1420 0.1264 0.11960.10660.08840.0608
0.05240.05040.03950.03390.0325
5 0.1474 0.1420 0.1264 0.11960.10660.08840.0664
0.06080.05240.05040.0395
6 0.1474 0.1420 0.1264 0.11960.10660.08990.0884
0.06640.06080.0524
7 0.1474 0.1420 0.1264 0.11960.11320.10660.0899
0.08840.0664
8 0.15480.1474 0.1420 0.1264 0.11960.11320.1066
0.0899
90.1965 0.15480.1474 0.1420 0.1264 0.11960.1132
100.23680.1965 0.15480.1474 0.1420 0.1264
110.26840.23680.1965 0.15480.1474
120.30220.26840.23680.1965
130.42930.30220.2684
140.57060.4293
ND Prob. Cód 7 0.1474 001 8 0.1420 010 6 0.1264 011 9 0.1196 10010 0.1066 110 5 0.0884 000011 0.0608 1010
4 0.0524 1011 0 0.0395 1111 3 0.0339 00010 2 0.0241 11101 1 0.0183 00011012 0.0142 00011113 0.0128 11100114 0.0110 111000015 0.0025 1110001
1 001 010 011 100 110 0000 1010
1011 11110001011101000110000111111000111001
2 001 010 011 100 110 0000 1010
1011 1111000101110011101000110000111
3 001 010 011 100 110 0000 1010
1011 11110001000011 1110011101
4 001 010 011 100 110 0000 1010
1011 1110 11110001000011
5 001 010 011 100 110 0000 0001
1010 1011 1110 1111
6 001 010 011 100 110 111 0000
0001 1010 1011
7 001 010 011 100 101 110 111
0000 0001
8 000 001 010 011 100 101 110
111
9 11 000 001 010 011 100 101
10 10 11 000 001 010 011
11 01 10 11 000 001
12 00 01 10 11
13 1 00 01
14 0 1
Tamaño original: 131072 bytes, H: 3.5185 bits/símbolo, Tamaño mínimo sin pérdida de información: 115294 bits. Long.media código ponderada en función de la frecuencia: 3.5415 bits/símbolo Espacio requerido: 116048 bits, Tc: 1.13, E: 97.68%.
27
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Inconveniente del método Huffman: Requiere realizar dos pasadas sobre cada imagen. 1) Histograma, 2) Compresión. Alternativa: Codificación Huffman con códigos estándares (peor compresión, menos tiempo) Otros métodos de compresión no degradativa: 1. Método de READ modificado: es una modificación del método de Huffman en la que se divide la imagen en
líneas y se aplica codificación Huffman a cada grupo de líneas. Cada porción de imagen es codificada de acuerdo a estas codificaciones.
2. Método LZW: Apareció en 1984 (aunque las bases aparecieron en 1977) y supuso la pérdida de la hegemonía del método de Huffman. Se basa en la codificación a nivel de cadena en lugar de a nivel de dato. El algoritmo es muy simple … aunque su implementación es bastante compleja. Se basa en la búsqueda de cadenas de caracteres con códigos simples que se almacenan en una tabla de consulta. La mayor parte de los programas que emplean LZW utilizan códigos de 12 bits por lo que existen 4096 códigos disponibles, de los cuales los 256 (0-255) primeros se emplean para la codificación de los caracteres individuales y los restantes (256-4095) para representar combinaciones de datos que presenten repetibilidad.
3. Codificación aritmética: Se diferencia de los métodos anteriores en que se realiza la codificación de cadenas completas en un sólo código de tipo real de punto flotante. A mayor longitud de la cadena, se necesitara un mayor número de dígitos y, por tanto, una mayor precisión del número empleado como código. Este sistema requiere realizar dos lecturas de la imagen, una en la que se calculan las frecuencias y otra en la que se realiza la codificación propiamente dicha.
28
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0 0.46
0.45
0.44
0.43
0.42
0.41
0.40
0.39
0.380.380
0.37
0.385
0.390
0.395
0.400
0.3781
0.3779
0.3777
0.3775
0.3773
0.3771
0.3769
0.3767
0.3765
1 1 1 1
2 2 2 2
3 3 3 3
4 4 4 4
5 5 5 5
0.4033 0.37819
0.376300.3763Ejemplo de codificación aritmética
29
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Métodos de compresión degradativos La diferencia principal entre las técnicas degradativas y no degradativas es la inclusión de un
proceso de cuantificación en las primeras. Mediante este proceso se reduce el número de símbolos, produciendo la degradación de la imagen y aumentando la tasa de reducción al reducir el número de bits necesario para el almacenamiento de cada símbolo.
Las técnicas de compresión degradativa constan típicamente de tres etapas: Descomposición o transformación de la imagen. Transformación de la imagen en un nuevo
dominio, el dominio de la frecuencia, para reducir el rango dinámico de la señal (valores de gris) y para eliminar las correlaciones entre los valores de gris originales.
Cuantificación. Los valores transformados se convierten a un conjunto finito de datos más reducidos, para reducir el número de bits necesarios para el almacenamiento. El tipo y grado de cuantificación es el factor clave, tanto en la tasa de compresión y en la calidad de la imagen restaurada.
Codificación de los símbolos. Los símbolos resultantes deben ser codificados empleando para ello algún método óptimo, como, por ejemplo, la codificación Huffman o la codificación aritmética.
30
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
JPEG
El estándar JPEG define tres sistemas básicos de compresión: 1. el sistema básico de tipo degradativo y que se basa en la aplicación de la transformación
de coseno discreto y es el más difundido debido a sus amplias posibilidades de utilización
2. el sistema de codificación extendida, para aplicaciones de mayor compresión o mayor precisión
3. el sistema de codificación independiente sin pérdidas de tipo degradativo y que se emplea para compresiones reversibles, que es poco empleado.
Se divide en cuatro etapas:
1. División de la imagen original en subbloques de tamaño 8x8 pixels 2. Transformación de Coseno Discreto (FDCT) 3. Cuantificación (sólo en el método JPEG degradativo) 4. Codificación de entropía (Huffman o Aritmética)
31
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Bloque 8x8Imagen Original
TransformaciónCoseno Discreto
DirectaCuantización
CodificaciónHuffman
Datos de la imagencomprimida
Bloque 8x8 Imagen Descomprimidal
TransformaciónCoseno Discreto
InversaDecuantización
DecodificaciónHuffman
Datos de la imagencomprimida
a) La transformación DCT
Comienza con la división de la imagen en porciones de tamaño 8x8 píxeles (tiles), que se procesan de izquierda a derecha y de arriba abajo, modificando sus niveles digitales al restarle el valor 2n-1, es decir, 128 para las imágenes usuales de 256 tonos de gris -n=8 bits-.
52 55 61 66 70 61 64 73 -76 -73 -67 -62 -58 -67 -64 -55
63 59 66 90 19 85 69 72 -65 -69 -62 -38 -19 -43 -59 -56
62 59 68 11 14 10 66 73 -66 -69 -60 -15 16 -24 -62 -55
63 58 71 12 15 10 70 69 -65 -70 -57 -6 26 -22 -58 -59
67 61 68 10 12 88 68 70 -61 -67 -60 -24 -2 -40 -60 -58
79 65 60 70 77 68 58 75 -49 -63 -68 -58 -51 -65 -70 -53
85 71 64 59 55 61 65 83 -43 -57 -64 -69 -73 -67 -63 -45
87 79 69 68 65 76 78 94 -41 -49 -59 -60 -63 -52 -50 -34
Imagen original Imagen original - 128
32
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Cada porción se transforma al dominio de la frecuencia empleando la función de DCT.
1N
0x
1N
0yN2
v1y2cos
N2
u1x2cosy,xfvuv,uC
1N
0x
1N
0yN2
v1y2cos
N2
u1x2cosv,uCvuy,xf
para u,v = 0, 1, 2, ..., N-1 y su correspondiente inversa es:
donde α(u),α(v)= para u,v=0 y para u,v=1, ...,N-1. DCT es un método muy aplicado para la compresión al ser simple y rápido. Se trata de un método independiente de la imagen. No supone pérdida de información sino que modifica el tipo de representación de la imagen compactando la información en unos pocos coeficientes.
N
1N
2
-415 -29 -62 25 55 -20 -1 3
7 -21 -62 9 11 -7 -6 6
-46 8 77 -25 -30 10 7 -5
-50 13 35 -15 -9 6 0 3
11 -8 -13 -2 -1 1 -4 1
-10 1 3 -3 -1 0 2 -1
-4 -1 2 -1 2 -3 1 -2
-1 -1 -1 -2 -1 -1 0 -1
33
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
b) Cuantificación.
Sólo se aplica si se desea una compresión degradativa (lo que equivale en la mayor parte de los casos, una mayor tasa de compresión). Consiste en la normalización de los coeficientes obtenidos de la DCT, aplicando una normalización predefinida en la normativa del estándar, que será la misma para todos los bloques. Cada componente de la matriz de normalización Q(u,v) es un entero 8-bit (0 a 256) que determina el grado de cuantización. Dichos componentes son calculados de forma que los pequeños valores estén asociados con frecuencias bajas y los valores elevados con frecuencias altas. El nivel de compresión de la imagen puede ser modificado mediante la introducción de cambios en esta matriz, mediante el producto por una constante. Así, a diferentes matrices de normalización le corresponden diferentes tasas de compresión.
Los coeficientes normalizados son cuantificados mediante la aplicación de un redondeo al número entero más próximo, así, por ejemplo, para el primer coeficiente (0,0), el resultado sería:
T (0,0) = Redondeo [ -415 / 16 ] = -26
16 11 10 16 24 40 51 61
12 12 14 19 26 58 60 55
14 13 16 24 40 57 69 56
14 17 22 29 51 87 80 62
18 22 37 56 68 109 103 77
24 35 55 64 81 104 113 92
49 64 78 87 103 121 120 101
72 92 95 98 112 100 103 99
-26 -3 -6 2 2 0 0 0
1 -2 -4 0 0 0 0 0
-3 1 5 -1 -1 0 0 0
-4 1 2 -1 0 0 0 0
1 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
JPEG-75 Cuantificación y redondeo
34
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Es la etapa donde se produce una mayor reducción del tamaño a la vez que la pérdida de información más importante, reduciendo el número de valores distintos. El coeficiente superior izquierda es denominado DC, mientras que el resto reciben la denominación de AC. La cuantificación de los coeficientes AC produce numerosos ceros, especialmente para las frecuencias más altas. Para aprovechar este hecho, la matriz bidimensional de coeficientes se transforma en una vector unidimensional mediante su ordenación en zig-zag. Esta ordenación ordena los coeficientes cuantificados en un orden aproximadamente descendente, la mayoría de los coeficientes de la zona final son ceros.
-26
1
-3
-4
1
0
0
0
-3
-2
1
1
0
0
0
0
-6
-4
5
2
0
0
0
0
2
0
-1
-1
0
0
0
0
2
0
-1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
DC
Por tanto, la secuencia final sería: [-26 -3 1 -3 -2 -6 2 -4 1 -4 1 1 5 0 2 0 0 -1 2 0 0 0 0 0 -1 -1 EOB] siendo EOB un carácter especial de fin de bloque –end of block–.
35
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
c) Codificación de entropía Consiste en la codificación de los coeficientes normalizados, para ello se resta al DC el correspondiente DC del bloque anterior, dando lugar a un DC diferencial que es un valor bajo debido a la elevada correlación entre los bloques. Cada DC diferencial es codificado mediante la aplicación de un método de código de longitud variable, así como cada valor de AC. Compresión de imágenes en color El esquema básico para la compresión se basa en el trabajo con imágenes de 8 bits, pero puede ser aplicado a imágenes a color. Esta compresión se realiza mediante la compresión de cada uno de los canales de información, pudiéndose aplicar a cualquier tipo de modelo de color, si bien es aconsejable aplicarlo al modelo YUV (Y: iluminancia, UV: cromacidad) en la que cada uno de los canales es independiente. Compresión de imágenes de gran tamaño La descompresión es un proceso largo, para evitar esperas excesivas se suele dividir en elementos de menor tamaño y posteriormente se almacena un catálogo de forma que se permita un rápido acceso a cada una de las partes de la imagen. Esto permite además que sólo se descomprima el fragmento de imagen en la que deseemos trabajar, lo que supone un gran ahorro de tiempo ya que aunque el proceso de compresión sea más lento, éste usualmente sólo se realiza una vez, mientras que el de descompresión suele ser más frecuente.
36
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
ProcesoCompresión
Catálogo
Bloques de tamaño variable
Imagen Fraccionada
Efectos geométricos de la compresión JPEG En Fotogrametría es esencial la calidad geométrica. La calidad se puede empeorar en un proceso de compresión de la imagen en dos formas:
1) Por perdida de calidad radiométrica (cuando el posicionamiento de los elementos se realiza en una imagen borrosa)
2) Por deformación de los objetos en alguna (o las dos) direcciones. Estas degradaciones pueden ser en ambos casos locales o globales.
La pérdida de calidad geométrica de la imagen depende de diversos factores:
- método y cantidad de compresión - distribución de ND en la imagen digital - la calidad de la imagen original
37
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
De los métodos considerados dentro del estándar JPEG, únicamente el método de no degradativo asegura el mantenimiento de la calidad geométrica y radiométrica de la imagen, si bien como demuestran Mikhail et al (1984) la compresión DCT produce el desplazamiento máximo de 0.5 píxeles de los elementos cuando se aplica una tasa de compresión de 1:16 a una imagen de 8 bits.
Lammi y Sarjakoski (1995): Influencia de la compresión en la calidad geométrica de imágenes color.
Precisión (medida de la calidad interna o repetibilidad de las medidas) Exactitud (medida de la calidad externa -global- de las medidas comparadas con alguna
referencia considerada como representativa de la realidad). Escáner Sharp JX-600 (600ppp) y tres tasas 1:7 (Excelente), 1:15 (Alta) y 1:66 (Regular).
Calidad visual: 1:7 (Muy buena); 1:15 (Buena – se observan los efectos); 1:66 (Mala). Calidad geométrica: 50 elementos (tamaño mayor de 8 píxeles). 20 medidas en la imagen
original y 10 medidas en las comprimidas con precisión de subpixel.
Imagen (Nivel de compresión) Emax RSME V
Excelente (1:7) 0.27 0.12 99
Alta (1:15) 0.73 0.18 99
Regular (1:66) 2.76 0.50 99
Diferencias expresadas en píxeles
38
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Efectos de la compresión JPEG. Se puede observar el efecto de la división en subbloques
39
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Codificación Jerárquica Predictiva (HPC): Se utiliza para la compresión para imágenes de video. El algoritmo comienza con la creación de
una representación a escala a distintos niveles de la imagen original. Así por ejemplo, una imagen de un tamaño de 1024x1024 píxeles se descompone en cinco imágenes correspondientes a cinco niveles de escala: 512x512, 256x256, 128x128 y 64x64. La pirámide se crea mediante la convolución de las imágenes de mayor resolución mediante la aplicación de un operador gausiano y el aumento del tamaño del píxel al doble.
Se calculan las imágenes diferencia entre los niveles. Las diferencias representan los
componentes de alta frecuencia del nivel previo de la pirámide. La imagen original puede ser reconstruida a partir de su representación en el nivel de menor resolución (64x64 píxeles) y de las imágenes diferencia. Los valores diferencia son normalmente pequeños y pueden ser codificados y almacenados en un número reducido de bits, de forma que se alcanza una compresión sin pérdida de información, no obstante para obtener mayor tasa de compresión se utiliza la cuantificación, que produce degradación de la imagen y una compresión más eficaz pero con pérdida de calidad.
40
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
El algoritmo de la HPC consta de las siguientes etapas: - Creación de una pirámide gausiana con kernel 3x3 - Calculo de las imágenes diferencia - Almacenamiento en profundidad de color variable (8:5:3:1) La tasa de compresión es de 3.6 (8:5:3:1). Para obtener mayores tasas las imágenes
diferencia deben ser almacenadas con menor número de bits, aunque con la desventaja de un mayor riesgo de degradación de la imagen.
41
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Es un método más rápido que el método JPEG, Novak y Shanin (1996) realizan un estudio comparativo entre ambos métodos, tanto en lo relativo a tasas de compresión, como a calidad de las imágenes restauradas y velocidad de ejecución.
La tasa de compresión está relacionada con el método empleado: JPEG-75, tasa de 5.9 HPC-8.5.3.1, tasa de 3.6 JPEG-40, tasa de 12.5 HPC-8.3.3.1, tasa de 4.5 JPEG-25, tasa de 42.
alcanzándose errores medios cuadráticos inferiores al píxel en todos los métodos, con máximos inferiores al píxel en los métodos JPEG-75 y HPC-8.5.3.1.
Tiempo de ejecución: 1Mb imagen HPC: 5 s (Sun Sparcstation2) JPEG: 20s
Una ventaja adicional del HPC es contar con una imagen de resolución variable para los cálculos de carácter iterativo.
42
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
IMAGEN ORIGINAL
1024x1024
512x512
256x256
128x128
64x64
Cuantización 1 bit
Cuantización 3 bit
Cuantización 5 bit
Cuantización 8 bit
PIRÁMIDE DE IMÁGENES IMÁGENES DIFERENCIA
Imagen Nivel 4 (64x64). Ampliada 16 vecesImagen Original (Nivel 0) (1024x1024)
43
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Cuantificación vectorial Al igual que el JPEG, comienza con la división de la imagen en bloques de tamaño n x n píxeles,
si bien en este caso no existe ninguna predefinición en cuanto al tamaño de los mismos, si bien es frecuente el empleo de tamaño de 4x4 píxeles.
Estos bloques son comparados con un conjunto predefinido de bloques representativos (codebook), la comparación se establece mediante el cálculo de la sumatoria de las diferencias de cada elemento del bloque con cada elemento de cada uno de los bloques incluidos en el libro de códigos. Aquel código que presente una suma de diferencias menor será elegido como representativo y el bloque de la imagen original será sustituido por el índice del bloque seleccionado.
Las relaciones de compresión son elevadas, así por ejemplo, para una imagen de 24 bits/píxel (color RGB) es necesario un espacio de 384 bits para un bloque de 4x4 píxeles que pueden comprimirse en 10 bytes si se emplea una tabla de códigos de 1024 posibilidades (Tc=38.4).
La parte más compleja del método es la definición de los bloques codificados predefinidos. A priori, la solución más acertada podría parecer escoger como bloques aquellas porciones de la imagen que aportan más información (por ejemplo, bordes) si bien es necesario tener en cuenta que la frecuencia de aparición de dichos elementos en la imagen global es baja, con lo cual la imagen comprimida tendrá poca calidad.
44
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Compresión fractal Supone una ruptura total con la filosofía actual en cuanto a técnicas de compresión de
imágenes. En ella se almacenan son las fórmulas que nos van a dar lugar a la imagen. Por tanto, estas técnicas son independientes de la resolución de la imagen.
Las tasas de compresión son muy elevadas (en torno a 100) y con muy buenos resultados con
imágenes naturales. Se basan en la división de la imagen original en porciones más pequeñas, y dichas porciones en
otras más pequeñas y sucesivamente, estableciendo de una forma analítica las relaciones existentes entre las diferentes porciones, denominadas regiones del dominio. Las regiones son definidas en función de técnicas clásicas de análisis de imágenes tales como detección de bordes, análisis textural, ... . Al igual que el resto de los métodos degradativos, la compresión fractal introduce efectos en la imagen tales como suavizado y eliminación de detalles, no siendo, en principio aconsejable su utilización cuando el objetivo del trabajo fotogramétrico sea la restitución.
45
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
Transformaciones de wavelet discretas
Son técnicas que tienen actualmente un gran auge. La más conocida es MrSID (Multiresolution Seamless Image Database), que está implementado en software de Fotogrametría y Teledetección y que es empleado por organismos como el FBI (base de datos de huellas dactilares).
Obtiene tasas en torno a 70:1 (color), es decir, 3 veces más que con otros métodos similares –
JPEG-. Mr.SID presenta en cuanto a su estructura general ciertas analogías con el método JPEG, con la diferencia de que en el caso de Mr.SID se aplica una transformación de wavelet discreta (DWT) en lugar de una transformación de coseno discreto (DCT).
La principal ventaja de DWT frente a DCT es su carácter no local, con lo que proporciona mejores
tasas de compresión y una menor degradación de la imagen. DCT se basa en una transformación Fourier e intenta describir la imagen como una superposición de ondas de cosenos. Estas ondas son infinitas, por lo que requiere partir la imagen en bloques de tamaño reducido (8x8) y aplicar la transformación en cada bloque (teselado en la imagen comprimida).
46
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
El principal problema que presenta la DWT frente a la DCT es la cantidad de memoria requerida en la transformación. La división en bloques de la DCT aunque puede llegar a producir efectos indeseados en la imagen es muy eficiente (considera al bloque individualmente). DWT requiere el acceso a la imagen completa (complicado con imágenes de gran tamaño -> división de la imagen en bloques).
Una ventaja muy importante de DWT es que es una transformación multirresolución, incorporando
la posibilidad de la descompresión selectiva de porciones de la imagen. Esto facilita de una forma muy importante la visualización a todas las escalas de trabajo en especial las pequeñas y medianas, con tiempos de descompresión mucho más reducidos que los de LZW o JPEG.
47
Fotogrametría Digital – Ingeniería en Geodesia y Cartografía UNIVERSIDAD DE JAÉN Dpto. de Ingeniería Cartográfica,
Geodésica y Fotogrametría
JPEG2000
Se trata de un nuevo estándar de compresión que se basa en el empleo de DWT en lugar de DCT. Ventajas: - Superior rendimiento de compresión: PSNR= 0.25 bits/pixel - Permite comprimir imágenes de tono continuo y bitono - Perfectamente adaptado a imágenes de más de 8 bits/canal (preparado para 38 bits) - Permite comprimir imágenes de (232-1) x (232-1) con tan sólo 214 componentes - Puede ser definido como degradativo o no degradativo - Se puede predefinir el tamaño de la imagen comprimida - Permite la codificación a nivel de ROI - Muy robusto - Permite incorporar metainformación JPX - Permite incorporar sistemas de seguridad