Analise de T´ ecnicas de Visualizac´ ¸ao e Sistemas ...wiki.icmc.usp.br/images/4/47/Scc252(13)ImageVis.pdf · Analise de T´ ecnicas de Visualizac´ ¸ao e Sistemas aplicados a˜

Analise de Tecnicas de Visualizacao e Sistemas aplicados a

Colecoes de Imagens

Laura Florian Cruz

Instituto de Ciencias Matematicas e de Computacao,

Universidade de Sao Paulo, Sao Carlos/SP, Brasil

Resumo—Tecnicas de visualizacao de imagens sao frequen-

temente utilizadas para possibilitar ao usuario a analise e

exploracao entre as imagens. Em uma representacao visual,

as tecnicas de visualizacao permitem aos usuarios buscar

informacoes de maneira mais eficiente. Uma das alternativas

para esta forma de representacao e a utilizacao de projecoes

e outra mencionada neste trabalho e o uso de estruturas em

arvore, onde uma hierarquia e imposta aos dados, baseada

no mesmo criterio da projecao. Em primeiro lugar, a analise

de imagens e aplicacoes de processamento de imagens e usada

para calcular os vetores de caracterısticas nestas. Estos conjun-

tos de dados sao projetados sao os posicionados, como pontos,

num plano onde proximidade entre eles sugere similaridade.

Uma dificuldade comum e o grande numero de caracterısticas

que definem um espaco de alta dimensao que afeta fortemente

o desempenho na analise visual. Lidar com esse problema

normalmente exige reducao de dimensao. Existem ferramen-

tas desenvolvidas para a visualizacao aplicadas a colecoes

de imagens, como as tecnicas baseadas em projecao: MDS,

PCA, FastMap, Isomap, LSP e Neighboor Joining. Ate agora

existem muitos sistemas para a exploracao, onde o objetivo

principal e fornecer ao usuario uma maneira boa de explorar

a visualizacao.

I. INTRODUCAO

Pesquisas atuais mostram como tecnicas de visualizacao e

mineracao de dados podem ajudar na exploracao dessas

bases de dados, que busca informacoes potencialmente uteis.

Assim, a area de visualizacao de informacao centra-se no

estudo como exibir essas colecoes de informacoes, como

das imagens, ao usuario em uma representacao visual e

permitem que os usuarios procurem informacoes de maneira

mais eficiente.

Por exemplo, Moghaddam et al. [1] mostram que e possıvel

utilizar tecnicas de visualizacao de informacao, para propor-

cionar maneiras de revelar informacoes escondidas (relacoes

complexas) em uma representacao visual e permitem que os

usuarios procurem informacoes de maneira mais eficiente, e

gracas a capacidade visual humano para o aprendizagem e

identificacao de padroes, a visualizacao e uma boa alterna-

tiva para lidar com este tipo de problemas.

No entanto, a visualizacao em si e um problema difıcil,

um dos principais desafios e como encontrar de baixa

dimensionalidade, representacoes simples que representam

fielmente o conjunto de dados completo e as relacoes entre

os objetos de dados

Os topicos que sao desenvolvidos neste trabalho sao: os

metodos de projecao e exploracao. A projecao estudada a

partir da maneira sobre como reduzir as altas dimensionali-

dades das imagens originais em espacos de baixa dimensao

preservando sua estrutura original, mostrando as tecnicas

de visualizacao aplicadas em colecoes de imagens. E a

exploracao que se concentra em como fornecer ao usuario

uma maneira de explorar a visualizacao, citando os sistemas

desenvolvidos em visualizacao de imagens.

II. VISUALIZACAO DE IMAGENS

Atualmente, tecnicas de visualizacao de imagens fornecem

uma boa alternativa de geracao de representacoes compactas

duma colecao de imagens digitais que tem informacoes

relevantes.

A estrutura do sistema proposto para a visualizacao de

grandes colecoes de imagens e mostrada na Figura 1.

Primeiro, um processo de extracao de caracterısticas e

realizado em conjunto de dados e algumas caracterısticas de

baixo nıvel sao extraıdas. Assim, cada imagem na colecao

corresponde a um ponto em um espaco de alta dimensao.

Em segundo lugar, para cada caracterıstica, uma metrica

e selecionada, a fim de comparar as imagens com base

nessa caracterıstica, essa comparacao fornece um numero

real que define como as imagens sao semelhantes (funcao de

similaridade). Em terceiro lugar, uma matriz de similaridade

entre todas as imagens e construıda e e transformada em uma

matriz de distancia. Finalmente, um algoritmo de projecao

considera so as k dimensoes baseada na matriz de distancia

obtida anteriormente. Neste caso, k e definido como 2 e as

duas dimensoes sao usadas como coordenadas (x, y) para a

visualizacao de cada imagem num espaco 2D [2].

A. Representacao das imagens

A principal caracterıstica do processo de extracao e identifi-

car e extrair informacoes relevantes a partir da imagem que

permite a discriminacao de classes diferentes da imagem,

onde cada imagem I da colecao e representada por um vetor

de caracterısticas f(I); por exemplo, histograma do cor ou

textura.

Figura 1. Etapas de processamento para visualizar a colecao de imagens.

As imagens sao tipicamente caracterizadas por atributos

intrınsecos de imagens, tais como cor, textura e forma como

e mencionado por diversos autores [3], [4], [5], etc..

As caracterısticas de baixo nıvel, tais como a cor e a

textura sao frequentemente utilizadas para representar o

conteudo visual das imagens, sendo os correlogramas de cor,

momentos de cor e histogramas de cor as caracterısticas mais

usadas [6].

Outros descrevem cada imagem pela mediana de sua cor

como faz [7], [8]. Por outro lado, in Visual Image Browsing

and Exploration (Vibe) feito por Grant et al. [9] usa a

correlacao de cores gradiente das imagens.

Assim, como as waveletes Gabor sao um exemplo de

textura, mas existem muitos metodos de analise de textura

disponıveis, e estas podem ser aplicadas tanto para realizar

a segmentacao da imagem, ou extrair as propriedades de

textura das regioes segmentadas ou de toda a imagem.

As caracterısticas de textura fornecem mais informacoes

espaciais ou relacionais do que as caracterısticas de cor a fim

de saber mais sobre o conteudo de uma imagem, portanto

uma imagem pode ser representada atraves da combinacao

de caracterısticas de cor e textura como e explorado em [4].

Figura 2. Tecnica de segmentacao automatica.

Figura 3. Ferramenta de rotulagem.

A Figura 2 citada por Yang et al. [5] usa uma imagem

segmentada de baixo nıvel para obter as regioes homogeneas

da imagem sobre a cor ou textura, usando uma tecnica de

segmentacao automatica da imagem.

Por outro lado, Fan et al. [10] usa uma ferramenta onde uma

imagem e rotulada pela supervisao do usuario como uma

forma de representar o conceito da imagem, alem e utilizado

para o reconhecimento e deteccao de objetos, os principais

objetos na imagem sao extraıdos automaticamente, mostra-

dos na Figura 3.

B. Recuperacao de Imagens por conteudo

Um numero de sistemas de recuperacao de imagens foi

desenvolvido ao longo dos ultimos anos, como importante

forma de entender o que implica a recuperacao de imagens

relevantes.

Simplesmente, a recuperacao de imagens baseada em

conteudo (CBIR) e automaticamente a tarefa de encontrar

imagens que se assemelham a imagem de consulta do

usuario a partir de grandes conjuntos de dados usando as

caracterısticas visuais inerentes a propria imagem[8]. No

domınio dos sistemas CBIR, tem-se as seguintes fases[11]:

1) Encontrar tecnicas adequadas para codificar o

conteudo duma imagem. A maioria dos atuais sistemas

CBIR para fins gerais usam caracterısticas primitivas,

ou seja, cor, textura e forma.

2) Depois de selecionar uma imagem de consulta pelo

usuario, o sistema calcula o vetor de caracterısticas

correspondentes e compara-lo com todos os vetores de

caracterısticas relacionadas com as imagens no banco

de dados.

3) Imagens com a distancia mınima, com a imagem de

consulta serao apresentados em ordem decrescente.

Portanto, os sistemas de CBIR (Content Based Image Retri-

eval) conseguem determinar relacoes de similaridade entre

imagens em uma determinada colecao. Porem, se os usuarios

destes sistemas possuem acesso a uma interface visual na

qual as relacoes de similaridade podem ser facilmente visu-

alizadas como distancias em um plano ou espaco tridimen-

sional, entao eles podem se beneficiar com estes sistemas.

C. Mineracao Visual de Imagens

Uma parte importante na visualizacao de imagens e que

depois de fazer a projecao, este e analisado, a fim de

revelar informacoes uteis para os usuarios, como a extracao

de conhecimento implıcito, o relacionamento de dados, ou

outros padroes que nao explicitamente esta armazenados nas

imagens[12] .

Infelizmente, e difıcil ou mesmo impossıvel para o ser

Figura 4. A proyecao conseguiu separar bem os quatro grupos, empregando

PCA.

humano descobrir o conhecimento subjacente e padroes na

imagem ao trabalhar com uma grande colecao de imagens.

Uma atividade importante relacionada ao processo de

mineracao de conjuntos de imagens e a classificacao ou

categorizacao. Esse processo consiste em separar as imagens

de uma colecao, colocando-as em grupos previamente defini-

dos, representando assim uma maneira de extrair informacao

em imagens para reconhecer padroes e objetos homogeneos.

Diversas tecnicas de agrupamento podem ser encontra-

das, tais como K-medias , Mapas auto-organizaveis (Self-

Organizing Maps)[9], modelos de Markov e algoritmos

de agrupamento hierarquico, dentre outras. Um exemplo e

mostrado, na Figura 4 .

III. TECNICAS DE VISUALIZACAO APLICADAS A

COLECOES DE IMAGEM

Para gerar uma visualizacao multidimensional atraves de

projecoes, em geral os dados sao convertidos num espaco

vetorial, onde cada item de dados (indivıduo) e descrito

por um conjunto de atributos ou caracterısticas, que define

suas coordenadas neste espaco. Sobre esses dados e possıvel

extrair relacionamentos, como, por exemplo, relacionamen-

tos de similaridade entre os indivıduos. Projecoes realizam

alguma forma de processamento que mapeia os dados em

2D ou 3D (espacos visuais) de forma que a proximidade

dos itens de dados nesses espacos indica alta correcao de

conteudo.

Figura 5. Arvore de similaridade.

Uma alternativa ao mapeamento de dados baseado em

projecoes e a imposicao de uma hierarquia sobre algum

relacionamento significativo sobre os dados, como, por

exemplo, a similaridade calculada sobre as coordenadas da

representacao vetorial. A hierarquia extraıda deste processo

e refletida na forma de uma arvore (daı o termo ”arvore

de similaridades”), que e visualizada atraves de algoritmos

apropriados de apresentacao de arvores.

A classe de tecnicas englobando as duas estrategias

(projecoes e arvores de similaridade), as quais representam

cada indivıduo como um sımbolo no plano, identificando

suas relacoes (principalmente de similaridade) por proximi-

dade ou por algum outro artifıcio visual (como os ramos

da arvore, por exemplo), chamado aqui coletivamente de

visualizacao por mapeamento de pontos no plano.

A Figura 5, apresenta visualizacoes baseadas em arvores

de similaridade na figura 6 de uma colecao de imagens

medicas.

Figura 6. Projecao.

A. Visualizacao baseada em Projecao

Existem diferentes metodos para reduzir a dimensionalidade

de um conjunto de dados. Geralmente, estes metodos sele-

cionam as dimensoes que melhor preservem a informacao

original. Metodos como Escalonamento Multidimensional

(MDS) [13], Analise de Componentes Principais (PCA) [14],

Sammon Mapping [15], Fastmap [16], Feature Isometric

Mapping (Isomap)[17] e Projecao de mınimos quadrados

(LSP) [18] , tem sido uteis para esta tarefa de projecao.

MDS e uma tecnica que se concentra em encontrar o

subespaco que melhor preserva as distancias entre os pontos

e usa algebra linear para solucionar o problema. O processo

envolve o calculo de autovalores e autovetores de uma

matriz produto escalar e uma matriz de proximidade. A

entrada e uma matriz de distancia de imagens em um

espaco de alta dimensao, e o resultado e um conjunto de

coordenadas que representam as imagens em um espaco de

baixa dimensionalidade[19], [5]. A complexidade obtida e de

O(n2). Uma melhoria nessa abordagem foi proposta por [20]

que conseguiram reduzir a complexidade total do algoritmo

para O(n54 ).

PCA e um metodo Eigenvector tambem foi concebido para

modelar variabilidades lineares em dados de alta dimensao.

O metodo calcula as projecoes lineares de maior variacao

de os autovetores da matriz de covariancia. Em MDS,

a incorporacao de baixa dimensionalidade e calculada de

tal forma que melhor preserva as distancias entre pares

de objetos. Se estas distancias correspondem a distancias

euclidianas, os resultados do MDS metricas sao equivalentes

a PCA[21]. A principal desvantagem e a determinacao do

numero correto de dimensoes. Se o numero e pequeno

tende-se a perder caracterısticas importantes dos dados. Se

o numero e grande, se capturam caracterısticas importantes,

mas a representacao visual e difıcil. Outra desvantagem e

o custo computacional, O(m2n) (m numero de dimensoes),

que e inaceitavel quando o numero de elementos dos conjun-

tos de dados e muito grande, por exemplo, a partir de mil

vetores. Por exemplo, o Personal Digital Historian project

[1] usa PCA a fim de visualizar imagens, do mesmo modo,

[8]. Alem disso, em [22], usam o kernel principal component

analysis (KPCA), onde as imagens sao representados com

base em suas projecoes sobre os dois componentes princi-

pais.

A tecnica Sammon Mapping [15] procura preservar os dados

de um espaco multidimensional num espaco de dimensao

inferior, aplicando uma funcao de otimizacao para minimizar

a quantidade de informacao perdida durante o processo do

calculo das similaridades entre itens dos dados. Essa funcao

e otimizada aplicando procedimentos nao-lineares de busca

local em direcao do gradiente da funcao. O custo computa-

cional da tecnica, O(n2), representa uma desvantagem em

relacao as tecnica de projecao mais rapidas que sao descritas

mais adiante.

ISOMAP usa um grafo baseado no calculo da distancia,

a fim de medir a distancia ao longo das estruturas locais.

A tecnica cria o grafo de vizinhanca usando k-vizinhos

mais proximos, logo, usa o algoritmo de Dijkstra para

encontrar os caminhos mais curtos entre cada par de pontos

no grafo, assim a distancia para cada par e atribuıdo o com-

primento deste caminho mais curto e, finalmente, quando as

distancias sao aferidas, o MDS e aplicado a distancia nova

matriz[23][24]. Sua complexidade e tambem de O(n2).

A tecnica Fastmap [16] projeta pontos de um espaco

n−dimensional em um espaco m-dimensional (n > m),

visando preservar as relacoes de distancia no espaco ori-

ginal. Em primeiro lugar, no Fastmap sao selecionados dois

pontos que estejam o mais distante possıvel, denomina-

dos pivos, que definem uma reta no espaco n-dimensional

e um hiperplano perpendicular a dita reta, num espaco

(n − 1)−dimensional. Posteriormente, os pontos restantes

sao projetados nesse hiperplano. Esse processo continua ate

que se atinja o numero de dimensoes desejadas. O custo

computacional da Fastmap e O(n), mas e pouco efetivo

quando se trata de revelar estruturas nao-lineares.

Finalmente, a tecnica projecao de mınimos quadrados foi

desenvolvida por Paulovich et al. [18], com o objetivo de

criar uma superfıcie onde os dados estejam agrupados por

relacoes de proximidade para que o usuario possa inferir

as relacoes existentes no conjunto de dados. A LSP foi

baseada no estudo feito por [25] o qual aplica mınimos

quadrados na recuperacao e edicao de malhas (least-square

meshes). A reconstrucao geometrica da malha e feita a

partir do calculo da distancia entre um grupo de pontos

representativos, denominados pontos-de-controle, onde sao

aplicados calculos de distancia para preservar as relacoes de

vizinhanca entre todos os pontos.

A tecnica LSP realiza dois processos principais: no pri-

meiro, sao escolhidos um sub-conjunto de pontos (pontos-

de-controle), resultantes de aplicar a tecnica de agrupamento

k-medoids. Em seguida, esses pontos sao projetados fazendo

uso de qualquer tecnica de projecao convencional. No se-

gundo passo, se constroi um sistema linear baseado nas

relacoes de vizinhanca dos pontos em seu espaco original

Rn e nas coordenas cartesianas dos pontos-de-controle no

espaco reduzido Rm.

A complexidade computacional e determinada pelo numero

de agrupamentos. Para√n agrupamentos sera O(n

√n) [18].

A LSP possui a melhor precisao com relacao as demais

no que se refere a reconstrucao de vizinhancas do espaco

origial.

B. Visualizacao baseada em Grafos

O metodo neighbor joining constroi uma arvore sem raiz a

partir de uma matriz de distancias evolutivas, adaptando o

criterio de evolucao mınima 5. A ideia central da tecnica e

identificar pares de objetos mais proximos. Esses pares de

objetos, conhecidos comumente como vizinhos, sao conec-

tados por um no interno em uma arvore bifurcada.

A tecnica NJ comeca com uma arvore estrela, em se-

guida, escolhe-se o primeiro par de objetos para serem

unidos, aplicando o criterio da evolucao mınima. Entre esses

possıveis pares de objetos escolhemos aqueles que tenham

o menor valor no calculo da soma das distancias entre os

ramos. Uma vez escolhido o par de objetos vizinhos a

serem agrupados em um novo no. O algoritmo tem uma

complexidade computacional do NJ e O(n3).

O metodo NJ e amplamente usado na construcao de fi-

logenias. Existem varios trabalhos de pesquisa que usa-

ram o algoritmo NJ para ser comparado, segundo varios

criterios, com outros metodos de reconstrucao de arvores

filogeneticas. Os resultados mostraram que o NJ recupera

arvores apropriadas e sua velocidade foi melhor que todos

os outros metodos avaliados.

5O criterio de evolucao mınima tenta minimizar a soma dos tamanhos

de todos os nos da arvore.

Em [26], foi apresentado um algoritmo que melhora a veloci-

dade do metodo NJ com o objetivo de ser aplicado a grandes

conjuntos de dados. O algoritmo constroi a mesma arvore

filogenetica que o NJ, mas tenta diminuir o tempo de busca

para encontrar o par de vizinhos que formarao um novo no

usando a estrutura Quad-tree. O algoritmo somente consegue

melhorar o tempo de execucao para o melhor caso ((O(n2)),

deixando o pior caso O(n3). Outro trabalho destinado a

melhorar a velocidade do NJ foi realizado por [27], aqui

o tempo de processamento e O(n2logn) conseguindo gerar

arvores da mesma qualidade das geradas pelo algoritmo NJ

e sem usar algum espaco adicional para realizar os calculos.

A maior vantagem do metodo neighbor joining com respeito

a outros metodos e que ele constroi arvores com maior

eficiencia. Alem disso, o metodo e considerado muito rapido

em relacao a outros metodos usados na construcao de arvores

filogeneticas, tal como e mostrado por Saitou e Nei (1987).

No contexto de visualizacao de informacao, a NJ foi testada

em termos de precisao, e comparada positivamente em

relacao a projecoes multidimensionais, que trabalham com

conceitos de reducao de dimensionalidade e similaridade por

proximidade no plano de projecao.

A principal ideia das tecnicas de reducao de dimensio-

nalidade e posicionar um conjunto de dados num espaco

de baixa dimensionalidade preservando o maximo possıvel

as relacoes de similaridade existentes entre eles. Dessa

forma dados multidimensionais representados em espacos

de baixa dimensionalidade podem fazer uso da visualizacao

e classificacao de forma mais eficiente, revelando algumas

caracterısticas interessantes, como agrupamentos, tendencias

e anomalias.

Em contrapartida, o NJ identifica os objetos vizinhos que

sequencialmente minimizam o tamanho da arvore e e defi-

nido por tres componentes:

1) O criterio usado para selecionar pares de objetos,

2) a formula usada para reduzir a matriz de distancias a

cada passo

3) a formula para obter o comprimento dos ramos.

O NJ, alem de construir a topologia para uma arvore sem

raiz, tambem fornece o valor do comprimento dos ramos

da arvore resultante. A interpretacao depende dos ramos

mas, permite que se analise os dados em forma de ’grupos’

identificados pelos ramos externos da arvore. Ela ocupa

melhor o espaco que uma projecao, pois e possıvel expandir

o desenho da arvore de forma a reduzir significativamente,

ou eliminar, sobreposicoes.

No entanto, a arvore NJ gera um grande numero de nos

intermediarios (ou virtuais) o que, para conjuntos grande de

dados, toma um espaco visualmente que pode interferir no

numero de itens do dado que podem ser apresentados de

uma so vez. Isso contrasta com a capacidade das arvores de

similaridade de permitirem analises globais e locais usando

o mesmo tipo de layout, ou seja, a analise global pode ficar

prejudicada em configuracoes especıficas da arvore.

C. Outros

C. Chen et al. [3] apresentam sua aplicacao GSA, a qual

trabalha com redes Pathfinder para visualizar a forte inter-

relacao de proximidade em dados de imagens, baseadas em

tres caracterısticas distintas para extracao como cor, layout

e informacao de textura. Uma rede Pathfinder consta de

todas as conexoes mais fortes entre os vertices, enquanto a

que a condicao de desigualdade triangular nao sera violada.

Os nos nas redes sao conectados a refletir proximidade e

similaridade entre pares de imagem, preservando apenas as

conexoes mais importantes.

Tal como mostra a Figura 7 , as imagens sao ligadas

Figura 7. Red Pathfinder de InfoViz banco de imagens por modelos do

histograma de cores.

Figura 8. Visualizacao bidimensional HELD das 1000 imagens.

atraves de ligacoes deste tipo. Pode-se simplesmente estimar

a similaridade calculada entre duas imagens, estimando o

numero mınimo de ligacoes.

Wang et al.[28] propoe um metodo, High-Entropy Layout

Distributions (HELD). O metodo descrito neste artigo re-

solve as deficiencias enquanto a dados ocluıdos o regioes

vazias ou apenas escassamente povoadas. Este aproxima

as distribuicoes dos dados atraves da otimizacao com uma

medida de entropia de layout. HELD visualizacao usa uma

regiao de layout circular e mostrada na Figura 8.

Assim, Fan et al. [10] apresentam um sistema com

visualizacao hiperbolica. Neste trabalho, uma estrutura de

Figura 9. Visualizacao hiperbolica conceito de ontologia.

classificacao hierarquica incorpora o conceito de ontologia,

onde cada no da estrutura representa um conceito de imagem

em um certo nıvel semantico, desenvolvendo um esquema

novo para gerar o conceito orientado a sumarizacao de

colecoes de imagens em grande escala. Em outras palavras,

classifica as imagens com base em anotacoes automaticas.

A classificacao e realizada com Support Vector Machines.

Como e apresentada na Figura 9, os vertices com os

conceptos de cada imagem sao projetados para um plano

hiperbolico de acordo com suas relacoes contextuais e cada

projecao pode exatamente preservar as relacoes entre o

contexto original e os conceitos das imagens. Kernel PCA e

utilizada para agrupar semanticamente as imagens similares,

assim mesmo com a visualizacao hiperbolica os usuarios tem

permissao para manipular nao so as imagens, mas tambem

as suas relacoes de similaridade visual.

Do mesmo modo, Torres et al. [29] propoe a utilizacao de um

metodo baseado em espiral,uma versao alternativa baseada

em aneis concentricos. Exemplos de visualizacao utilizando

estes modelos sao mostrados na Figura 10.

IV. SISTEMAS DE VISUALIZACAO DE IMAGENS

Diversas aplicacoes podem-se beneficiar com o uso de

tecnicas de visualizacao de informacao aplicada a imagens.

Por exemplo, Moghaddam et al. [1] mostram que e possıvel

Figura 10. Exemplos de modelos gerados atraves da utilizacao das tecnicas

Espiral e Cırculos Concentricos, respectivamente.

utilizar tecnicas de visualizacao para melhorar o compar-

tilhamento e exibicao de fotos pessoais atraves de uma

sequencia temporal ou relacional apresentadas na Figura

11. Utilizando a tecnica PCA otimizada para reducao de

sobreposicao em um sistema de visualizacao e layout de

fotos pessoais chamado PERSONAL DIGITAL HISTO-

RIAN (PDH1), com o objetivo de simular o compartilha-

mento informal de fotos entre pessoas. A Figura 11 mostra

a organizacao de imagens montadas pelo sistema.

Alem no ano 2001, B. Bederson apresentou PhotoMesa

[30], que coloca o grupo de imagens em sub-regioes do

espaco de exposicao, aplicando a tecnica de visualizacao de

dados hierarquicos chamada Quantum Treemap. Mostrada

1http://www.merl.com/projects/PDH/

Figura 11. Mesa digitalizadora do PDH.

Figura 12. Sistema PhotoMesa.

em Figura 12.

Isto e, Quantum Treemaps e uma variacao nos algoritmos

treemap que sao projetados para que as imagens ou outros

objetos de tamanho indivisıvel(quantum). Apoia o algoritmo

Treemap ordenado, mas garante que cada retangulo gerado

tera uma largura e altura que sao um multiplo inteiro do

tamanho de um objeto de entrada.

Alem disso, Shiitani et al. [31] mostram o sistema MI-

RACLES, que trabalha com colecoes de dados que repre-

sentam conjuntos de informacoes (mıdias) associadas entre

si, coletadas de bancos de dados locais ou da Internet. A

principal funcionalidade de exploracao e chamada pop-up,

e permite ao usuario informar uma ou algumas palavras-

chave, reorganizar e refinar a colecao exibida. Um exemplo

Figura 13. Tela do sistema MIRACLES, com destaque para algumas

imagens da colecao.

de como determinadas imagens de uma colecao podem ser

destacadas para auxiliar na construcao de conhecimento e

mostrado na Figura 13.

In [23], [24] os autores apresentam ImIk, um sistema

que fornece ao usuario uma melhor maneira de aces-

sar interativamente uma colecao de imagens e enfatiza

em encontrar as melhores posicoes ideais de imagens no

espaco de visualizacao. Para eles e de muita importancia

a sobreposicao de imagens e preservacao de sua projecao.

A sobreposicao entre as imagens influenciam a qualidade

de uma ferramenta de visualizacao, entao a sobreposicao de

imagens e preservacao da estrutura e mınima. A visibilidade

Figura 14. ImIk.

e essencial para a interacao entre o usuario e as imagens

exibidas. Usam as tecnicas como MDS, ISOMAP, SNE,

LLE, ISOSNE e ISOLLE para fazer a visualizacao. Na

Figura 14 a tela principal mostra o sistema de visualizacao

com o conjunto representativo de imagens do. O canto

superior esquerdo mostra toda a colecao como um ponto

de ajuste com o vermelho (ou cinza na impressao nao-cor)

os pontos que representam o atual conjunto de projecao.

O canto inferior esquerdo mostra uma versao ampliada da

miniatura selecionada. O retangulo desenhado na tela e um

exemplo de uma selecao de usuario de um grupo de imagens,

arrastando o mouse.

Do mesmo modo, Eler et al. [32] apresentam o software Pex-

Image2, um framework visual que suporta todo o processo

de analise e exploracao visual de colecoes de imagens e

textos associados. Pex-Image implementa diversas tecnicas

projecao de colecoes de imagens que enfatizam a similari-

dade entre estas imagens, alem de oferecer funcionalidades

complementares para ajudar na exploracao dos dados. O

software permite que seja feita uma coordenacao entre varias

projecoes de uma mesma colecao de imagens (Figura 15, de

forma que o usuario pode selecionar uma ou varias imagens

em uma projecao, e visualizar ou a posicao destas imagens

em outra projecao (identity coordination), ou visualizar os

2http://infoserver.lcad.icmc.usp.br/infovis2/PExImage

Figura 15. Coordenacao entre duas projecoes realizadas pelo Pex-Image.

Figura 16. Janela principal do Sistema VISRET.

k vizinhos mais proximos desta selecao em outra projecao

(distance coordination), instantaneamente.

Recentemente Kovacs et al. [33] apresentam um sistema

VISRET, para visualizar imagens do vıdeo, como mostra

a Figura 16.

Tambem, Gomi et al[34] no ano 2010 propoe Miaow (Me-

morized Image Album Organized by When/Where), um

visualizador de imagens em 3D que representa fotografias

hierarquicamente classificadas com base em suas posicoes

(eixos X e Y) e o tempos (eixo Z), data das fotos, ani-

nhados em regioes retangulares. A Figura 17, mostra uma

navegacao de fotografias usando Miaow.

Incluindo projecao em 3D, Nakazato e Huang [35] propoem

o 3DMars 3, um sistema interativo de visualizacao de

conjuntos de imagens, em um ambiente virtual 3D, como

mostra a Figura 18, onde a Figura de abaixo representa o

3http://www.ifp.illinois.edu/ nakazato/3dmars/

Figura 17. Visualizador de imagens 3D Miaow.

Figura 18. Visualizacao do resultado de uma consulta no 3DMars.

resultado da imagem-consulta do usuario.

Ademais, em [1] emprega um espaco de visualizacao

Figura 19. Espaco de visualizacao esferico.

esferico, mostrado na Figura 19, as imagens sao projetadas

na superfıcie do globo localizadas proximas umas das outras.

A navegacao e feita simplesmente girando e inclinando a

esfera de navegacao e as imagens sao organizadas em forma

de grade que permite uma navegacao mais rapida do que

os metodos onde as imagens se sobrepoem. E para lidar

com grandes bases de imagens, empregam uma abordagem

hierarquizada, onde o usuario pode aplicar zoom em uma

area particular e do sistema, por sua vez traz mais imagens

visuais relevantes. Alem, devido ao espaco limitado no plano

de visualizacao minimiza a sobreposicao entre as imagens,

para isso emprega-se uma estrutura de arvore hierarquica.

Tambem Quadrianto et al.[4] usa esferas, grids, hierarquias.

V. CONCLUSAO

Os avancos na visualizacao de informacao e tecnicas de

mineracao de dados em imagens ja permitem aos usuarios

uma maneira de revelar informacoes escondidas, de modo

que se estudam as relacoes de similaridades entre imagens.

Tecnicas de visualizacao de informacao, uma ferramenta

importante para garantir a interacao por parte do usuario,

de onde ele recupera uma ou varias imagens desejadas, ou

detecta tendencias e caracterısticas particulares que seriam

extremamente difıceis de serem detectadas caso ele anali-

sasse imagem por imagem.

Alem disso, a principal caracterıstica do processo de

visualizacao e a extracao com o fim de identificar e extrair

informacoes relevantes a partir da imagem que permita a

discriminacao de classes diferentes da imagem, onde cada

imagem da colecao e representada por um vetor de carac-

terısticas feito por exemplo, por seus atributos intrınsecos,

tais como cor, textura e forma.

Com efeito, os usuarios de sistemas CBIR possuem acesso

a uma interface visual na qual as relacoes de similaridade

podem ser facilmente visualizadas a partir de uma consulta

mas nao podem avaliar todas as imagem de maneira geral.

O usuario se torna um agente ativo no processo de mineracao

das informacoes, pois consegue, alem de visualizar as

relacoes entre os dados, interagir com o modelo, tendo uma

visao geral dos dados, ou concentrando-se em fenomenos

particulares. Esta e uma parte importante na visualizacao de

imagens e que depois de fazer a projecao, esta e analisada,

a fim de revelar informacoes uteis para os usuarios, donde

o relacionamento de dados esta no processo de mineracao

expressado na classificacao ou categorizacao.

Incluindo, as tecnicas de visualizacao aplicadas a colecoes

de imagens, como os metodos de projecao e visto a partir

da maneira sobre como reduzir as altas dimensionalidades

das imagens originais em espacos de baixa dimensao pre-

servando sua estrutura original. E os baseados em conexao

de grafos, no qual as imagens sao visualizadas por um grafo

com conexoes tracadas de acordo com as relacoes entre as

imagens da colecao.

Assim, a parte exploratoria da visualizacao de imagens, se

concentra em como fornecer ao usuario uma maneira de

explorar os dados visualizados; para esso agora existem

muitos sistemas que desenvolvem uma boa interacao com

o usuario, ja sea em um ambiente de 2 ou 3 dimensoes.

REFERENCIAS

[1] C. S. B.Moghaddam, N.Lesh and T. Huang, “Visualization &

layout for personal photo libraries,” 2001.

[2] F. G. Jorge Camargo and R. Torres, “Visualization of large

collection of medical images,” 2008.

[3] G. G. C. Chen and P. Rosin, “Similarity-based image brow-

sing,” pp. 206–213, 2000.

[4] T. T. N. Quadrianto, K. Kersting and W. Buntine, “Beyond 2d-

grids: a dependence maximization view on image browsing,”

International conference on Multimedia information retrieval,

2010.

[5] D. H. J. Yang, J. Fan and Y. Gao, “Semantic image browser:

Bridging information visualization with automated intelligent

image analysis,” Visual Analytics Science And Technology,

2009.

[6] M. N. R. Stehling and A. Falcao, “A compact and efficient

image retrieval approach based on border/interior pixel classi-

fication,” Proceedings of the eleventh international conference

on Information and knowledge management, 2002.

[7] G. Schaefer, “A next generation browsing environment for

large image repositories,” Multimedia Tools Applications,

vol. 47, no. 1, pp. 105–120, 2010.

[8] G. Hu and Q. Gao, “An interactive image feature visualization

system for supporting cbir study,” International Conference

on Image Analysis and Recognition, 2009.

[9] O. H. G. Strong and M. Gong, “Visual image browsing and

exploration (vibe): User evaluations of image search tasks,”

ACTIVE MEDIA TECHNOLOGY, 2010.

[10] Y. G. J. Fan and H.Luo, “Hierarchical classification for

automatic image annotation,” in Proceedings XXX ACM In-

ternational Conference on Research and Development in

Information Retrieval. New York, USA: ACM Press, 2007,

pp. 111–118.

[11] E. F. A. Ahmadian and F. Sayadian, “Image indexing and

retrieval using gabor wavelet and legendre moments,” Pro-

ceedings of the 25th Annual International Conference of the

IEEE, 2003.

[12] M. L. L. Wynne Hsu and J. Zhang, “Image mining: Trends

and developments,” Intelligent Information Systems, 2002.

[13] W. Torgerson, “Multidimensional scaling: I. theory and

method,” Psychometrika, no. 4, pp. 401–419, 1952.

[14] I.Jolliffe, Principal Component Analysis, 2nd ed. Springer,

2002.

[15] J. Sammon, “A nonlinear mapping for data structure analysis,”

IEEE Computer Society, vol. C-18, no. 5, pp. 401–409, 1969.

[16] C. Faloutsos and K. Lin, “Fastmap: A fast algorithm for

indexing, datamining and visualization of traditional and

multimedia databases,” in Proceedings of International Con-

ference on Management of Data: ACM SIGMOD, M. J. Carey

and D. A. Schneider, Eds. San Jose, California: ACM Press:

New York, 1995, pp. 163–174.

[17] V. d. S. J. Tenenbaum and J. Langford, “A global geometric

framework for nonlinear dimensionality reduction,” Science,

vol. 290, no. 5500, pp. 2319–2323, 2000.

[18] F. V. Paulovich, L. G. Nonato, R. Minghim, and H. Lev-

kowitz, “Least square projection: a fast high precision mul-

tidimensional projection technique and its application to do-

cument mapping,” IEEE Transactions on Visualization and

Computer Graphics, vol. 14, pp. 564–575, 2008.

[19] J. Zhang, Visualization for Information Retrieval, 1st ed.

Springer, 2008.

[20] A. Morrison, G. Ross, and M. Chalmers, “A hybrid layout

algorithm for sub-quadratic multidimensional scaling,” INFO-

VIS02: Proceedings of the IEEE Symposium on Information

Visualization, p. 152, 2002.

[21] S. T. Roweis and L. K. Saul, “Nonlinear dimensionality

reduction by locally linear embedding,” Science, vol. 290,

no. 5500, pp. 2323–2326, 2000.

[22] A. C. J. Camargo, J. Caicedo and F. Gonzalez, “A kernel-

based strategy for exploratory image collection search,”

Content-Based Multimedia Indexing, 2010.

[23] G. Nguyen and M. Worring, “Interactive access to large image

collections using similarity-based visualization,” Journal of

Visual Languages and Computing, 2006.

[24] ——, “Similarity based visualization of image collections,”

Journal of Visual Languages and Computing, 2008.

[25] O. Sorkine and D. Cohen-Or, “Least-squares meshes,” in Pro-

ceedings of Shape Modeling International. IEEE Computer

Society Press, 2004, pp. 191–199.

[26] T. Mailund, G. Brodal, R. Fagerberg, C. Pedersen, and

D. Phillips, “Recrafting the neighbor-joining method,” BMC

Bioinformatics, vol. 7, p. 29, 2006.

[27] J. Evans, L. Sheneman, and J. Foster, “Relaxed neighbor

joining: A fast distance-based phylogenetic tree construction

method,” Journal of Molecular Evolution, vol. 62, no. 6, pp.

785–792, 2006.

[28] J. H. R. Wang, S. McKenna and A. Ward, “Visualizing image

collections using high-entropy layout distributions,” IEEE

Transactions on Multimedia, 2010.

[29] C. M. R. Torres, C. Silva and H. Rocha, “Visual structures

for image browsing,” Proceedings of the twelfth international

conference on Information and knowledge management, no. 4,

2003.

[30] B. Bederson, “Quantum treemaps and bubblemaps for a

zoomable image browser,” Symposium on User Interface

Software and Technology, 2001.

[31] S. E. S.huichi Shiitani, T. Baba and S. Nagata, “Interactive

video retrieval system integrating visual search with textual

search,” Symposium on Intelligent Multimedia Knowledge

Management, 2003.

[32] D. M. Eler, M. Y. Nakazaki, F. V. Paulovich, D. P. Santos,

M. C. F. Oliveira, a. E. S. B. Neto, Jo and R. Minghim,

“Multidimensional visualization to support analysis of image

collections,” in SIBGRAPI ’08: Proceedings of the 2008

XXI Brazilian Symposium on Computer Graphics and Image

Processing. Washington, DC, USA: IEEE Computer Society,

2008, pp. 289–296.

[33] A. U. Levente Kovacs and T. Sziranyi, “Visret a content based

annotation, retrieval and visualization toolchain,” ADVAN-

CED CONCEPTS FOR INTELLIGENT VISION SYSTEMS,

2009.

[34] A. Gomi and T. Itoh, “Miaow: a 3d image browser applying

a location- and time-based hierarchical data visualization

technique,” International Conference on Advanced Visual

Interfaces, 2010.

[35] M. Nakazato and T. Huang, “3d mars: Immersive virtual

reality for content-based image retrieval,” Multimedia and

Expo, 2001. ICME 2001. IEEE International Conference,

2001.

Documents

Analise de T´ ecnicas de Visualizac´ ¸ao e Sistemas ...wiki.icmc.usp.br/images/4/47/Scc252(13)ImageVis.pdf · Analise de T´ ecnicas de Visualizac´ ¸ao e Sistemas aplicados a˜