Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Analise de Tecnicas de Visualizacao e Sistemas aplicados a
Colecoes de Imagens
Laura Florian Cruz
Instituto de Ciencias Matematicas e de Computacao,
Universidade de Sao Paulo, Sao Carlos/SP, Brasil
Resumo—Tecnicas de visualizacao de imagens sao frequen-
temente utilizadas para possibilitar ao usuario a analise e
exploracao entre as imagens. Em uma representacao visual,
as tecnicas de visualizacao permitem aos usuarios buscar
informacoes de maneira mais eficiente. Uma das alternativas
para esta forma de representacao e a utilizacao de projecoes
e outra mencionada neste trabalho e o uso de estruturas em
arvore, onde uma hierarquia e imposta aos dados, baseada
no mesmo criterio da projecao. Em primeiro lugar, a analise
de imagens e aplicacoes de processamento de imagens e usada
para calcular os vetores de caracterısticas nestas. Estos conjun-
tos de dados sao projetados sao os posicionados, como pontos,
num plano onde proximidade entre eles sugere similaridade.
Uma dificuldade comum e o grande numero de caracterısticas
que definem um espaco de alta dimensao que afeta fortemente
o desempenho na analise visual. Lidar com esse problema
normalmente exige reducao de dimensao. Existem ferramen-
tas desenvolvidas para a visualizacao aplicadas a colecoes
de imagens, como as tecnicas baseadas em projecao: MDS,
PCA, FastMap, Isomap, LSP e Neighboor Joining. Ate agora
existem muitos sistemas para a exploracao, onde o objetivo
principal e fornecer ao usuario uma maneira boa de explorar
a visualizacao.
I. INTRODUCAO
Pesquisas atuais mostram como tecnicas de visualizacao e
mineracao de dados podem ajudar na exploracao dessas
bases de dados, que busca informacoes potencialmente uteis.
Assim, a area de visualizacao de informacao centra-se no
estudo como exibir essas colecoes de informacoes, como
das imagens, ao usuario em uma representacao visual e
permitem que os usuarios procurem informacoes de maneira
mais eficiente.
Por exemplo, Moghaddam et al. [1] mostram que e possıvel
utilizar tecnicas de visualizacao de informacao, para propor-
cionar maneiras de revelar informacoes escondidas (relacoes
complexas) em uma representacao visual e permitem que os
usuarios procurem informacoes de maneira mais eficiente, e
gracas a capacidade visual humano para o aprendizagem e
identificacao de padroes, a visualizacao e uma boa alterna-
tiva para lidar com este tipo de problemas.
No entanto, a visualizacao em si e um problema difıcil,
um dos principais desafios e como encontrar de baixa
dimensionalidade, representacoes simples que representam
fielmente o conjunto de dados completo e as relacoes entre
os objetos de dados
Os topicos que sao desenvolvidos neste trabalho sao: os
metodos de projecao e exploracao. A projecao estudada a
partir da maneira sobre como reduzir as altas dimensionali-
dades das imagens originais em espacos de baixa dimensao
preservando sua estrutura original, mostrando as tecnicas
de visualizacao aplicadas em colecoes de imagens. E a
exploracao que se concentra em como fornecer ao usuario
uma maneira de explorar a visualizacao, citando os sistemas
desenvolvidos em visualizacao de imagens.
II. VISUALIZACAO DE IMAGENS
Atualmente, tecnicas de visualizacao de imagens fornecem
uma boa alternativa de geracao de representacoes compactas
duma colecao de imagens digitais que tem informacoes
relevantes.
A estrutura do sistema proposto para a visualizacao de
grandes colecoes de imagens e mostrada na Figura 1.
Primeiro, um processo de extracao de caracterısticas e
realizado em conjunto de dados e algumas caracterısticas de
baixo nıvel sao extraıdas. Assim, cada imagem na colecao
corresponde a um ponto em um espaco de alta dimensao.
Em segundo lugar, para cada caracterıstica, uma metrica
e selecionada, a fim de comparar as imagens com base
nessa caracterıstica, essa comparacao fornece um numero
real que define como as imagens sao semelhantes (funcao de
similaridade). Em terceiro lugar, uma matriz de similaridade
entre todas as imagens e construıda e e transformada em uma
matriz de distancia. Finalmente, um algoritmo de projecao
considera so as k dimensoes baseada na matriz de distancia
obtida anteriormente. Neste caso, k e definido como 2 e as
duas dimensoes sao usadas como coordenadas (x, y) para a
visualizacao de cada imagem num espaco 2D [2].
A. Representacao das imagens
A principal caracterıstica do processo de extracao e identifi-
car e extrair informacoes relevantes a partir da imagem que
permite a discriminacao de classes diferentes da imagem,
onde cada imagem I da colecao e representada por um vetor
de caracterısticas f(I); por exemplo, histograma do cor ou
textura.
Figura 1. Etapas de processamento para visualizar a colecao de imagens.
As imagens sao tipicamente caracterizadas por atributos
intrınsecos de imagens, tais como cor, textura e forma como
e mencionado por diversos autores [3], [4], [5], etc..
As caracterısticas de baixo nıvel, tais como a cor e a
textura sao frequentemente utilizadas para representar o
conteudo visual das imagens, sendo os correlogramas de cor,
momentos de cor e histogramas de cor as caracterısticas mais
usadas [6].
Outros descrevem cada imagem pela mediana de sua cor
como faz [7], [8]. Por outro lado, in Visual Image Browsing
and Exploration (Vibe) feito por Grant et al. [9] usa a
correlacao de cores gradiente das imagens.
Assim, como as waveletes Gabor sao um exemplo de
textura, mas existem muitos metodos de analise de textura
disponıveis, e estas podem ser aplicadas tanto para realizar
a segmentacao da imagem, ou extrair as propriedades de
textura das regioes segmentadas ou de toda a imagem.
As caracterısticas de textura fornecem mais informacoes
espaciais ou relacionais do que as caracterısticas de cor a fim
de saber mais sobre o conteudo de uma imagem, portanto
uma imagem pode ser representada atraves da combinacao
de caracterısticas de cor e textura como e explorado em [4].
Figura 2. Tecnica de segmentacao automatica.
Figura 3. Ferramenta de rotulagem.
A Figura 2 citada por Yang et al. [5] usa uma imagem
segmentada de baixo nıvel para obter as regioes homogeneas
da imagem sobre a cor ou textura, usando uma tecnica de
segmentacao automatica da imagem.
Por outro lado, Fan et al. [10] usa uma ferramenta onde uma
imagem e rotulada pela supervisao do usuario como uma
forma de representar o conceito da imagem, alem e utilizado
para o reconhecimento e deteccao de objetos, os principais
objetos na imagem sao extraıdos automaticamente, mostra-
dos na Figura 3.
B. Recuperacao de Imagens por conteudo
Um numero de sistemas de recuperacao de imagens foi
desenvolvido ao longo dos ultimos anos, como importante
forma de entender o que implica a recuperacao de imagens
relevantes.
Simplesmente, a recuperacao de imagens baseada em
conteudo (CBIR) e automaticamente a tarefa de encontrar
imagens que se assemelham a imagem de consulta do
usuario a partir de grandes conjuntos de dados usando as
caracterısticas visuais inerentes a propria imagem[8]. No
domınio dos sistemas CBIR, tem-se as seguintes fases[11]:
1) Encontrar tecnicas adequadas para codificar o
conteudo duma imagem. A maioria dos atuais sistemas
CBIR para fins gerais usam caracterısticas primitivas,
ou seja, cor, textura e forma.
2) Depois de selecionar uma imagem de consulta pelo
usuario, o sistema calcula o vetor de caracterısticas
correspondentes e compara-lo com todos os vetores de
caracterısticas relacionadas com as imagens no banco
de dados.
3) Imagens com a distancia mınima, com a imagem de
consulta serao apresentados em ordem decrescente.
Portanto, os sistemas de CBIR (Content Based Image Retri-
eval) conseguem determinar relacoes de similaridade entre
imagens em uma determinada colecao. Porem, se os usuarios
destes sistemas possuem acesso a uma interface visual na
qual as relacoes de similaridade podem ser facilmente visu-
alizadas como distancias em um plano ou espaco tridimen-
sional, entao eles podem se beneficiar com estes sistemas.
C. Mineracao Visual de Imagens
Uma parte importante na visualizacao de imagens e que
depois de fazer a projecao, este e analisado, a fim de
revelar informacoes uteis para os usuarios, como a extracao
de conhecimento implıcito, o relacionamento de dados, ou
outros padroes que nao explicitamente esta armazenados nas
imagens[12] .
Infelizmente, e difıcil ou mesmo impossıvel para o ser
Figura 4. A proyecao conseguiu separar bem os quatro grupos, empregando
PCA.
humano descobrir o conhecimento subjacente e padroes na
imagem ao trabalhar com uma grande colecao de imagens.
Uma atividade importante relacionada ao processo de
mineracao de conjuntos de imagens e a classificacao ou
categorizacao. Esse processo consiste em separar as imagens
de uma colecao, colocando-as em grupos previamente defini-
dos, representando assim uma maneira de extrair informacao
em imagens para reconhecer padroes e objetos homogeneos.
Diversas tecnicas de agrupamento podem ser encontra-
das, tais como K-medias , Mapas auto-organizaveis (Self-
Organizing Maps)[9], modelos de Markov e algoritmos
de agrupamento hierarquico, dentre outras. Um exemplo e
mostrado, na Figura 4 .
III. TECNICAS DE VISUALIZACAO APLICADAS A
COLECOES DE IMAGEM
Para gerar uma visualizacao multidimensional atraves de
projecoes, em geral os dados sao convertidos num espaco
vetorial, onde cada item de dados (indivıduo) e descrito
por um conjunto de atributos ou caracterısticas, que define
suas coordenadas neste espaco. Sobre esses dados e possıvel
extrair relacionamentos, como, por exemplo, relacionamen-
tos de similaridade entre os indivıduos. Projecoes realizam
alguma forma de processamento que mapeia os dados em
2D ou 3D (espacos visuais) de forma que a proximidade
dos itens de dados nesses espacos indica alta correcao de
conteudo.
Figura 5. Arvore de similaridade.
Uma alternativa ao mapeamento de dados baseado em
projecoes e a imposicao de uma hierarquia sobre algum
relacionamento significativo sobre os dados, como, por
exemplo, a similaridade calculada sobre as coordenadas da
representacao vetorial. A hierarquia extraıda deste processo
e refletida na forma de uma arvore (daı o termo ”arvore
de similaridades”), que e visualizada atraves de algoritmos
apropriados de apresentacao de arvores.
A classe de tecnicas englobando as duas estrategias
(projecoes e arvores de similaridade), as quais representam
cada indivıduo como um sımbolo no plano, identificando
suas relacoes (principalmente de similaridade) por proximi-
dade ou por algum outro artifıcio visual (como os ramos
da arvore, por exemplo), chamado aqui coletivamente de
visualizacao por mapeamento de pontos no plano.
A Figura 5, apresenta visualizacoes baseadas em arvores
de similaridade na figura 6 de uma colecao de imagens
medicas.
Figura 6. Projecao.
A. Visualizacao baseada em Projecao
Existem diferentes metodos para reduzir a dimensionalidade
de um conjunto de dados. Geralmente, estes metodos sele-
cionam as dimensoes que melhor preservem a informacao
original. Metodos como Escalonamento Multidimensional
(MDS) [13], Analise de Componentes Principais (PCA) [14],
Sammon Mapping [15], Fastmap [16], Feature Isometric
Mapping (Isomap)[17] e Projecao de mınimos quadrados
(LSP) [18] , tem sido uteis para esta tarefa de projecao.
MDS e uma tecnica que se concentra em encontrar o
subespaco que melhor preserva as distancias entre os pontos
e usa algebra linear para solucionar o problema. O processo
envolve o calculo de autovalores e autovetores de uma
matriz produto escalar e uma matriz de proximidade. A
entrada e uma matriz de distancia de imagens em um
espaco de alta dimensao, e o resultado e um conjunto de
coordenadas que representam as imagens em um espaco de
baixa dimensionalidade[19], [5]. A complexidade obtida e de
O(n2). Uma melhoria nessa abordagem foi proposta por [20]
que conseguiram reduzir a complexidade total do algoritmo
para O(n54 ).
PCA e um metodo Eigenvector tambem foi concebido para
modelar variabilidades lineares em dados de alta dimensao.
O metodo calcula as projecoes lineares de maior variacao
de os autovetores da matriz de covariancia. Em MDS,
a incorporacao de baixa dimensionalidade e calculada de
tal forma que melhor preserva as distancias entre pares
de objetos. Se estas distancias correspondem a distancias
euclidianas, os resultados do MDS metricas sao equivalentes
a PCA[21]. A principal desvantagem e a determinacao do
numero correto de dimensoes. Se o numero e pequeno
tende-se a perder caracterısticas importantes dos dados. Se
o numero e grande, se capturam caracterısticas importantes,
mas a representacao visual e difıcil. Outra desvantagem e
o custo computacional, O(m2n) (m numero de dimensoes),
que e inaceitavel quando o numero de elementos dos conjun-
tos de dados e muito grande, por exemplo, a partir de mil
vetores. Por exemplo, o Personal Digital Historian project
[1] usa PCA a fim de visualizar imagens, do mesmo modo,
[8]. Alem disso, em [22], usam o kernel principal component
analysis (KPCA), onde as imagens sao representados com
base em suas projecoes sobre os dois componentes princi-
pais.
A tecnica Sammon Mapping [15] procura preservar os dados
de um espaco multidimensional num espaco de dimensao
inferior, aplicando uma funcao de otimizacao para minimizar
a quantidade de informacao perdida durante o processo do
calculo das similaridades entre itens dos dados. Essa funcao
e otimizada aplicando procedimentos nao-lineares de busca
local em direcao do gradiente da funcao. O custo computa-
cional da tecnica, O(n2), representa uma desvantagem em
relacao as tecnica de projecao mais rapidas que sao descritas
mais adiante.
ISOMAP usa um grafo baseado no calculo da distancia,
a fim de medir a distancia ao longo das estruturas locais.
A tecnica cria o grafo de vizinhanca usando k-vizinhos
mais proximos, logo, usa o algoritmo de Dijkstra para
encontrar os caminhos mais curtos entre cada par de pontos
no grafo, assim a distancia para cada par e atribuıdo o com-
primento deste caminho mais curto e, finalmente, quando as
distancias sao aferidas, o MDS e aplicado a distancia nova
matriz[23][24]. Sua complexidade e tambem de O(n2).
A tecnica Fastmap [16] projeta pontos de um espaco
n−dimensional em um espaco m-dimensional (n > m),
visando preservar as relacoes de distancia no espaco ori-
ginal. Em primeiro lugar, no Fastmap sao selecionados dois
pontos que estejam o mais distante possıvel, denomina-
dos pivos, que definem uma reta no espaco n-dimensional
e um hiperplano perpendicular a dita reta, num espaco
(n − 1)−dimensional. Posteriormente, os pontos restantes
sao projetados nesse hiperplano. Esse processo continua ate
que se atinja o numero de dimensoes desejadas. O custo
computacional da Fastmap e O(n), mas e pouco efetivo
quando se trata de revelar estruturas nao-lineares.
Finalmente, a tecnica projecao de mınimos quadrados foi
desenvolvida por Paulovich et al. [18], com o objetivo de
criar uma superfıcie onde os dados estejam agrupados por
relacoes de proximidade para que o usuario possa inferir
as relacoes existentes no conjunto de dados. A LSP foi
baseada no estudo feito por [25] o qual aplica mınimos
quadrados na recuperacao e edicao de malhas (least-square
meshes). A reconstrucao geometrica da malha e feita a
partir do calculo da distancia entre um grupo de pontos
representativos, denominados pontos-de-controle, onde sao
aplicados calculos de distancia para preservar as relacoes de
vizinhanca entre todos os pontos.
A tecnica LSP realiza dois processos principais: no pri-
meiro, sao escolhidos um sub-conjunto de pontos (pontos-
de-controle), resultantes de aplicar a tecnica de agrupamento
k-medoids. Em seguida, esses pontos sao projetados fazendo
uso de qualquer tecnica de projecao convencional. No se-
gundo passo, se constroi um sistema linear baseado nas
relacoes de vizinhanca dos pontos em seu espaco original
Rn e nas coordenas cartesianas dos pontos-de-controle no
espaco reduzido Rm.
A complexidade computacional e determinada pelo numero
de agrupamentos. Para√n agrupamentos sera O(n
√n) [18].
A LSP possui a melhor precisao com relacao as demais
no que se refere a reconstrucao de vizinhancas do espaco
origial.
B. Visualizacao baseada em Grafos
O metodo neighbor joining constroi uma arvore sem raiz a
partir de uma matriz de distancias evolutivas, adaptando o
criterio de evolucao mınima 5. A ideia central da tecnica e
identificar pares de objetos mais proximos. Esses pares de
objetos, conhecidos comumente como vizinhos, sao conec-
tados por um no interno em uma arvore bifurcada.
A tecnica NJ comeca com uma arvore estrela, em se-
guida, escolhe-se o primeiro par de objetos para serem
unidos, aplicando o criterio da evolucao mınima. Entre esses
possıveis pares de objetos escolhemos aqueles que tenham
o menor valor no calculo da soma das distancias entre os
ramos. Uma vez escolhido o par de objetos vizinhos a
serem agrupados em um novo no. O algoritmo tem uma
complexidade computacional do NJ e O(n3).
O metodo NJ e amplamente usado na construcao de fi-
logenias. Existem varios trabalhos de pesquisa que usa-
ram o algoritmo NJ para ser comparado, segundo varios
criterios, com outros metodos de reconstrucao de arvores
filogeneticas. Os resultados mostraram que o NJ recupera
arvores apropriadas e sua velocidade foi melhor que todos
os outros metodos avaliados.
5O criterio de evolucao mınima tenta minimizar a soma dos tamanhos
de todos os nos da arvore.
Em [26], foi apresentado um algoritmo que melhora a veloci-
dade do metodo NJ com o objetivo de ser aplicado a grandes
conjuntos de dados. O algoritmo constroi a mesma arvore
filogenetica que o NJ, mas tenta diminuir o tempo de busca
para encontrar o par de vizinhos que formarao um novo no
usando a estrutura Quad-tree. O algoritmo somente consegue
melhorar o tempo de execucao para o melhor caso ((O(n2)),
deixando o pior caso O(n3). Outro trabalho destinado a
melhorar a velocidade do NJ foi realizado por [27], aqui
o tempo de processamento e O(n2logn) conseguindo gerar
arvores da mesma qualidade das geradas pelo algoritmo NJ
e sem usar algum espaco adicional para realizar os calculos.
A maior vantagem do metodo neighbor joining com respeito
a outros metodos e que ele constroi arvores com maior
eficiencia. Alem disso, o metodo e considerado muito rapido
em relacao a outros metodos usados na construcao de arvores
filogeneticas, tal como e mostrado por Saitou e Nei (1987).
No contexto de visualizacao de informacao, a NJ foi testada
em termos de precisao, e comparada positivamente em
relacao a projecoes multidimensionais, que trabalham com
conceitos de reducao de dimensionalidade e similaridade por
proximidade no plano de projecao.
A principal ideia das tecnicas de reducao de dimensio-
nalidade e posicionar um conjunto de dados num espaco
de baixa dimensionalidade preservando o maximo possıvel
as relacoes de similaridade existentes entre eles. Dessa
forma dados multidimensionais representados em espacos
de baixa dimensionalidade podem fazer uso da visualizacao
e classificacao de forma mais eficiente, revelando algumas
caracterısticas interessantes, como agrupamentos, tendencias
e anomalias.
Em contrapartida, o NJ identifica os objetos vizinhos que
sequencialmente minimizam o tamanho da arvore e e defi-
nido por tres componentes:
1) O criterio usado para selecionar pares de objetos,
2) a formula usada para reduzir a matriz de distancias a
cada passo
3) a formula para obter o comprimento dos ramos.
O NJ, alem de construir a topologia para uma arvore sem
raiz, tambem fornece o valor do comprimento dos ramos
da arvore resultante. A interpretacao depende dos ramos
mas, permite que se analise os dados em forma de ’grupos’
identificados pelos ramos externos da arvore. Ela ocupa
melhor o espaco que uma projecao, pois e possıvel expandir
o desenho da arvore de forma a reduzir significativamente,
ou eliminar, sobreposicoes.
No entanto, a arvore NJ gera um grande numero de nos
intermediarios (ou virtuais) o que, para conjuntos grande de
dados, toma um espaco visualmente que pode interferir no
numero de itens do dado que podem ser apresentados de
uma so vez. Isso contrasta com a capacidade das arvores de
similaridade de permitirem analises globais e locais usando
o mesmo tipo de layout, ou seja, a analise global pode ficar
prejudicada em configuracoes especıficas da arvore.
C. Outros
C. Chen et al. [3] apresentam sua aplicacao GSA, a qual
trabalha com redes Pathfinder para visualizar a forte inter-
relacao de proximidade em dados de imagens, baseadas em
tres caracterısticas distintas para extracao como cor, layout
e informacao de textura. Uma rede Pathfinder consta de
todas as conexoes mais fortes entre os vertices, enquanto a
que a condicao de desigualdade triangular nao sera violada.
Os nos nas redes sao conectados a refletir proximidade e
similaridade entre pares de imagem, preservando apenas as
conexoes mais importantes.
Tal como mostra a Figura 7 , as imagens sao ligadas
Figura 7. Red Pathfinder de InfoViz banco de imagens por modelos do
histograma de cores.
Figura 8. Visualizacao bidimensional HELD das 1000 imagens.
atraves de ligacoes deste tipo. Pode-se simplesmente estimar
a similaridade calculada entre duas imagens, estimando o
numero mınimo de ligacoes.
Wang et al.[28] propoe um metodo, High-Entropy Layout
Distributions (HELD). O metodo descrito neste artigo re-
solve as deficiencias enquanto a dados ocluıdos o regioes
vazias ou apenas escassamente povoadas. Este aproxima
as distribuicoes dos dados atraves da otimizacao com uma
medida de entropia de layout. HELD visualizacao usa uma
regiao de layout circular e mostrada na Figura 8.
Assim, Fan et al. [10] apresentam um sistema com
visualizacao hiperbolica. Neste trabalho, uma estrutura de
Figura 9. Visualizacao hiperbolica conceito de ontologia.
classificacao hierarquica incorpora o conceito de ontologia,
onde cada no da estrutura representa um conceito de imagem
em um certo nıvel semantico, desenvolvendo um esquema
novo para gerar o conceito orientado a sumarizacao de
colecoes de imagens em grande escala. Em outras palavras,
classifica as imagens com base em anotacoes automaticas.
A classificacao e realizada com Support Vector Machines.
Como e apresentada na Figura 9, os vertices com os
conceptos de cada imagem sao projetados para um plano
hiperbolico de acordo com suas relacoes contextuais e cada
projecao pode exatamente preservar as relacoes entre o
contexto original e os conceitos das imagens. Kernel PCA e
utilizada para agrupar semanticamente as imagens similares,
assim mesmo com a visualizacao hiperbolica os usuarios tem
permissao para manipular nao so as imagens, mas tambem
as suas relacoes de similaridade visual.
Do mesmo modo, Torres et al. [29] propoe a utilizacao de um
metodo baseado em espiral,uma versao alternativa baseada
em aneis concentricos. Exemplos de visualizacao utilizando
estes modelos sao mostrados na Figura 10.
IV. SISTEMAS DE VISUALIZACAO DE IMAGENS
Diversas aplicacoes podem-se beneficiar com o uso de
tecnicas de visualizacao de informacao aplicada a imagens.
Por exemplo, Moghaddam et al. [1] mostram que e possıvel
Figura 10. Exemplos de modelos gerados atraves da utilizacao das tecnicas
Espiral e Cırculos Concentricos, respectivamente.
utilizar tecnicas de visualizacao para melhorar o compar-
tilhamento e exibicao de fotos pessoais atraves de uma
sequencia temporal ou relacional apresentadas na Figura
11. Utilizando a tecnica PCA otimizada para reducao de
sobreposicao em um sistema de visualizacao e layout de
fotos pessoais chamado PERSONAL DIGITAL HISTO-
RIAN (PDH1), com o objetivo de simular o compartilha-
mento informal de fotos entre pessoas. A Figura 11 mostra
a organizacao de imagens montadas pelo sistema.
Alem no ano 2001, B. Bederson apresentou PhotoMesa
[30], que coloca o grupo de imagens em sub-regioes do
espaco de exposicao, aplicando a tecnica de visualizacao de
dados hierarquicos chamada Quantum Treemap. Mostrada
1http://www.merl.com/projects/PDH/
Figura 11. Mesa digitalizadora do PDH.
Figura 12. Sistema PhotoMesa.
em Figura 12.
Isto e, Quantum Treemaps e uma variacao nos algoritmos
treemap que sao projetados para que as imagens ou outros
objetos de tamanho indivisıvel(quantum). Apoia o algoritmo
Treemap ordenado, mas garante que cada retangulo gerado
tera uma largura e altura que sao um multiplo inteiro do
tamanho de um objeto de entrada.
Alem disso, Shiitani et al. [31] mostram o sistema MI-
RACLES, que trabalha com colecoes de dados que repre-
sentam conjuntos de informacoes (mıdias) associadas entre
si, coletadas de bancos de dados locais ou da Internet. A
principal funcionalidade de exploracao e chamada pop-up,
e permite ao usuario informar uma ou algumas palavras-
chave, reorganizar e refinar a colecao exibida. Um exemplo
Figura 13. Tela do sistema MIRACLES, com destaque para algumas
imagens da colecao.
de como determinadas imagens de uma colecao podem ser
destacadas para auxiliar na construcao de conhecimento e
mostrado na Figura 13.
In [23], [24] os autores apresentam ImIk, um sistema
que fornece ao usuario uma melhor maneira de aces-
sar interativamente uma colecao de imagens e enfatiza
em encontrar as melhores posicoes ideais de imagens no
espaco de visualizacao. Para eles e de muita importancia
a sobreposicao de imagens e preservacao de sua projecao.
A sobreposicao entre as imagens influenciam a qualidade
de uma ferramenta de visualizacao, entao a sobreposicao de
imagens e preservacao da estrutura e mınima. A visibilidade
Figura 14. ImIk.
e essencial para a interacao entre o usuario e as imagens
exibidas. Usam as tecnicas como MDS, ISOMAP, SNE,
LLE, ISOSNE e ISOLLE para fazer a visualizacao. Na
Figura 14 a tela principal mostra o sistema de visualizacao
com o conjunto representativo de imagens do. O canto
superior esquerdo mostra toda a colecao como um ponto
de ajuste com o vermelho (ou cinza na impressao nao-cor)
os pontos que representam o atual conjunto de projecao.
O canto inferior esquerdo mostra uma versao ampliada da
miniatura selecionada. O retangulo desenhado na tela e um
exemplo de uma selecao de usuario de um grupo de imagens,
arrastando o mouse.
Do mesmo modo, Eler et al. [32] apresentam o software Pex-
Image2, um framework visual que suporta todo o processo
de analise e exploracao visual de colecoes de imagens e
textos associados. Pex-Image implementa diversas tecnicas
projecao de colecoes de imagens que enfatizam a similari-
dade entre estas imagens, alem de oferecer funcionalidades
complementares para ajudar na exploracao dos dados. O
software permite que seja feita uma coordenacao entre varias
projecoes de uma mesma colecao de imagens (Figura 15, de
forma que o usuario pode selecionar uma ou varias imagens
em uma projecao, e visualizar ou a posicao destas imagens
em outra projecao (identity coordination), ou visualizar os
2http://infoserver.lcad.icmc.usp.br/infovis2/PExImage
Figura 15. Coordenacao entre duas projecoes realizadas pelo Pex-Image.
Figura 16. Janela principal do Sistema VISRET.
k vizinhos mais proximos desta selecao em outra projecao
(distance coordination), instantaneamente.
Recentemente Kovacs et al. [33] apresentam um sistema
VISRET, para visualizar imagens do vıdeo, como mostra
a Figura 16.
Tambem, Gomi et al[34] no ano 2010 propoe Miaow (Me-
morized Image Album Organized by When/Where), um
visualizador de imagens em 3D que representa fotografias
hierarquicamente classificadas com base em suas posicoes
(eixos X e Y) e o tempos (eixo Z), data das fotos, ani-
nhados em regioes retangulares. A Figura 17, mostra uma
navegacao de fotografias usando Miaow.
Incluindo projecao em 3D, Nakazato e Huang [35] propoem
o 3DMars 3, um sistema interativo de visualizacao de
conjuntos de imagens, em um ambiente virtual 3D, como
mostra a Figura 18, onde a Figura de abaixo representa o
3http://www.ifp.illinois.edu/ nakazato/3dmars/
Figura 17. Visualizador de imagens 3D Miaow.
Figura 18. Visualizacao do resultado de uma consulta no 3DMars.
resultado da imagem-consulta do usuario.
Ademais, em [1] emprega um espaco de visualizacao
Figura 19. Espaco de visualizacao esferico.
esferico, mostrado na Figura 19, as imagens sao projetadas
na superfıcie do globo localizadas proximas umas das outras.
A navegacao e feita simplesmente girando e inclinando a
esfera de navegacao e as imagens sao organizadas em forma
de grade que permite uma navegacao mais rapida do que
os metodos onde as imagens se sobrepoem. E para lidar
com grandes bases de imagens, empregam uma abordagem
hierarquizada, onde o usuario pode aplicar zoom em uma
area particular e do sistema, por sua vez traz mais imagens
visuais relevantes. Alem, devido ao espaco limitado no plano
de visualizacao minimiza a sobreposicao entre as imagens,
para isso emprega-se uma estrutura de arvore hierarquica.
Tambem Quadrianto et al.[4] usa esferas, grids, hierarquias.
V. CONCLUSAO
Os avancos na visualizacao de informacao e tecnicas de
mineracao de dados em imagens ja permitem aos usuarios
uma maneira de revelar informacoes escondidas, de modo
que se estudam as relacoes de similaridades entre imagens.
Tecnicas de visualizacao de informacao, uma ferramenta
importante para garantir a interacao por parte do usuario,
de onde ele recupera uma ou varias imagens desejadas, ou
detecta tendencias e caracterısticas particulares que seriam
extremamente difıceis de serem detectadas caso ele anali-
sasse imagem por imagem.
Alem disso, a principal caracterıstica do processo de
visualizacao e a extracao com o fim de identificar e extrair
informacoes relevantes a partir da imagem que permita a
discriminacao de classes diferentes da imagem, onde cada
imagem da colecao e representada por um vetor de carac-
terısticas feito por exemplo, por seus atributos intrınsecos,
tais como cor, textura e forma.
Com efeito, os usuarios de sistemas CBIR possuem acesso
a uma interface visual na qual as relacoes de similaridade
podem ser facilmente visualizadas a partir de uma consulta
mas nao podem avaliar todas as imagem de maneira geral.
O usuario se torna um agente ativo no processo de mineracao
das informacoes, pois consegue, alem de visualizar as
relacoes entre os dados, interagir com o modelo, tendo uma
visao geral dos dados, ou concentrando-se em fenomenos
particulares. Esta e uma parte importante na visualizacao de
imagens e que depois de fazer a projecao, esta e analisada,
a fim de revelar informacoes uteis para os usuarios, donde
o relacionamento de dados esta no processo de mineracao
expressado na classificacao ou categorizacao.
Incluindo, as tecnicas de visualizacao aplicadas a colecoes
de imagens, como os metodos de projecao e visto a partir
da maneira sobre como reduzir as altas dimensionalidades
das imagens originais em espacos de baixa dimensao pre-
servando sua estrutura original. E os baseados em conexao
de grafos, no qual as imagens sao visualizadas por um grafo
com conexoes tracadas de acordo com as relacoes entre as
imagens da colecao.
Assim, a parte exploratoria da visualizacao de imagens, se
concentra em como fornecer ao usuario uma maneira de
explorar os dados visualizados; para esso agora existem
muitos sistemas que desenvolvem uma boa interacao com
o usuario, ja sea em um ambiente de 2 ou 3 dimensoes.
REFERENCIAS
[1] C. S. B.Moghaddam, N.Lesh and T. Huang, “Visualization &
layout for personal photo libraries,” 2001.
[2] F. G. Jorge Camargo and R. Torres, “Visualization of large
collection of medical images,” 2008.
[3] G. G. C. Chen and P. Rosin, “Similarity-based image brow-
sing,” pp. 206–213, 2000.
[4] T. T. N. Quadrianto, K. Kersting and W. Buntine, “Beyond 2d-
grids: a dependence maximization view on image browsing,”
International conference on Multimedia information retrieval,
2010.
[5] D. H. J. Yang, J. Fan and Y. Gao, “Semantic image browser:
Bridging information visualization with automated intelligent
image analysis,” Visual Analytics Science And Technology,
2009.
[6] M. N. R. Stehling and A. Falcao, “A compact and efficient
image retrieval approach based on border/interior pixel classi-
fication,” Proceedings of the eleventh international conference
on Information and knowledge management, 2002.
[7] G. Schaefer, “A next generation browsing environment for
large image repositories,” Multimedia Tools Applications,
vol. 47, no. 1, pp. 105–120, 2010.
[8] G. Hu and Q. Gao, “An interactive image feature visualization
system for supporting cbir study,” International Conference
on Image Analysis and Recognition, 2009.
[9] O. H. G. Strong and M. Gong, “Visual image browsing and
exploration (vibe): User evaluations of image search tasks,”
ACTIVE MEDIA TECHNOLOGY, 2010.
[10] Y. G. J. Fan and H.Luo, “Hierarchical classification for
automatic image annotation,” in Proceedings XXX ACM In-
ternational Conference on Research and Development in
Information Retrieval. New York, USA: ACM Press, 2007,
pp. 111–118.
[11] E. F. A. Ahmadian and F. Sayadian, “Image indexing and
retrieval using gabor wavelet and legendre moments,” Pro-
ceedings of the 25th Annual International Conference of the
IEEE, 2003.
[12] M. L. L. Wynne Hsu and J. Zhang, “Image mining: Trends
and developments,” Intelligent Information Systems, 2002.
[13] W. Torgerson, “Multidimensional scaling: I. theory and
method,” Psychometrika, no. 4, pp. 401–419, 1952.
[14] I.Jolliffe, Principal Component Analysis, 2nd ed. Springer,
2002.
[15] J. Sammon, “A nonlinear mapping for data structure analysis,”
IEEE Computer Society, vol. C-18, no. 5, pp. 401–409, 1969.
[16] C. Faloutsos and K. Lin, “Fastmap: A fast algorithm for
indexing, datamining and visualization of traditional and
multimedia databases,” in Proceedings of International Con-
ference on Management of Data: ACM SIGMOD, M. J. Carey
and D. A. Schneider, Eds. San Jose, California: ACM Press:
New York, 1995, pp. 163–174.
[17] V. d. S. J. Tenenbaum and J. Langford, “A global geometric
framework for nonlinear dimensionality reduction,” Science,
vol. 290, no. 5500, pp. 2319–2323, 2000.
[18] F. V. Paulovich, L. G. Nonato, R. Minghim, and H. Lev-
kowitz, “Least square projection: a fast high precision mul-
tidimensional projection technique and its application to do-
cument mapping,” IEEE Transactions on Visualization and
Computer Graphics, vol. 14, pp. 564–575, 2008.
[19] J. Zhang, Visualization for Information Retrieval, 1st ed.
Springer, 2008.
[20] A. Morrison, G. Ross, and M. Chalmers, “A hybrid layout
algorithm for sub-quadratic multidimensional scaling,” INFO-
VIS02: Proceedings of the IEEE Symposium on Information
Visualization, p. 152, 2002.
[21] S. T. Roweis and L. K. Saul, “Nonlinear dimensionality
reduction by locally linear embedding,” Science, vol. 290,
no. 5500, pp. 2323–2326, 2000.
[22] A. C. J. Camargo, J. Caicedo and F. Gonzalez, “A kernel-
based strategy for exploratory image collection search,”
Content-Based Multimedia Indexing, 2010.
[23] G. Nguyen and M. Worring, “Interactive access to large image
collections using similarity-based visualization,” Journal of
Visual Languages and Computing, 2006.
[24] ——, “Similarity based visualization of image collections,”
Journal of Visual Languages and Computing, 2008.
[25] O. Sorkine and D. Cohen-Or, “Least-squares meshes,” in Pro-
ceedings of Shape Modeling International. IEEE Computer
Society Press, 2004, pp. 191–199.
[26] T. Mailund, G. Brodal, R. Fagerberg, C. Pedersen, and
D. Phillips, “Recrafting the neighbor-joining method,” BMC
Bioinformatics, vol. 7, p. 29, 2006.
[27] J. Evans, L. Sheneman, and J. Foster, “Relaxed neighbor
joining: A fast distance-based phylogenetic tree construction
method,” Journal of Molecular Evolution, vol. 62, no. 6, pp.
785–792, 2006.
[28] J. H. R. Wang, S. McKenna and A. Ward, “Visualizing image
collections using high-entropy layout distributions,” IEEE
Transactions on Multimedia, 2010.
[29] C. M. R. Torres, C. Silva and H. Rocha, “Visual structures
for image browsing,” Proceedings of the twelfth international
conference on Information and knowledge management, no. 4,
2003.
[30] B. Bederson, “Quantum treemaps and bubblemaps for a
zoomable image browser,” Symposium on User Interface
Software and Technology, 2001.
[31] S. E. S.huichi Shiitani, T. Baba and S. Nagata, “Interactive
video retrieval system integrating visual search with textual
search,” Symposium on Intelligent Multimedia Knowledge
Management, 2003.
[32] D. M. Eler, M. Y. Nakazaki, F. V. Paulovich, D. P. Santos,
M. C. F. Oliveira, a. E. S. B. Neto, Jo and R. Minghim,
“Multidimensional visualization to support analysis of image
collections,” in SIBGRAPI ’08: Proceedings of the 2008
XXI Brazilian Symposium on Computer Graphics and Image
Processing. Washington, DC, USA: IEEE Computer Society,
2008, pp. 289–296.
[33] A. U. Levente Kovacs and T. Sziranyi, “Visret a content based
annotation, retrieval and visualization toolchain,” ADVAN-
CED CONCEPTS FOR INTELLIGENT VISION SYSTEMS,
2009.
[34] A. Gomi and T. Itoh, “Miaow: a 3d image browser applying
a location- and time-based hierarchical data visualization
technique,” International Conference on Advanced Visual
Interfaces, 2010.
[35] M. Nakazato and T. Huang, “3d mars: Immersive virtual
reality for content-based image retrieval,” Multimedia and
Expo, 2001. ICME 2001. IEEE International Conference,
2001.