Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
2 cm 2 cm
Outubro de 2008
BlobbyGuia Móvel para Invisuais
Hugo Miguel Aleixo Nicolau
Dissertação para obtenção do Grau de Mestre em
Engenharia Informática e de Computadores
JúriPresidente: Professor Doutor Paulo Jorge Pires Ferreira
Orientador: Professor Doutor Joaquim Armando Pires Jorge
Vogais: Professor Doutor João Manuel Brisson Lopes
Agradecimentos
Em primeiro lugar, como sempre em toda a minha vida, os meus maiores e mais especiais agradecimentos
vão para a minha família. Devo-lhes a eles, em particular aos meus pais e avó, tudo aquilo que sou e alcancei
até hoje. À minha namorada Matilde, obrigado pelo apoio, motivação e ajuda incondicional demonstrada
neste último ano.
Os meus agradecimentos a todos os meus amigos, que me proporcionaram momentos de diversão e me
deram forças para continuar o trabalho nos momentos mais difíceis.
Um agradecimento muito especial ao Tiago Guerreiro pela disponibilidade demonstrada desde o primeiro
dia. Mais do que um colega, foste uma fonte de incentivo e ajuda, com quem pude sempre contar. Foste
também em grande parte, responsável pela minha paixão pela investigação, em particular nesta área de
acessibilidade. Gostaria de mostrar também a minha gratidão ao Professor Joaquim A. Jorge, por todas as
oportunidades que me foram dadas e pela confiança que depositou em mim.
A todos os membros do grupo de Visualização e Interfaces Multimodais Inteligentes do INESC-ID, obrigado
por toda a ajuda e suporte. Ao professor Daniel Gonçalves, obrigado pelo template da dissertação. Um
agradecimento também especial a todos os meus amigos do IST, nomeadamente aos meus "irmãos de
armas", Manuel e Ruben, que estiveram sempre presentes durante este processo, mas também na minha
vida pessoal. Desejo-vos a melhor das sortes, para esta nova fase das nossas vidas.
Os meus agradecimentos a todos os formandos da Fundação Raquel e Martin Sain por participarem neste
estudo, em especial ao Dr. Carlos Bastardo, pelo tempo despendido, sugestões e comentários ao longo de
todo o trabalho.
Por último, esta dissertação é dedicada ao meu avô, a melhor pessoa que alguma vez conheci. Obrigado
por todos os bons exemplos e influências.
iii
Resumo
A autonomia de um ser humano é essencial para o seu bem-estar e a capacidade que este tem de se
deslocar faz parte da sua rotina e dia-a-dia. Para a maior parte dos invisuais, andar em locais desconhecidos
é uma tarefa muito difícil ou até mesmo impossível de realizar, sem ajuda. A adopção da bengala pela
comunidade de invisuais é o principal meio de auxílio à sua capacidade de mobilidade. No entanto, as
grandes dificuldades surgem na orientação, em particular em locais que o utilizador não conhece. A inexistência
de pontos de referência e a impossibilidade de aceder às mais diversas pistas visuais são as principais
causas.
As soluções existentes no mercado estão limitadas a ambientes exteriores, têm um elevado custo e diversos
problemas de usabilidade. Por outro lado, grande parte do trabalho de investigação feito até então está
focado no estudo de uma tecnologia de localização que permita obter uma maior precisão, deixando para
segundo plano as necessidades dos utilizadores.
Nesta dissertação apresentamos uma abordagem que consiste em dar ao utilizador um retorno auditivo
familiar e facilmente compreensível. Esta baseou-se num estudo centrado no utilizador, em que foram
analisadas as suas necessidades e capacidades, de forma a criar um sistema mais adequado. Foi criado
um protótipo, que permite a interacção de invisuais com dispositivos móveis tradicionais, em particular com
ecrãs tácteis, que os auxiliam na sua tarefa de orientação. Por fim, foram realizados estudos com utilizadores
que validaram a nossa abordagem.
Palavras-chave: Invisual, Orientação, Acessibilidade, Ecrãs tácteis, Móvel, Avaliação.
v
Abstract
The autonomy of a human being is essential to his welfare and the ability he has to move around is part of his
routine. For the majority of blind people, walking in unknown places is very difficult or even impossible to do,
without help. The adoption of the white cane by blind community is the main aid to their mobility. However,
the major difficulties arise in their orientation task, particularly in places that users don’t know. The lack of
reference points and the inability to access visual clues are the main causes.
The existing products are limited to outdoor environments and have a high cost and usability problems.
Moreover, much of the research done so far is focused on the study of location systems and technologies,
leaving the user needs behind.
In this dissertation we present an approach that allows users to walk through unknown places, while receiving
a familiar and easily understandable feedback. This approach arise from a user centered design, that
consisted in analyze user’s needs and capacities, which allowed us to create a better prototype. This prototype
allows blind users to interact with traditional mobile devices, particularly the ones with touch screens, while
still guiding them. Finally, we have conducted user studies that validate our approach.
Keywords: Blind, Orientation, Accessibility, Touch Screens, Mobile, Evaluation.
vii
Conteúdo
Agradecimentos iii
Resumo v
Abstract vii
Lista de Figuras xii
Lista de Tabelas xiii
Lista de Acrónimos xv
1 Introdução 1
1.1 Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Abordagem Proposta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Resumo do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Contribuições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5 Publicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.6 Estrutura da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2 Trabalho Relacionado 9
2.1 GPS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Bluetooth . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3 RFID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.4 Processamento de Imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.5 Infravermelho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.6 WLAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.7 Ultra-Som . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.8 Sistemas Híbridos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.9 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3 Sistema de Orientação para Invisuais 37
3.1 Estudos Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2 Sistema de Orientação em Dispositivos Móveis . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.3 Avaliação Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
ix
4 O Guia Móvel 55
4.1 Arquitectura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2 Material de Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.3 Construção de Instruções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4 Módulo de Localização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.5 Interface Utilizador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5 Resultados e Discussão 65
5.1 Avaliação da Introdução de Texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.2 Avaliação da Navegação em Menus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.3 Avaliação das Instruções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.4 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6 Conclusões 77
6.1 Sumário da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.2 Vantagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
6.3 Limitações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.4 Trabalho Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
Bibliografia 80
A1 Análise Preliminar 87
A1.1 Questionário e Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
A1.2 Plano de Observação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
A1.3 Plano da Reunião de Grupo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
A1.4 Resposta às 11 Perguntas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
A1.5 Requisitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
A2 Avaliação Preliminar 95
A2.1 Pré-Questionário e Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
A2.2 Plano de Avaliação Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
A2.3 Resultados da Avaliação Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
A3 Avaliação da Introdução de Texto 101
A3.1 Pré-Questionário e Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
A3.2 Plano de Avaliação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
A3.3 Resultados da Avaliação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
A4 Avaliação das Instruções 105
A4.1 Pré-Questionário e Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
A4.2 Plano da Avaliação das Instruções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
A4.3 Resultados da Avaliação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
x
Lista de Figuras
1.1 Mapa e sinal em Braille. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 UltraCane, um detector de obstáculos para deficientes visuais. . . . . . . . . . . . . . . . . . 3
1.3 Dispositivos de orientação para invisuais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.1 Modelo N95 da Nokia, já com um receptor de GPS integrado. . . . . . . . . . . . . . . . . . . 10
2.2 Exemplo de uma instrução do sistema Drishti. . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3 Exemplo de um diálogo no sistema NOPPA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.4 Sistema SWAN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.5 Auricular Bluetooth para telemóveis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.6 Conjunto de etiquetas RFID. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.7 Dispositivo com câmara, bússola e sensor de inclinação, integrado numa bengala. . . . . . . . 18
2.8 Sistema de orientação baseado no processamento de imagem, de uma câmara de vídeo,
integrada num telemóvel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.9 Fotografia de um utilizador com as interfaces do sistema. . . . . . . . . . . . . . . . . . . . . 20
2.10 Exemplo de um diálogo do sistema Drishti, num espaço interior. . . . . . . . . . . . . . . . . . 22
3.1 Mapa e percurso do local onde foi efectuada a observação. . . . . . . . . . . . . . . . . . . . 42
3.2 Métodos de interacção com dispositivos móveis. . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.3 Estrutura das instruções mais frequentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.4 Representação da avaliação preliminar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.5 Diferentes formas de contornar um obstáculo . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.6 Ajudas por participante da avaliação preliminar. . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.7 Ajudas por zona (Figura A2.2) da avaliação preliminar. . . . . . . . . . . . . . . . . . . . . . . 53
4.1 Arquitectura do sistema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2 Dispositivos móveis usados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.3 Exemplificação de um mapa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.4 Representação do sistema localização, WLAN e Bluetooth. . . . . . . . . . . . . . . . . . . . 60
4.5 Modelo de navegação em menus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.6 Gestos para navegação em menus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.7 Duas abordagens de navegação, até à letra ’t’. . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.1 Utilizador durante uma sessão de avaliação. . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
xi
5.2 Comparação de métodos de introdução de texto. . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.3 Comparação de métodos de introdução de texto. . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.4 Tempos na navegação em menus, em segundos. . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.5 Telemóvel envolvido em alumínio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.6 Percurso da avaliação final. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.7 Tempos da tarefa, em segundos. Relação entre o tempo de deslocação e o tempo de espera
pelas instruções. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.8 Mapa termal dos percursos efectuados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.9 Resultados do pós-questionário. Classificação média, por pergunta. . . . . . . . . . . . . . . 73
A2.1 Mapa e percurso do local onde foi efectuada a avaliação preliminar. As marcas a azul indicam
os pontos onde serão dadas as instruções. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
A2.2 Mapa do local, dividido por áreas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
A3.1 Resultados da avaliação da introdução de texto. . . . . . . . . . . . . . . . . . . . . . . . . . 103
A4.1 Mapa termal dos percursos efectuados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
xii
Lista de Tabelas
2.1 Comparação entre tecnologias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2 Comparação entre modalidades de entrada. . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3 Comparação entre modalidades de saída. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4 Comparação entre interfaces. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.1 Perfil utilizador. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Uso de dispositivos móveis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3 Grau de independência. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
A1.1 Questionário e respectivos resultados, parte um. . . . . . . . . . . . . . . . . . . . . . . . . . 87
A1.2 Questionário e respectivos resultados, parte dois. . . . . . . . . . . . . . . . . . . . . . . . . 88
A1.3 Resultados dos pré-questionários da fase de observação. . . . . . . . . . . . . . . . . . . . . 89
A1.4 Requisitos do sistema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
A2.1 Resultados dos pré-questionários da avaliação preliminar. . . . . . . . . . . . . . . . . . . . . 95
A2.2 Resultados da avaliação preliminar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
A2.3 Resultados da entrevista posterior. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
A3.1 Resultados dos pré-questionários da avaliação da introdução de texto. . . . . . . . . . . . . . 101
A4.1 Resultados dos pré-questionários da avaliação final. . . . . . . . . . . . . . . . . . . . . . . . 105
A4.2 Resultados da navegação em menus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
A4.3 Resultados da tarefa de orientação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
A4.4 Resultados da entrevista posterior. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
xiii
Lista de Acrónimos
2D Duas Dimensões
3D Três Dimensões
AP Acess Point
API Application Programming Interface
FR Frequência de Rádio
GPS Global Positioning System
IV Infravermelho
TPC Toques Por Caracter
GPC Gestos Por Caracter
LED Light-Emitting Diode
PDA Personal Digital Assistant
RFID Radio Frequency Identification
TTS Text To Speech
WLAN Wireless Local Area Network
xv
1Introdução
Existem aproximadamente 163 mil deficientes visuais em Portugal, mais de 1.6% da população, de acordo
com os dados recolhidos em 2001 [23], dos quais 17 mil são invisuais. Na Europa, o número de invisuais
chega aos 7% e em todo o mundo existem mais de 161 milhões de deficientes visuais [46]. A autonomia
de um ser humano é essencial para o seu bem-estar e a capacidade que este tem de se deslocar faz
parte da sua rotina e dia-a-dia. Para a maior parte dos deficientes visuais, andar em locais desconhecidos
é um desafio quase impossível de ultrapassar sem a ajuda de terceiros. A orientação e mobilidade são,
certamente, as componentes mais importantes no processo de reabilitação e integração de um deficiente
visual. No entanto, são duas capacidades muitas vezes confundidas. Mobilidade diz respeito à capacidade
de coordenar acções de modo a evitar obstáculos e perigos imediatos, enquanto que a orientação diz respeito
à capacidade de estabelecer e manter a consciência da posição relativamente a pontos de referência e a um
destino [26, 64].
Com o uso de uma bengala e/ou cão-guia, um invisual consegue evitar a maior parte dos obstáculos que
lhe vão aparecendo no caminho, especialmente se o trajecto for bem conhecido. Caso contrário, existem
outro tipo de dificuldades às quais está sujeito. Apesar de se conseguir deslocar, com mais ou menos
dificuldade, não existe qualquer ponto de referência no seu modelo mental. Ou seja, os seus principais
"utensílios"são bastante úteis ao nível da mobilidade, mas ajudam muito pouco ao nível da orientação. As
pessoas visualmente capazes conseguem guiar-se através das mais variadas pistas visuais, como setas,
marcos, referências ou movimentações. Um deficiente visual, normalmente, tem um número limitado de
percursos bem definidos no seu dia-a-dia e orienta-se através de pontos referenciais bem conhecidos, que já
fazem parte do seu modelo mental. Como possíveis soluções, temos os mapas tácteis ou os sinais em Braille
(Figura 1.1). Ambas são claramente insuficientes, devido à sua distribuição limitada e aos problemas de
usabilidade que apresentam: os mapas tácteis são demasiado grandes, de difícil transporte e compreensão;
os sinais em Braille são bastante difíceis de localizar num edifício, tendo em conta que o utilizador não
vê. Além do mais, ambas as soluções fazem uso do sistema Braille, que por si só é inacessível a muitos
deficientes visuais, em particular àqueles que só recentemente tiveram de lidar com esta deficiência. É o
caso dos idosos, que vão perdendo as suas capacidades visuais [46] e nunca aprendem Braille.
1
(a) Sinal em Braille (b) Mapa táctil.
Figura 1.1: Mapa e sinal em Braille.
Esta dissertação foca-se na área das interface utilizador, ou seja, consiste em estudar, formalizar e desenvolver
novos métodos de interacção que se adeqúem às necessidades e capacidades dos utilizadores. Grande
parte dos progressos que têm vindo a ser feitos têm auxiliado os utilizadores invisuais em ambientes exteriores.
Isto deve-se principalmente à divulgação, alta precisão e disponibilidade que o Global Positioning System
(GPS) tem vindo a ganhar ao longo dos anos. Em ambientes interiores, não existe ainda nenhuma tecnologia
de localização que se destaque de todas as outras. No entanto, existem diversas opções, tais como o
Bluetooth, Wireless Local Area Network (WLAN), infravermelho, Radio-Frequency IDentification (RFID) ou
ultra-som. O estudo destas diferentes abordagens tem sido o principal tema de investigação, com objectivo
de optimizar o desempenho, precisão, disponibilidade e custos.
Devido à própria natureza deste tipo de sistemas, cujo retorno para o utilizador é da maior importância,
torna-se necessário compreender as suas necessidades e capacidades. Esta é uma área em que não têm
existido muitos progressos, no entanto, revela-se crucial para o sucesso dos sistemas de orientação. Este
trabalho está focado apenas no estudo de ambientes interiores, com o objectivo de limitar o vocabulário e
cingir-se apenas a uma área de interesse. No entanto algumas das conclusões poderão ser estendidas a
cenários exteriores.
1.1. ProblemaAo longo do tempo, tem existido um grande esforço em utilizar a tecnologia como meio de assistir pessoas
com deficiências visuais nas suas tarefas de mobilidade. A adopção da bengala pela comunidade de invisuais
é o seu principal meio de detectar obstáculos e muita da investigação que tem sido feita até ao momento, tem
o objectivo de acrescentar mais funcionalidades a este objecto. É o caso de dispositivos como a Ultra Cane
[22] (Figura 1.2) ou o People Sensor [44], em que os autores tentam aumentar as capacidades de mobilidade
dos utilizadores, oferecendo-lhes mecanismos de detecção de obstáculos à distância.
Estes sistemas acrescentam muito pouco às necessidades destes utilizadores. O verdadeiro problema
2
Figura 1.2: UltraCane, um detector de obstáculos para deficientes visuais.
encontra-se nas suas capacidades de orientação. Tendo como exemplo um terminal de aeroporto, mesmo
para pessoas que conseguem usar os seus cinco sentidos, por vezes é difícil saber para onde se devem
dirigir para fazer check-in, para embarcar ou levantar as malas. Para um invisual, as dificuldades são ainda
maiores, pois não têm acesso a indicações ou outras pistas visuais. Sem a ajuda de um familiar, amigo ou
outra pessoa, estas tarefas seriam praticamente impossíveis de realizar.
O Sendero GPS [28] e o Trekker [6] (Figura 1.3) são dois sistemas disponíveis no mercado, mas operam
apenas em cenários exteriores. A fraca penetração de mercado destes sistemas deve-se principalmente ao
seu custo. Ambos os sistemas estão incorporados em dispositivos desenhados para invisuais, logo estão
limitados a um segmento reduzido da população.
(a) Sendero GPS (b) Trekker
Figura 1.3: Dispositivos de orientação para invisuais.
Um sistema de orientação tem como principal objectivo guiar um utilizador. Sendo esta tarefa realizada,
geralmente, através da fala, é essencial que o utilizador entenda e consiga executar todas as instruções
dadas. Algo que raramente acontece, pois o discurso não corresponde às práticas, especialmente em
cenários interiores, onde o grau de precisão tem obrigatoriamente de ser maior e o espaço para erros é
menor. Em detrimento da fala, podem ser usadas outras abordagens, como o retorno háptico ou sonoro
(não fala). No entanto, têm a desvantagem de ser menos expressivos e inadequados a algumas tarefas (e.g.
descrever um dado local).
3
A forma como o utilizador interage com o sistema é igualmente importante. Ter necessidades especiais
significa que são necessários mecanismos ou abordagens diferentes, que permitam a utilização eficaz do
sistema. Muitas vezes estes mecanismos não estão presentes, o que significa que uma parte ou a totalidade
do sistema não é acessível. Por exemplo, a navegação entre menus, a introdução de texto, efectuar procuras,
etc.
1.2. Abordagem PropostaPara fazer frente aos problemas da mobilidade e do custo, a nossa abordagem faz uso de dispositivos móveis
comuns. A interacção pessoa-computador deixou há muito tempo de ser exclusividade dos computadores de
secretária. Hoje em dia, existem inúmeros dispositivos que podem ser facilmente transportados e que fazem
parte do dia-a-dia do cidadão comum. É o caso dos telemóveis, cujo poder computacional e funcionalidades
têm vindo a aumentar, desde integração da câmara fotográfica e de vídeo, leitor mp3, calendário, Internet,
jogos, etc. Estes dispositivos trazem consigo um leque de novas potencialidades, especialmente no que diz
respeito à mobilidade, característica que os computadores pessoais não têm.
No entanto, muitos destes cenários de interacção estão inacessíveis à comunidade invisual, em particular, os
dispositivos com ecrãs tácteis. Através de um redesenho dos processos de interacção, a nossa abordagem
permite aos utilizadores invisuais aceder ao seu guia, através do seu dispositivo móvel tradicional.
Por outro lado, o sistema tem de ser capaz de guiar um invisual por um percurso desconhecido. Um estudo
centrado no utilizador é essencial para caracterizar e identificar as técnicas de orientação e mobilidade
utilizadas, assim como as informações mais relevantes num espaço interior. Igualmente importantes são
as formas de comunicação usadas por estes utilizadores. Como resultado destes estudos, foi proposta uma
forma de construção automática de instruções, tendo em conta o local e a localização do utilizador.
Concluindo, a nossa abordagem baseia-se na metáfora de um amigo invisual, que já conhece o local e
acompanha o utilizador, fornecendo-lhe instruções familiares e adequadas, para que este chegue ao seu
destino.
1.3. Resumo do trabalhoDe acordo com a nossa abordagem definimos como primeira prioridade um estudo do estado da arte na
área de sistemas de orientação para invisuais. Os sistemas vistos foram classificados segundo a abordagem
adoptada para localizar o utilizador: GPS, RFID, WLAN, Bluetooh, Infravermelho, Ultra-som e Processamento
de Imagem. Estes trabalhos foram depois comparados tendo em conta a sua tecnologia de localização e um
conjunto de características essenciais, tais como, fiabilidade, disponibilidade, alcance, velocidade, precisão,
4
hardware e custo. Para completar este estudo, os sistemas foram ainda comparados tendo em conta as suas
interfaces. A interface por fala, assim como a utilização de earcons e teclado mostraram ser as melhores
opções.
Com todo o conhecimento adquirido na área, foram identificados os principais problemas e limitações dos
sistemas actuais. O passo seguinte foi efectuar uma análise preliminar, onde os principais objectivos foram:
caracterizar o utilizador quanto ao seu perfil, conhecimentos tecnológicos e grau de independência; estudar
técnicas de mobilidade e orientação usadas pelos utilizadores; identificar as principais necessidades e
problemas; estudar a forma como constroem o mapa mental de um local e o verbalizam;
Os resultados mostraram que a esmagadora maioria dos invisuais necessita de ajuda para os guiar ou
contextualizar, sempre que visitam um local público desconhecido. Neste estudo centrado no utilizador,
conseguimos também identificar um conjunto de elementos e regras, provenientes da verbalização dos seus
mapas mentais, tendo em vista a construção automática de instruções.
Para validar a nossa abordagem, foi realizado um teste do tipo Feiticeiro de Oz. Este teste permitiu-nos
compreender os principais problemas e a complexidade da tarefa de guiar um utilizador invisual. O timing da
instrução, as ambiguidades no vocabulário e a detecção dos pontos de referência, mostraram ser os pontos
críticos do sistema.
Tendo já um vasto conhecimento do estado da arte, das características do utilizador e após criar um conjunto
de guias de desenho, estávamos finalmente prontos para a construção da interface. O protótipo final faz uso
da fala, som e retorno vibratório como interface de saída. Devido à crescente adopção e substituição dos
teclados por ecrãs tácteis, foi também implementado um método de introdução de texto e navegação em
menus para este tipo de dispositivos. O protótipo foi testado num cenário semelhante àquele em que foram
feitos os estudos iniciais e todos os utilizadores desconheciam o local. Os resultados obtidos foram bastante
satisfatórios e as instruções mostraram-se adequadas. Com este protótipo conseguimos validar um conjunto
de opções e regras que poderão ser de grande utilidade em trabalhos futuros nesta área.
1.4. ContribuiçõesEste trabalho permitiu-nos dar uma visão geral do que tem sido feito na área de interfaces para orientação
de invisuais e contribuir com um conjunto de aspectos que têm de ser levados em conta, aquando da sua
construção. Os principais contributos desta dissertação são:
Construção de uma interface para orientação de invisuais
Foi construída uma interface de orientação para invisuais. Esta interface tem como principais contributos
a geração automática de instruções e a contextualização do utilizador, de acordo com a sua posição. O
5
protótipo final, foi testado com utilizadores invisuais, num cenário desconhecido. Os participantes completaram
um percurso desconhecido, efectuando rotas muito semelhantes, o que revela uma fácil compreensão e
adequação das instruções à realidade. É de salientar que nenhum dos participantes teve qualquer treino
prévio, o que sugere um retorno familiar.
Implementação de um método interacção para invisuais em ecrãs tácteis
Foi implementado um novo método de interacção com ecrãs tácteis, que abrange as tarefas de navegação
entre menus e introdução de texto. Através do estudo com utilizadores invisuais, conseguimos validar a nossa
abordagem e permitir a este tipo de utilizadores interagir com ecrãs tácteis. De acordo com os resultados
obtidos, este método de interacção mostrou ser mais adequado que o sistema tradicional de introdução de
texto (i.e. Multitap), apresentando um maior desempenho e taxa de aprendizagem. Em relação à utilização
de teclados, esta nova forma de interacção mostrou ser mais rápida e eficaz.
Estudo centrado no utilizador
Esta é uma das principais falhas identificadas no estado da arte. Os sistemas actuais carecem de um
estudo centrado no utilizador, principalmente no que diz respeito ao retorno auditivo. A forma como estes
utilizadores exploraram, interpretam e transferem a informação de um local (interior), foi estudada com o
principal objectivo de formalizar a construção de instruções.
Estado da arte em sistemas de orientação para invisuais
Foram estudados e discutidos alguns dos principais sistemas de orientação para invisuais, com especial
interesse na sua tecnologia de localização e interface. Este estado da arte disponibiliza uma vista geral
desta área de investigação e poderá servir como ponto de partida para trabalhos futuros.
Caracterização do utilizador-alvo em relação ao uso de dispositivos móveis e grau de independência
Realizámos uma análise de tarefas com o objectivo de entender o que faziam os utilizadores e quais as
principais dificuldades que enfrentavam. Foram recolhidos dados sobre a utilização de dispositivos móveis,
as tarefas que neles executavam e o contexto em que eram usados. Foi também estudado o grau de
independência dos utilizadores, ou seja, se tinham por hábito deslocar-se sozinhos, que tipo de locais
visitavam, se necessitavam de ajuda e as principais dificuldades que encontravam. Esta caracterização teve
como principal resultado o facto dos utilizadores necessitarem quase sempre de ajuda em locais desconhecidos,
devido à falta de informação.
Guias de desenho para sistemas de orientação e respectivas interfaces
Com base na análise dos trabalhos da área e no estudo com utilizadores, foi definido um conjunto de guias
de desenho que deverão ser cumpridas, de modo a construir um sistema de orientação apropriado para
invisuais.
6
1.5. PublicaçõesO trabalho apresentado nesta dissertação deu origem a três publicações. Serão em seguida listadas, por
ordem cronológica de aceitação.
1. Guerreiro, T., Lagoá, P., Nicolau, H., Santana, P., Jorge, J., Mobile Text-Entry Models for People with
Disabilities, Proceedings of the European Conference on Cognitive Ergonomics (ECCE 2008), Madeira,
Portugal, Setembro 2008.
2. Lagoá, P., Nicolau, H., Santana, P., Guerreiro, T., Gonçalves, D. e Jorge, J., Acessibilidade Móvel:
Soluções para Deficientes Visuais, Actas da 3a Conferência Nacional em Interacção Pessoa-Máquina
(Interacção 2008), Évora, Portugal, Outubro 2008.
3. Guerreiro, T. , Nicolau, H., Lagoá, P., Gonçalves, D., e Jorge, J., From Tapping to Touching: Making
touch screens accessible to blind users, IEEE Multimedia, Special Issue on Accessibility, 2008, Aceite
para publicação.
1.6. Estrutura da DissertaçãoO restante desta dissertação é composto por cinco capítulos:
O segundo capítulo corresponde a um trabalho de investigação na área dos sistemas de orientação para
invisuais. Foram recolhidos os principais trabalhos e analisados segundo a sua tecnologia de localização
e interface utilizador. Neste capítulo, foram ainda identificados os principais problemas destes sistemas.
Após esta análise, foi proposta uma abordagem, no Capítulo 3, que tem como principal objectivo garantir
aos utilizadores um retorno auditivo familiar. Para este efeito, foram realizados estudos com utilizadores
invisuais, que tiveram como objectivo o levantamento de requisitos, assim como a criação de algumas guias
de desenho, para a construção de uma interface. Depois de uma avaliação preliminar da abordagem,
o Capítulo 4 descreve o protótipo criado, detalhando cada uma das suas componentes. Este protótipo
permitiu-nos avaliar o sistema com utilizadores e obter alguns resultados, disponíveis no Capítulo 5. Por
fim, o Capítulo 6 encerra esta dissertação, com uma discussão geral das vantagens e limitações do sistema
construído. São também apresentadas as principais conclusões desta investigação, assim como algumas
sugestões para trabalhos futuros nesta área.
7
2Trabalho
Relacionado
A área de sistemas de orientação e mobilidade para deficientes visuais tem vindo a ser alvo de muitos
trabalhos de investigação nas últimas duas décadas. Têm existido muitos e diferentes tipos de abordagens a
este problema. Esta diversidade de abordagens e os sistemas que geram têm como principal característica a
tecnologia que adoptam. Como irá ser descrito, existem diversas opções, como RFID, Infravermelhos, WLAN,
GPS, etc. Cada uma destas tecnologias apresenta várias vantagens e desvantagens e, com a excepção do
GPS, que tem sido globalmente aceite para ambientes exteriores, nenhuma das outras ainda vingou em
ambientes interiores.
Nesta secção encontram-se descritos grande parte dos trabalhos relacionados com sistemas de orientação
para ambientes interiores e exteriores, com especial foco no primeiro.
2.1. GPSO Sistema de Posicionamento Global ou GPS (do acrónimo do inglês Global Positioning System) é um
sistema de posicionamento por satélite, utilizado para a determinação da posição de um receptor na superfície
da terra ou em órbita. O GPS foi criado e é controlado pelo Departamento de Defesa dos Estados Unidos
e pode ser utilizado por qualquer pessoa, gratuitamente, necessitando apenas de um receptor que capte o
seu sinal. O sistema está dividido em três partes: espacial, de controlo e utilizador. O segmento espacial
é formado pela constelação de satélites. O segmento de controlo é composto pelas estações terrestres
dispersas pelo mundo ao longo da zona equatorial, responsáveis pela monitorização das órbitas, sincronização
dos relógios atómicos e actualização dos dados de almanaque dos satélites. O segmento do utilizador
consiste num receptor que capta os sinais emitidos. Este receptor tem a função de descodificar as transmissões
do sinal e calcular a sua posição, em termos de latitude, longitude e altitude.
9
2.1.1. Aplicações, Vantagens e DesvantagensEste sistema tem aplicações óbvias na aviação geral e comercial e na navegação marítima, mas qualquer
pessoa que queira saber a sua posição, encontrar um caminho para determinado local ou conhecer a
velocidade e direcção a que viaja, pode fazer uso do GPS. Este sistema tem-se tornado cada vez mais
popular entre ciclistas, pescadores, ecoturistas ou leigos. A comunidade científica utiliza-o muitas vezes pelo
seu relógio altamente preciso.
Na agricultura surgiu um novo conceito, agricultura de precisão [5]. Uma máquina agrícola, dotada de um
receptor de GPS, armazena dados relativos à produtividade e constrói um mapa de produtividade da lavoura.
Estas informações permitem optimizar a aplicação de correctivos e fertilizantes.
Recentemente, o GPS tem vindo a ser integrado em dispositivos comuns, como Personal Digital Assistants
(PDAs) ou telemóveis (Figura 2.1). As principais vantagens deste sistema são a sua alta disponibilidade,
custo e precisão. Apesar do sistema estar disponível em muitos locais, o seu sinal pode ser bloqueado por
infra-estruturas (e.g. edifícios), daí a sua utilização não ser apropriada em ambientes interiores.
Figura 2.1: Modelo N95 da Nokia, já com um receptor de GPS integrado.
2.1.2. Sistemas que usam GPSO sistema MoBIC Travel Aid (MOTA) [52], é composto por dois componentes principais, o MoBIC Pré-Journey
System e o MoBIC Outdoor System. O principal objectivo deste sistema é auxiliar um utilizador invisual a
programar a sua rota antecipadamente, tendo em conta todo o seu contexto (usando mapas, horários de
transportes, horários de abertura de edifícios, etc.) e posteriormente explorar esse trajecto, com a ajuda do
sistema.
O MOTA é constituído por um computador portátil com receptor de GPS, uma bússola e um sistema de
telecomunicações. Toda a interacção é feita a partir de um teclado e o output é dado através de um
sintetizador de voz. Em 1996, um sistema com estas características pesava cerca de 6kg. O MOTA apesar
de tentar resolver os principais problemas aos quais os deficientes visuais estão sujeitos, tem ainda algumas
10
falhas. O planeamento da rota é bastante complicado, visto que o sistema é baseado em mapas digitais
e ecrãs sensíveis ao toque. Grande parte dos utilizadores não ficou satisfeito com o uso de auriculares,
argumentando que podia bloquear sons ambientais. Por isso, os autores decidiram usar um telemóvel, para
que o utilizador pudesse ouvir instruções apenas quando desejasse. Um dos principais problemas deste
sistema é o facto da rota não poder ser modificada durante a viagem.
Um sistema mais recente, proposto por Marsh et al. [39], faz uso de um simples telemóvel com receptor GPS,
em detrimento dos 6kg de hardware usados no MOTA. Toda a interacção é feita a partir de mensagens SMS
enviadas para um servidor ou por diálogo directo com uma operadora. Esta interface tem, obviamente, a
desvantagem de não funcionar em tempo real, ou seja, o utilizador tem de esperar pela resposta do servidor.
As SMS’s recebidas são depois ouvidas, usando um sistema TTS (Text-to-Speech).
Os sistemas anteriores dão pouca ou nenhuma importância à tarefa de refazer uma rota durante a execução
do percurso. É exactamente esta a principal contribuição do Drishti [30]. O sistema está constantemente a
guiar o deficiente visual, baseando-se numa base de dados, que pode ser alterada por outros utilizadores ou
entidades responsáveis, com o objectivo de manter os mapas sempre actualizados e o mais detalhados
possível. Assim, uma rota pode ser dinamicamente refeita, caso seja necessário, sem intervenção do
utilizador. Este sistema usa a voz como interface de entrada e saída (Figura 2.2).
Figura 2.2: Exemplo de uma instrução do sistema Drishti.
Loomis et al. [37] realizaram um estudo com quinze participantes, com o objectivo de perceber qual a
interface mais adequada para um sistema de route guidance. Foram estudadas cinco interfaces diferentes
que faziam uso de fala/som 3D, uma bússola digital e um joystick. Das cinco interfaces, o virtual speech
foi o que apresentou o melhores resultados e obteve maiores níveis de satisfação junto dos utilizadores.
Mais uma vez, existiram algumas críticas quanto ao uso de auriculares. Nesta interface, era colocada uma
bússola digital na cabeça do utilizador e, através da sua posição e orientação, era emitido um sinal de fala
tridimensional, que indicava a distância até ao próximo destino. Este resultado foi semelhante ao obtido num
estudo anterior [36].
11
Mais tarde, os mesmos autores [40] provaram que, usando apenas retorno vibratório ou som (não fala), é
possível guiar um invisual por uma rota. Em ambos os casos, é colocada uma bússola digital na cabeça do
utilizador, de modo a obter a sua orientação. Ao contrário de Van Erp et al. [59], que usam um cinto com
oito vibradores igualmente espaçados, neste caso é usado apenas um. Dependendo se o utilizador está
dentro da rota ou não, é emitido o respectivo sinal. No caso em que o retorno é sob a forma de som 3D, o
comportamento é semelhante, bastando substituir a vibração por um sinal sonoro.
O sistema NOPPA descrito por Turunen et al. [58], cujo domínio são os serviços de informação para
transportes públicos, faz uso das capacidades dos dispositivos móveis actuais, para obter informações sobre
a localização e o contexto em que o utilizador está inserido. Esta aplicação faz uso da fala como modalidades
de entrada e saída de forma a simular um diálogo natural. No entanto, este diálogo é sempre guiado pela
aplicação e o utilizador apenas tem de responder de acordo com as suas necessidades (Figura 2.3).
Figura 2.3: Exemplo de um diálogo no sistema NOPPA.
Com o objectivo de conceber uma interface que pudesse ser usada por diversos tipos de utilizadores, Turunen
et al. [57] propõem uma interface multimodal que inclui: sintetização de fala, reconhecimento da fala, menus
fisheye, gestos, retorno táctil e earcons. Os menus fisheye, em conjunto com a voz podem ser usados
por utilizadores com alguma deficiência visual, mas também por pessoas visualmente capazes, que tenham
uma alta elevada cognitiva. O mesmo acontece na utilização de gestos (tilt, frente, trás) para navegar entre
menus. A utilização de earcons pode ser vantajosa em relação à fala, para transmitir uma mensagem de
forma rápida e pouco intrusiva, como por exemplo, ao chegar a uma paragem de autocarro ouvir o som
característico deste local. Por último, o retorno táctil consiste em pequenas vibrações que podem ter origem
em alguma operação que se distingue das restantes. Neste sistema, a câmara também não foi deixada de
fora e pode ser usada para receber mais informações sobre um objecto do mundo real, apontando-a para
este. Para utilizadores invisuais esta funcionalidade é pouco útil, por razões óbvias de utilização, mas poderia
ser substituída por um sistema que não necessitasse de retorno visual (e.g. RFID ou Bluetooth).
12
O SWAN [67] (System for Wearable Audio Navigation) é um sistema que tem o som (não fala) como única
modalidade de saída e uma mouse wheel com dois botões como entrada (Figura 2.4).
(a) Hardware usado. (b) Interface de navegação em
menus.
Figura 2.4: Sistema SWAN.
A posição do utilizador e a sua orientação são calculadas recorrendo a métodos de sensor fusion, entre GPS
e sensores de orientação (e.g. bússolas digitais), assim como as características contextuais em que está
inserido (e.g. obras no percurso ou horários de edifícios). O utilizador pode ainda gravar os seus movimentos
e rotas, para uso posterior e anexar mensagens de voz a objectos ou locais. Os autores defendem que as
interfaces por fala, que são muitas vezes usadas em sistemas de orientação, são demasiado intrusivas e
têm uma carga cognitiva bastante alta. Por isso, optaram por usar um sistema de som 3D, que faz uso de
earcons e auditory icons [8].
2.2. Bluetooth
Bluetooth é uma tecnologia emergente, de baixo consumo e alcance, que, através de ondas de rádio,
fornece uma forma de conectar e trocar informações entre dispositivos, como computadores portáteis, PDA’s,
telemóveis, impressoras, câmaras, etc. Os dispositivos podem comunicar entre si através de uma rede, onde
existe um "master" que pode comunicar com mais sete aparelhos. Este tipo de rede denomina-se piconet
e consiste numa rede ad-hoc, que usa os protocolos da tecnologia bluetooth para se conectar com outros
dispositivos.
Existem três classes de dispositivos Bluetooth, cada uma com as suas características de consumo e alcance.
As classes um, dois e três têm um alcance de um, dez e cem metros, respectivamente.
13
2.2.1. Aplicações, Vantagens e DesvantagensUma das aplicações mais populares no uso de Bluetooth são os kit’s de mãos livres [3] para telemóveis
(Figura 2.5). O uso de auriculares sem fios e outros dispositivos, que permitem controlar e comunicar com
telemóveis, foram das primeiras aplicações Bluetooth a ter uma grande adesão. Comunicação sem fios entre
dispositivos de entrada ou saída (rato, teclado, etc.) é também uma aplicação bastante usada hoje em dia.
Devido às suas vantagens, esta tecnologia veio substituir, em alguns casos, os controlos por infravermelho.
A lista de aplicações continua, desde a criação de pequenas redes sem fios, publicidade com base na
localização do utilizador, controlos remotos para consolas de vídeo jogos [9], etc.
Figura 2.5: Auricular Bluetooth para telemóveis.
Esta tecnologia permite criar pequenas redes de dispositivos, à semelhança do que acontece com a WLAN,
por isso, tem-se vindo a apostar também no Bluetooth tecnologia de localização. Anastasi et al. [4] descrevem
um sistema de localização interior, que poderá ter diversas aplicações, como por exemplo, de carácter
publicitário [2].
O Bluetooth tem como principais vantagens o seu baixo consumo e custo, a possibilidade de criar pequenas
redes sem fios e não haver necessidade de existir uma linha de visão entre o emissor e receptor. Como
contrapartida, tem um curto alcance e a sua velocidade de transferência é mais lenta, quando comparada
com a WLAN.
2.2.2. Sistemas que usam BluetoothApesar desta tecnologia ter um curto alcance, Bohonos et al. [10] criaram um sistema para ser usado
em ambientes exteriores, que permite a um utilizador invisual saber quando deve passar numa passadeira.
Como seria de esperar, o sistema não tem o objectivo de guiar o utilizador numa longa viagem, à semelhança
do GPS, mas auxiliá-lo numa das suas tarefas mais difíceis, que é a travessia de uma estrada. O sistema
funciona com base nas informações recolhidas de um controlador de trânsito e envia directamente para
o utilizador, através do seu telemóvel e de um sistema TTS, a indicação do estado do sinal. O sistema
consegue ainda informar o utilizador do tempo restante até à próxima transição do estado do sinal. Os testes
realizados mostraram resultados satisfatórios, mas existem ainda problemas de sobreposição de informação,
quando várias intersecções estão muito próximas.
14
2.3. RFIDRFID é o acrónimo do nome em língua inglesa Radio-Frequency IDentification. Consiste num método de
identificação automática através de sinais de rádio, para recuperar e armazenar dados remotamente, através
de dispositivos denominados leitores e etiquetas RFID.
Uma etiqueta RFID é um pequeno chip que pode armazenar dados (geralmente um identificador) e contém
uma antena, responsável por emitir sinais de rádio (Figura 2.6). Existem três tipos de etiquetas RFID:
passivas, activas e semi-passivas. As etiquetas passivas não necessitam de qualquer fonte de energia e
são activadas quando um leitor está por perto, para lhes fornecer essa energia. Têm um alcance desde os
dez centímetros até alguns metros, dependendo da frequência de rádio e antenas escolhidas. As etiquetas
activas, ao contrário das passivas, têm a sua própria fonte de energia, que é usada para alimentar os
circuitos integrados e enviar o sinal para o leitor. Muitas destas etiquetas têm alcances de centenas de
metros, baterias que duram cerca de dez anos e podem ser usadas em ambientes difíceis. As etiquetas
semi-passivas são muito semelhantes às activas, porque também têm a sua própria fonte de energia, mas
a bateria é usada apenas para alimentar os circuitos integrados e não para difundir o sinal. A energia é
reflectida para o leitor, tal como nas etiquetas passivas.
O leitor RFID é responsável por obter os dados armazenados nas etiquetas e, geralmente, converte as ondas
de rádio noutra forma, para que possam ser enviadas para outro sistema, como um computador ou PDA.
2.3.1. Aplicações, Vantagens e DesvantagensEsta tecnologia tem diversas aplicações, todas elas com o objectivo comum de identificar. Recentemente,
a cadeia de hipermercados Wal-Mart tem vindo a substituir os seus códigos de barras por etiquetas RFID,
devido às suas potencialidades de monitorização [65]. Um pequeno chip RFID implantado por baixo da pele,
pode fornecer automaticamente todo o registo médico de um paciente [27], reduzindo assim o tempo de
acesso e erros humanos.
Figura 2.6: Conjunto de etiquetas RFID.
15
Como seria de esperar, esta tecnologia pode também ser usada como tecnologia de localização. Os leitores
de RFID podem ser instalados em dispositivos que façam parte do dia-a-dia dos cidadãos, como os telemóveis
[34] e, espalhando várias etiquetas por um espaço, é possível monitorizar todas as deslocações de um
indivíduo.
As grandes vantagens do RFID são as pequenas dimensões e baixo custo das suas etiquetas. No entanto,
existem etiquetas de alto alcance, cujo preço é muito superior. Em ambos os casos a velocidade de
transmissão é a sua principal desvantagem.
2.3.2. Sistemas que usam RFIDA ideia do sistema The Chatty Environment [14] é o "mundo"falar com o utilizador. São espalhadas etiquetas
RFID por diversos objectos e sempre que o utilizador se aproxima de um, com o respectivo leitor, este
emite uma mensagem de voz. O sistema disponibiliza quatro opções: information, que permite obter mais
informações sobre um dado objecto/localização; actions, permite que o utilizador realize uma acção sobre
um dado objecto, por exemplo, abrir uma porta; leave traces, é uma forma de um utilizador deixar uma
mensagem ou acrescentar informação à tag RFID; take me there, permite que o utilizador seja guiado até à
entidade em causa.
S. Willis e S. Helal [66] descrevem um sistema clássico que usa esta tecnologia, para localizar um utilizador
invisual em ambientes interiores ou exteriores. As etiquetas RFID (passivas) são colocadas em pontos
estratégicos e contêm a sua localização (latitude e longitude), assim como outras informações acerca do
espaço. Os leitores podem ser integrados, por exemplo, no calçado ou na bengala. As etiquetas, apesar de
poderem ser instaladas em ambientes exteriores, devido às suas características e curto alcance, são mais
eficientes em cenários interiores.
2.4. Processamento de ImagemProcessamento de imagem é qualquer forma de processar informação, na qual a entrada é uma imagem,
como fotografias ou frames de um vídeo. A saída não tem de ser obrigatoriamente uma imagem, mas pode,
por exemplo, ser um conjunto de características da imagem. A maior parte das técnicas envolve tratar a
imagem como um sinal bidimensional, no qual são aplicadas técnicas de processamento de sinal [68].
2.4.1. Aplicações, Vantagens e DesvantagensUma das aplicações mais conhecidas e que tem sido uma área de investigação nos últimos anos, é a
detecção de faces, que, por sua vez, pode ser usada em sistemas de vigilância em tempo real [18]. Este é
o primeiro passo para o reconhecimento automático de faces, que hoje em dia já é utilizado para sistemas
de identificação, juntamente com outros sistemas de biometria, tal como foi descrito por E. Hjelmas e B. Low
16
[31]. Nos sistemas de orientação, estas técnicas são essencialmente usadas em conjunto com uma câmara
fotográfica ou de vídeo, de modo a poder identificar objectos, ou pessoas no cenário, como iremos ver em
seguida.
A principal vantagem deste tipo de abordagem é a inexistência de hardware especial ou qualquer instalação/manutenção
do local. Em contrapartida, tendo em conta o perfil do utilizador-alvo, este poderá ter dificuldades em lidar
com uma câmara. Por último, as condições ambientais em que o sistema opera têm de ser óptimas e
controladas.
2.4.2. Sistemas que usam Processamento de ImagemKawai et al. [35] criaram um sistema que permite inferir a posição do utilizador através da análise de imagens.
Foram colocadas três câmaras e auriculares num capacete e, à medida que o utilizador se desloca, é
feito o processamento de imagem, com o objectivo de reconhecer pontos ou objectos de interesse. Para
este efeito, é utilizado um sistema que permite obter informação tri-dimensional (3D) a partir de imagens
bidimensionais (2D) [56]. Depois de identificados os objectos, através da comparação com o modelo 3D,
estes são convertidos em mensagens sonoras tridimensionais. Mais uma vez, os utilizadores mostraram
algum desagrado pelo uso de auriculares. Em relação ao uso de som 3D, existiram alguns problemas na
diferenciação das direcções cima/frente e baixo/trás.
O sistema SINVI [13] foi criado especialmente para cenários interiores, mais concretamente corredores. A
câmara é montada no utilizador e, através da detecção de contornos, são identificadas portas, intersecções e
fim de corredores. A maior parte das pistas visuais são capturadas do tecto, por ter uma maior probabilidade
de estar iluminado. Os autores fazem uso das características comuns dos corredores (curvas, portas, fim do
corredor e estruturas no tecto), para conseguir inferir a posição do utilizador. O retorno é mais uma vez dado
através de pistas auditivas.
O sistema construído por Hub et al. [32], utiliza um modelo 3D de um cenário interior, para auxiliar os invisuais
na sua tarefa de orientação. Foi criado um dispositivo especial que pode ser anexado a uma bengala, como
uma espécie de lanterna. Este dispositivo é composto por: uma câmara, bússola e sensor de inclinação,
que permitem identificar os objectos e relacioná-los com o modelo 3D. É ainda usada uma rede WLAN para
comunicar com o servidor, responsável por fazer todo o processamento.
Este sistema tem a grande vantagem de não ser necessária qualquer instalação de hardware no local. Em
contrapartida, tem de ser feito um modelo 3D do cenário, que pode levar desde alguns dias a alguns meses.
Existe também a desvantagem do utilizador ter de estar constantemente a pedir ao servidor para identificar
objectos. Mais tarde, o algoritmo de reconhecimento de objectos foi alterado para detectar objectos não
estáticos, através da sua cor e forma [33].
17
Figura 2.7: Dispositivo com câmara, bússola e sensor de inclinação, integrado numa bengala.
J. Coughlan e R. Manduchi [16] usam o processamento de imagem como principal técnica para orientar um
deficiente visual. É usado um telemóvel, com câmara, de forma a identificar imagens que estão espalhadas
ao longo do edifício. Estas imagens têm de contrastar com todo o cenário, para que sejam facilmente
reconhecidas pelo algoritmo de processamento de imagem. Junto de cada imagem está um sinal em Braille,
que permite ao utilizador obter mais informações sobre todo o espaço, tal como na Figura 2.8. Apesar do
sistema ser relativamente simples e barato de implementar, apresenta alguns problemas. Em primeiro lugar,
o processo de "varrimento"de todo o cenário pode ser muito moroso e susceptível de erro, tendo em conta
o tipo de utilizador. Nos testes realizados, foram encontrados alguns problemas no reconhecimento das
imagens, devido ao movimento da câmara (motion). Outra limitação é a necessidade de saber ler Braille,
que pode ser colmatada usando outro tipo de sistema (e.g. substituir sinal Braille por etiqueta RFID).
(a) Um utilizador invisual com
um Nokia 7610.
(b) Imagem com três cores e o
respectivo sinal em Braille. A
imagem é utilizada para guiar o
utilizador até ao sinal.
(c) Uma versão da imagem com
quatro cores.
Figura 2.8: Sistema de orientação baseado no processamento de imagem, de uma câmara de vídeo, integrada num
telemóvel.
18
2.5. InfravermelhoRadiação infravermelha é uma parte da radiação cujo comprimento de onda é maior que o da luz (visível ao
olho humano), no entanto, menor que o das microondas [12]. O nome significa abaixo do vermelho (do latim
infra, "abaixo").
2.5.1. Aplicações, Vantagens e DesvantagensA transmissão de dados por infravermelhos é muito utilizada na comunicação, em curtas distâncias, entre
periféricos. Estes dispositivos, na maior parte dos casos, cumprem as normas publicadas pela IrDA [1],
Infrared Data Association. Os controlos remotos e outros dispositivos são compostos por um LED (do
acrónimo inglês light-emitting diode), que emite radiação infravermelha. O receptor, por sua vez, converte
essa radiação num sinal eléctrico. Devido ao seu curto alcance, este tipo de comunicação é muito usado em
ambientes interiores.
Os infravermelhos são também usados em equipamento de visão nocturna [15]. O uso da luz infravermelha
e os dispositivos de visão nocturna não devem ser confundidos com imagem térmica, que cria imagens
baseadas na diferença de temperatura de superfícies, emitindo radiação infravermelha (calor) [60].
Esta tecnologia necessita de pouca energia, é bastante fiável e portável. No entanto, o transmissor e receptor
têm de estar na mesma linha de visão. O sinal infravermelho tem a desvantagem de ser bloqueado por
materiais comuns, tais como paredes, pessoas, plantas, etc.
2.5.2. Sistemas que usam InfravermelhoUm sistema típico do uso desta tecnologia é o Locust Swarm [51], criado no MIT. Foi desenhado especialmente
para ambientes interiores, em que um conjunto de placas de infravermelho (IV), alimentadas por energia solar
e auto suficientes, estão espalhadas pelo edifício, para que os utilizadores possam interagir com elas.
O sistema Talking Signs [17] foi uma tentativa de ajudar deficientes visuais na sua necessidade de obter
informações à distância, para que se possam orientar em espaços desconhecidos. Os sinais (Talking Sign’s)
estão constantemente a enviar um sinal IV e o utilizador, através de um receptor, pode localizar e obter
a informação que lá está armazenada. Para além do seu elevado custo, este sistema apresenta outros
problemas que dizem respeito à sua utilização. O utilizador tem de estar, permanentemente, a varrer todo
o espaço à sua volta, na esperança de encontrar um sinal, tornando-se um processo bastante cansativo,
frustrante e moroso.
D. Ross e B. Blasch [47] descrevem alguns dos problemas da interface do sistema anterior, o Talking Signs
[17]. Os autores realizaram um conjunto de testes com três tipos de interfaces, não só vocacionadas para
19
Figura 2.9: Fotografia de um utilizador com as interfaces do sistema.
deficiências visuais, mas também para pessoas com limitações auditivas.
O sistema é constituído por uma bússola digital, um auricular, três "tapping contact speakers" e um computador
portátil, tal como ilustra a Figura 2.9. As três formas de interacção são: sonic carrot, em que é emitido um
sinal sonoro tridimensional; output falado, em que são dadas instruções de como chegar ao destino, por
exemplo, virar para uma hora, virar para as nove horas, etc.; shoulder tapping, em que as indicações são
dadas por pequenas vibrações nas costas do utilizador, indicando uma direcção. Pelos testes realizados,
os utilizadores mostraram grande satisfação na combinação das interfaces de fala e vibrações. Apesar de
ser uma interface bastante completa, todo o hardware que o utilizador tem de transportar e o seu preço são
características a ter em conta.
2.6. WLAN
WLAN ou Wireless LAN (Wireless Local Area Network ) é uma rede local que usa ondas de rádio para fazer
uma conexão entre dois ou mais computadores. Isto dá aos utilizadores a possibilidade de se deslocarem
dentro da área que está coberta e manterem-se ligados à rede.
A tecnologia WLAN é definida pela família de especificações IEE 802.11. Existem actualmente quatro
especificações: 802.11a, 802.11b, 802.11g, 802.11n. Ambas usam os protocolos Ethernet e CSMA/CA
(Carrier Sense Multiple Access with Collision Avoidance). A diminuição dos custos do equipamento WLAN, a
facilidade de instalação e a crescente popularidade dos computadores portáteis, PDA’s, telemóveis e outros
dispositivos, trouxe este tipo de conecção para o mercado doméstico. Serviços públicos, como estações de
comboio ou metro, centros comerciais e aeroportos, começaram também a oferecer aos seus clientes acesso
a redes sem fios.
20
2.6.1. Aplicações, Vantagens e DesvantagensGrandes projectos para a cobertura de cidades inteiras estão a ser iniciados. É o caso do Google, que
fornece um serviço totalmente grátis em Mountain View, Califórnia [25]. Este tipo de serviço permite a um
conjunto de computadores ligarem-se entre si, formando uma rede local, mas também ligar-se a outras redes,
como por exemplo a Internet.
As empresas de telecomunicações móveis têm reconhecido que este tipo de tecnologia irá ser crucial na
transmissão de dados, num futuro próximo e têm vindo a integra-la na sua arquitectura [38]. Esta situação
deve-se às vantagens que estas redes apresentam sobre as redes móveis (i.e. mais rápidas e baratas). No
entanto, a sua cobertura ainda é bastante limitada, impedindo que seja usada a nível global.
A WLAN também tem sido alvo de investigação, para ser usada como tecnologia de localização. Mesmo
que o seu uso esteja ainda muito limitado a alguns ambientes interiores, com o seu rápido crescimento e
adopção, pode no futuro ser bastante útil. É o caso dos sistemas [7, 63] que usam técnicas baseadas na
força de um sinal de rádio para localizar um dispositivo numa área coberta por WLAN.
As principais vantagens deste tipo de redes são o seu alcance, facilidade de instalação, possibilidade de
ligação a outras redes e a velocidade de transmissão.
2.6.2. Sistemas que usam WLANO LaureaPOP [43] é um sistema bastante recente, que consiste na continuação do trabalho NOPPA [61], mas
que inclui um módulo interior. O utilizador precisa apenas de um telemóvel com acesso a WLAN e, através de
um software de posicionamento, o Ekahau Positioning Engine (EPE) [21], é calculada a sua posição. Existe
também um servidor, responsável por traçar rotas, guiar e comunicar com o utilizador, ao longo de todo o
processo. Esta comunicação entre o servidor e o dispositivo móvel, é feita através do protocolo VoIP. Para
completar a interface, é usado um kit de mãos livres, com ligação por Bluetooth. No entanto, os autores não
deixam claro como o sistema constrói as rotas ou instruções que serão dadas aos utilizadores.
2.7. Ultra-SomUltra-som é um som a uma frequência superior àquela que o ouvido humano pode perceber (aproximadamente
20.000 Hz). O que nos impede de ouvir o ultra-som é o ouvido médio, que actua como um filtro passa-baixo.
Porque nos humanos o limite da frequência máxima até ao qual se consegue ouvir vai diminuindo com a
idade [54], uma companhia de telefones desenvolveu um toque, que supostamente só pode ser ouvido por
crianças [62].
21
2.7.1. Aplicações, Vantagens e Desvantagens
A ultra-sonografia ou ecografia é um método de diagnostico que aproveita o eco produzido pelo som para
ver, em tempo real, as reflexões produzidas por músculos, tendões e órgãos do organismo. O ultra-som tem
sido utilizado neste tipo de procedimentos há mais de cinquenta anos e é um dos métodos mais usados na
medicina moderna.
Uma aplicação comum do ultra-som é o SONAR (SOund Navigation And Ranging). Este sistema emite ondas
numa direcção e, caso existam objectos no caminho, é medido o tempo entre a transmissão e a recepção do
sinal, de forma a obter a posição dos obstáculos. Na água, consegue-se uma precisão muito superior, visto
que a velocidade de propagação do som é muito maior do que no ar, podendo atingir os 1498 km/h. Esta
tecnologia é, no entanto, bastante sensível a interferências, principalmente sons cintilantes.
2.7.2. Sistemas que usam Ultra-Som
O sistema Drishti anteriormente descrito [30], veio mais tarde possibilitar a navegação em ambientes exteriores
e interiores [45]. O módulo de navegação interior usa um sistema de posicionamento de ultra-som e pretende
dar ao utilizador invisual uma visão geral do espaço, distâncias e informações entre dois pontos, assegurando
assim uma deslocação segura (evitando obstáculos estáticos). No local, têm de estar instalados os pilots do
sistema ultra-som e o mapa previamente carregado na base de dados, com toda a mobília, paredes, etc. O
utilizador, para além do hardware usado no módulo exterior, tem de usar mais dois beacons nos ombros. A
Figura 2.10 mostra um exemplo de um diálogo deste sistema.
Figura 2.10: Exemplo de um diálogo do sistema Drishti, num espaço interior.
22
2.8. Sistemas HíbridosNesta secção, estão todos os sistemas interiores que não se enquadram em nenhuma das secções anteriores,
por usarem, não apenas uma tecnologia, mas uma combinação de várias.
O sistema Talking Braille [48] é baseado na metáfora do trilho de migalhas. Como tal, consiste num conjunto
de sinais (Talking Braille Signs) que são activados por IV ou FR (frequência de rádio). O utilizador leva
consigo um telemóvel, um auricular e um receptor (CharmBadge receiver). É um sistema muito parecido
com o Talking Signs [17] e tem o seguinte modo de funcionamento: o utilizador, ao entrar no edifício usa o
seu receptor para localizar o primeiro sinal, que está ligado a um quiosque informativo e permite-lhe, usando
o seu telemóvel, aceder a todos os pontos de interesse e planear a sua rota. Em seguida, o utilizador vai
sendo guiado de sinal em sinal (trilho de migalhas) até ao seu destino. Neste sistema não é feita qualquer
referência à interface do telemóvel, nem à forma como o utilizador planeia ou refaz a sua rota. O hardware
utilizado é muito específico e, por isso, o preço é um entrave à sua instalação. Com os testes realizados,
foram também identificados alguns problemas na coordenação das mensagens enviadas pelos vários sinais
aos utilizadores.
2.9. DiscussãoNesta secção e após termos visto alguns dos principais sistemas de orientação para invisuais, irão ser
retiradas algumas conclusões acerca das abordagens, tecnologias e interfaces usadas. Vão também ser
descritas as falhas das aplicações existentes e definidas as principais características de um sistema de
orientação para invisuais.
2.9.1. Comparação entre TecnologiasAo longo deste capítulo, foram descritos vários sistemas e respectivas tecnologias. Nesta secção, essas
tecnologias vão ser comparadas, com base num conjunto de características: fiabilidade, disponibilidade,
alcance, velocidade, hardware e custo.
2.9.1.1. Fiabilidade
Fiabilidade é a capacidade de uma dada tecnologia manter o seu normal funcionamento sob interferências,
ruído ou outras circunstâncias indesejáveis. Um sistema de orientação tem de fazer uso de uma tecnologia
fiável, para que funcione correctamente e com o menor número de erros possível.
O processamento de imagem faz, obrigatoriamente, uso de uma câmara de filmar ou fotográfica, para que a
análise das frames recolhidas seja efectuada. Um sistema que faça uso deste tipo de técnica depende muito
23
da análise de cores e contornos. Como tal, as condições ambientais têm de ser "perfeitas". Num ambiente
interior, apesar de ser mais fácil garantir essas condições, a iluminação dos locais pode sempre ser alterada,
devido à existência de janelas, falha das lâmpadas, etc.
A tecnologia infravermelha é conhecida como sendo imune a interferências e ruído, mas é facilmente bloqueada
pela maior parte dos objectos sólidos, paredes, pessoas, plantas, etc.. Ou seja, tem de existir uma linha de
visão entre os dois dispositivos. Helal et al. [45] fizeram vários testes ao seu sistema, de modo a simular um
ambiente interior, recorrendo à fala, gritos, música, chaves a tilintar, etc, de modo a comprovar a fiabilidade
do ultra-som. Sons com altas-frequências, como chaves a tilintar, interferem com um sistema ultra-som,
deixando-o bastante instável.
Todas as outras tecnologias, RFID, WLAN e Bluetooth, como todas as frequências de rádio, estão sujeitas
a uma grande variedade de interferências ou efeitos de propagação. No entanto, este tipo de tecnologia
apresenta níveis de fiabilidade bastante bons.
2.9.1.2. DisponibilidadeA disponibilidade de uma tecnologia indica a facilidade de acesso à mesma. Um sistema que use uma
tecnologia com baixa disponibilidade tem fortes probabilidades de nunca vir a ser útil ou sequer utilizado.
Os sistemas ultra-som são muito utilizados na medicina, mas com um propósito muito diferente do que é
aplicado nos sistemas de orientação. Este tipo de tecnologia não se encontra muito difundido no mercado,
ao contrário do Bluetooth, que já está disponível em qualquer telemóvel das novas gerações e pode ser
utilizado entre quaisquer dois dispositivos, através de uma rede ad-hoc. A WLAN tem vindo a ser instalada
em muitos locais públicos e cada vez mais em nossas casas, muito devido à difusão dos computadores
portáteis. No entanto, a sua instalação ainda se encontra muito limitada. Nos dias que correm, tal como o
Bluetooth, a integração de câmara fotográfica ou de vídeo nos telemóveis é bastante comum. Isto possibilita
que técnicas de processamento de imagem possam ser feitas a partir de qualquer telemóvel, não sendo
necessário adquirir hardware especializado. O RFID é outra tecnologia emergente e que tem sido muito
falada como substituta dos códigos de barras. No entanto, esta mudança ainda não sucedeu por completo.
2.9.1.3. AlcanceO alcance de uma dada tecnologia pode ser um factor determinante para saber com exactidão a localização
e todos os movimentos de um utilizador, ao longo do seu percurso. Esta característica está intimamente
relacionada com a área que se pretende abranger e o número de dispositivos que têm de ser instalados para
a cobrir.
Sem dúvida, o sistema com maior alcance é o GPS, que tal como o nome indica, pode ser usado globalmente,
excepto dentro de edifícios. As etiquetas RFID podem ter um alcance desde trinta centímetros (etiquetas
24
passivas) a algumas centenas de metros (etiquetas activas). O processamento de imagem, dependendo da
natureza dos artefactos que estão a ser identificados, pode variar desde alguns centímetros a alguns metros.
Os infravermelhos são usados em especial nos ambientes interiores exactamente pelo seu curto alcance
de alguns metros. À semelhança do infravermelho, o ultra-som também é usado para distâncias de alguns
metros, apesar de sistemas como o SONAR poderem atingir distâncias de dezenas de quilómetros, mas
em ambientes totalmente diferentes. Uma WLAN típica tem um alcance na ordem das dezenas de metros,
mas pode ser facilmente estendida, com a adição de repetidores, chegando a atingir algumas centenas de
metros. O Bluetooth é uma tecnologia tipicamente, de curto alcance, mas, dependendo da sua classe pode
variar desde um a cem metros.
2.9.1.4. VelocidadeNos sistemas em que as informações não estão associadas apenas a um dispositivo, mas a um conjunto, a
troca de informação é indispensável e a velocidade a que esta é transferida pode ser muito importante para
os tempos de resposta do sistema.
As quatro tecnologias que irão ser comparadas são WLAN, infravermelho, Bluetooth e RFID. Estas tecnologias
têm, por si só, objectivos e papéis diferentes, no que diz respeito à comunicação entre dispositivos. A
WLAN foi criada para substituir os cabos que ligam uma rede, de modo a oferecer mais mobilidade, ao
contrário das outras três tecnologias, que são utilizadas para troca de pequenas quantidades de informações
entre dispositivos a curtas distâncias. Logo, é de esperar que a WLAN apresente maiores velocidades de
transferência de dados, seguida do Bluetooth, infravermelho e RFID.
2.9.1.5. Hardware necessário e CustoO custo associado a uma tecnologia e ao respectivo hardware está geralmente ligado à sua aceitação no
mercado, quer seja individualmente ou integrado noutros dispositivos. Este custo também está geralmente
associado a outras características como o alcance, fiabilidade, etc.
As tecnologias mais baratas são aquelas que já se encontram incorporadas em dispositivos comuns. É o
caso do Bluetooth, que hoje em dia já está disponível em qualquer computador, PDA ou telemóvel. Para
utilizar esta tecnologia em sistemas de localização é necessária a instalação de alguns beacons Bluetooth,
por forma a cobrir a área desejada. No caso da WLAN o seu alcance é muito maior, mas em contrapartida
o seu preço também o é. Cada vez mais, esta é uma tecnologia acessível a partir de dispositivos comuns,
como PDA’s ou telemóveis. O infravermelho é uma tecnologia mais antiga que, por exemplo, o Bluetooth, mas
os seus preços podem ser equiparados. O processamento de imagem só é possível através de uma câmara
fotográfica ou de filmar e, com a integração destes dispositivos em telemóveis, é uma técnica relativamente
barata. Mas devido às limitações de processamento dos telemóveis, normalmente é usada em conjunto com
a WLAN ou outras tecnologias de transferência de dados. Por último, o custo de um receptor GPS pode ser
equiparado a uma WLAN doméstica (sem repetidores) ou leitor de RFID.
25
2.9.1.6. PrecisãoA precisão, num sistema de orientação, é bastante importante, pois permite saber com exactidão a posição e
o deslocamento de um utilizador. Quanto maior for esta precisão, maiores são as possibilidades do sistema
ser aceite e mais detalhadas poderão ser as suas indicações.
A precisão associada a uma tecnologia está inerente a todo o trabalho de investigação, baseado em tecnologias
de localização. Ao analisar o grau de precisão de uma tecnologia temos de ter em conta o rácio entre o seu
alcance e o erro (DOP - Dilution of Precision). Técnicas de medição da força dos sinais de rádio(e.g. WLAN’s,
Bluetooth ou RFID) são uma área de investigação que continua bastante activa [7, 42, 53, 63]. A precisão
que estas técnicas podem oferecer depende muito do número de pontos de acesso ou beacons, que se
deseja instalar e das características do próprio local, mas geralmente apresentam erros de alguns metros.
Ao contrário das tecnologias anteriores, o GPS pode ser usado globalmente, em ambientes exteriores e tem
um erro mínimo de um metro.
2.9.1.7. ConclusõesCada tecnologia tem as suas vantagens e desvantagens, tendo em conta cada problema em particular.
Uma das principais conclusões deste estado-da-arte, ao comparar cada uma das tecnologias existentes
em sistemas de orientação, é que o Bluetooth e a WLAN são cada vez mais utilizadas como tecnologias de
localização. A WLAN tem sido instalada em muitos locais públicos, como estações, cafés, centros comerciais,
etc., o que faz de si um potencial meio para obter a localização de um utilizador. Uma das vantagens de
instalar este tipo de infra-estrutura é a diversidade de aplicações que poderá oferecer.
O Bluetooth é uma tecnologia bastante recente, que tem como principal vantagem o seu baixo custo e
consumo. Apesar de ter um curto alcance, que pode ser o suficiente para um ambiente interior, já deu
origem a muitas aplicações, algumas delas para substituir o antigo infravermelho. O Bluetooth não veio, nem
pode, competir directamente com a WLAN, mas em vez disso, estas duas tecnologias complementam-se.
Ambas estão em posição de vingar no mercado da comunicação móvel, talvez mais do que qualquer outra.
O infravermelho é uma tecnologia já antiga que, à semelhança do Bluetooth, é usada para a comunicação
entre dispositivos a curtas distâncias. Tem a grande desvantagem de ambos os dispositivos terem de estar na
mesma linha de visão. No entanto, é uma tecnologia bastante estudada, barata e que já mostrou resultados
práticos. Hoje em dia, está a cair em desuso e a ser substituída pelo Bluetooth, devido às vantagens que
este apresenta.
O RFID é também usado para a comunicação a curtas distâncias, mas tem uma forma de funcionamento
muito diferente. É utilizador como etiqueta ou código de barras, que pode conter mais informação, alterável
ao longo do tempo. As etiquetas passivas são de baixo custo e não necessitam de qualquer tipo de bateria
ou fonte de energia, sendo apenas activadas por um leitor RFID. Por ser uma solução económica, é usada
26
muitas vezes para localizar o utilizador numa grelha ou trilho de etiquetas. Este tipo de sistemas pode ser
vistos como sinais em Braille, mais ricos em informação e que podem ser lidos à distância. Como cada
etiqueta está limitada à sua capacidade de armazenamento, por vezes torna-se necessária a instalação de
uma rede sem fios (e.g. WLAN ou Bluetooth), para que possam ser armazenadas maiores quantidades de
informação.
O processamento de imagem é também uma área de grande interesse e que tem gerado diversas abordagens.
No entanto, as condições ambientais, assim como o movimento da câmara são um factor crucial e que têm
um impacto directo na fiabilidade dos sistemas. Apesar das câmaras de filmar ou fotográficas poderem ser
facilmente encontradas nos telemóveis actuais, a sua capacidade de processamento ainda é limitada e por
isso raramente são usados por si só.
O ultra-som é uma tecnologia que é muito usada em detecção de obstáculos, devido às suas características
e modo de funcionamento. Os sistemas de orientação que usam esta tecnologia fazem uso exactamente
destas características para localizar o utilizador e dar-lhe instruções. A instalação desta tecnologia num
ambiente interior, ao contrário do que acontece com a WLAN, seria para uso exclusivo do sistema de
orientação, logo, teoricamente não será tão rentável.
Por último, o GPS é o sistema mais usado em orientação, mas ao contrário das tecnologias vistas anteriormente
só pode ser usado em ambientes exteriores. Neste tipo de ambiente, o sistema apresenta vantagens
que mais nenhuma tecnologia é capaz de oferecer, como o seu alcance, disponibilidade e fiabilidade. A
tabela 2.1 resume as comparações que foram feitas entre as diversas tecnologias, sendo uma estrela a pior
classificação e três estrelas a melhor.
Tabela 2.1: Comparação entre tecnologias.
27
2.9.2. Comparação de InterfacesAo longo deste estudo, foram descritos vários sistemas de orientação e respectivas interfaces. Neste secção,
irão ser comparadas, com base num conjunto de características: modalidade de entrada, modalidade de
saída, hardware e custo.
2.9.2.1. Modalidade de Entrada
A forma como o utilizador, deficiente visual, interage com o sistema é uma característica fundamental para a
sua adopção. Enquanto uma pessoa visualmente capaz consegue usar um conjunto de periféricos comuns
(e.g. rato ou teclado), juntamente com as mais diversas pistas visuais, um invisual necessita de novos
mecanismos de interacção.
Existem três modalidades principais de interacção com um dispositivo móvel. São elas: fala, gestos ou
teclado. Cada uma destas modalidades tem as suas vantagens e desvantagens e podem, muitas vezes,
completar-se. Tendo em conta o tipo de utilizadores a que estes sistemas se destinam, a fala é muitas
vezes utilizada como modalidade de entrada. A fala pode substituir uma interface gráfica, por ser um
mecanismo natural de interacção, no entanto, os reconhecedores de fala actuais para dispositivos móveis
ainda apresentam alguns problemas de desempenho e fiabilidade. Além disso, este método de interacção
pode ser impraticável em cenários ruidosos.
Os gestos são uma forma rápida e pouco intrusiva de executar uma acção. No entanto, a sua utilização
implica a existência de hardware especial. Hoje em dia, a existência de acelerómetros é cada vez mais
comum e é possível que, no futuro, possamos vir a presenciar novos métodos de interacção. É também
possível detectar gestos simples, através de uma câmara e, neste caso, qualquer telemóvel poderá ter esta
funcionalidade. Uma das desvantagem poderá ser a sua aceitação social.
O teclado é, com certeza, o método de interacção com maior disponibilidade nos dispositivos móveis actuais
e também o que apresenta maior fiabilidade. Algumas soluções passam por criar teclados em Braille. No
entanto, estes apresentam uma menor disponibilidade. A tabela 2.2 resume a comparação das modalidades
vistas anteriormente.
Tabela 2.2: Comparação entre modalidades de entrada.
28
2.9.2.2. Modalidade de Saída
Um sistema de orientação tem de ser eficaz na forma como orienta um utilizador, especialmente no caso
deste não conseguir validar as instruções dadas pelo sistema, através de pistas visuais.
As modalidades de saída usadas neste tipo de sistemas têm de ser não convencionais, ou seja, não fazem
uso de uma interface gráfica. Como modalidades alternativas, temos a fala ou o som (earcons ou auditory
icons), que podem ser emitidos em mono, estéreo ou com uma terceira dimensão. Por último, o retorno ao
utilizador pode ser dado através do tacto, ou seja, por vibração ou força. A tabela 2.3 resume a comparação
das modalidades de saída.
Tabela 2.3: Comparação entre modalidades de saída.
2.9.2.3. Conclusões
Pela tabela 2.4, podemos ver que a modalidade de entrada mais utilizada é a fala. Esta é, talvez, a forma mais
natural de interacção com uma máquina. No entanto, estes sistemas [45, 57, 58] fazem uso de servidores
remotos, responsáveis por reconhecer a fala do utilizador. Isto porque os reconhecedores actuais para
dispositivos móveis ainda apresentam alguns problemas de desempenho e fiabilidade. Logo, o custo e
hardware do sistema são aspectos a ter em conta.
Como alternativa, temos os gestos, que podem ser usados como atalhos para acções ou navegação em
menus [57]. Os gestos são detectados, normalmente, por hardware especial (e.g. acelerómetros) ou por
uma câmara. Esta modalidade tem a vantagem, em relação à fala, de poder ser usada em ambientes
ruidosos.
Por último, temos o teclado (comum), que se apresenta como a opção mais viável, pela sua disponibilidade,
fiabilidade e custo. Esta escolha não quer necessariamente dizer que existirão apenas alguns comandos
pré definidos e associados a cada tecla, como acontece em vários sistemas. Terão de existir abordagens
que permitam a um deficiente visual utilizar o teclado de uma forma eficiente e realizar as mesmas tarefas
que um utilizador visualmente capaz (introduzir texto, fazer pesquisas, navegar entre menus, etc.). Todos os
29
sistemas presentes na tabela 2.4 têm um custo equiparável.
Tabela 2.4: Comparação entre interfaces.
Em relação às modalidades de saída, o áudio é, sem surpresas, o mais utilizado. Uma alternativa é o uso
de retorno táctil, vibratório ou háptico. O retorno vibratório é bastante limitado na sua expressividade e serve
geralmente para indicar a ocorrência de um acontecimento [37, 47, 57]. O retorno háptico, apesar de ter
uma maior expressividade que a vibração, tem também um maior custo e menor portabilidade, devido ao
hardware necessário.
O áudio pode ser dividido em duas classes: fala e não fala. Pode ainda ser classificado segundo a sua
dimensão: mono, estéreo ou 3D. Wilson et al. [67] argumentam que a utilização de áudio (não fala) é mais
apropriada para sistemas de orientação, devido à sua baixa carga cognitiva e flexibilidade. No entanto, um
sistema que use apenas áudio (não fala) para guiar um utilizador invisual tem de fazer uso de som 3D, que,
apesar de apresentar uma menor carga cognitiva, está constantemente a ser repetido e pode ser bastante
incomodativo. Para além disso, é necessário o uso de dois auriculares, que têm o inconveniente de poder
bloquear sons ambientais. Um sistema de orientação deve ser capaz de contextualizar o utilizador, indicando
os pontos de interesse, perigos ou outras informações do local. Utilizando apenas áudio (não fala) é bastante
difícil conseguir esta funcionalidade.
Uma alternativa será usar a fala para interacções mais complexas, como instruções ou descrições e earcons
ou auditory icons para contextualizações de menor importância, às quais o utilizador poderá pedir mais
30
detalhes. Para combater a carga cognitiva que é necessária com a modalidade de fala, podem ser usadas
outras modalidades, como a vibração, para indicar a necessidade de atenção.
A utilização de auriculares torna-se apropriada em cenários ruidosos ou quando o som tem mais de uma
dimensão. No entanto, existe o incómodo de bloquear os sons ambientais, que são extremamente importantes
para um invisual. Como alternativa, o retorno auditivo pode ser ouvido directamente do dispositivo (e.g.
telemóvel). Neste caso, o utilizador teria de saber quando ouvir a mensagem, através de algum aviso sonoro
ou vibratório. O uso directo do telemóvel, em vez de um auricular, tem a desvantagem do utilizador ter de
estar constantemente com o dispositivo na mão. Talvez uma combinação destas duas abordagens seja a
mais indicada, em que o utilizador pode optar por um retorno constante ou com avisos. Ambas só poderão
ser avaliadas e comparadas através do estudo com utilizadores, de forma a identificar a mais indicada.
2.9.3. Limitações das Aplicações ActuaisEm ambientes exteriores, têm sido desenvolvidos inúmeros sistemas de orientação para invisuais usando
GPS [36, 39, 52]. No entanto, este sistema não é uma solução viável para ambientes interiores, porque
o seu sinal é bloqueado pelas infra-estruturas dos edifícios. Ou seja, é necessária uma nova solução, à
semelhança do que acontece no exterior, comum a todos os sistemas de orientação.
Grande parte dos sistemas actuais estão dependentes da sua tecnologia de localização, tornando-se uma
das suas principais limitações. São necessárias novas aplicações, mais modulares e flexíveis, que permitam
integrar novas abordagens de localização, independentemente da sua tecnologia.
As pessoas, no seu dia-a-dia, deslocam-se tanto em ambientes interiores como exteriores. A maior parte
dos sistemas actuais funciona apenas num tipo de ambiente, logo, um utilizador teria de ter dois dispositivos
diferentes para poder realizar as suas tarefas diárias. Caso as aplicações façam uso de dispositivos comuns,
então o utilizador apenas teria de instalar duas aplicações distintas. Mesmo assim, para um invisual, pode
ser difícil distinguir entre os dois tipos de cenários e não saber qual das aplicações usar.
O custo e a manutenção de um sistema são características bastante importantes para que este seja adoptado
na maioria dos edifícios e estão intimamente relacionadas com a escolha das tecnologias de localização.
Logo, são necessários sistemas ubíquos e de custo reduzido, para que a sua adopção e penetração no
mercado possa ser maximizada.
Outra limitação reside na própria funcionalidade de um sistema de orientação. Este tem como principal
objectivo fornecer um conjunto de instruções, para que o utilizador chegue a um destino. Para um invisual,
isto não é suficiente. Enquanto uma pessoa visualmente capaz, ao entrar num edifício desconhecido,
consegue facilmente perceber o contexto em que está inserida (através das mais variadas pistas visuais),
um deficiente visual poderá ter dificuldades na percepção das dimensões, pontos de interesse (recepção,
31
WC, etc.) ou perigos existentes (e.g. escadas rolantes ou portas automáticas). Logo, para além de guiar o
utilizador, este tipo de sistemas tem de ser capaz de o contextualizar, sempre que necessário.
Por último, uma das principais falhas dos sistemas actuais é a falta de estudo com os utilizadores. Ao
construir uma interface que tem como objectivo dar instruções, surgem um conjunto de perguntas que
devem ser respondidas: qual a melhor forma de guiar um invisual? como é que este tipo de utilizadores
se comporta? como se desloca? quais as técnicas que usa? qual a sua carga cognitiva? etc. Em relação à
contextualização, surge igualmente outro conjunto de perguntas: quais as informações que são relevantes?
quando devem ser dadas as informações? quais os perigos? como deve ser dada esta informação?
etc. Todas estas questões devem ser respondidas antes da construção dos sistemas, de forma a originar
aplicações mais adequadas. Podemos também ter em conta o perfil do utilizador a que se destina o sistema,
ou seja, a forma como a aplicação se comporta pode fazer uso das capacidades do utilizador. Por exemplo,
o tipo de cegueira, os problemas auditivos, o grau de escolaridade, o grau de independência, a idade, a
carga cognitiva, as restrições de tempo e os seus interesses, são características que podem ser estudas e
que devem influenciar a forma como o utilizador é guiado. Concluindo, é necessário um estudo centrado no
utilizador, que tenha em linha de conta todos estes aspectos e que irão certamente trazer um novo conjunto
de possibilidades e restrições.
2.9.4. Características do Sistema de OrientaçãoUm sistema de orientação tem de ser desenvolvido com base num conjunto de características, para poder ter
sucesso. Sendo especialmente criado para utilizadores com necessidades acrescidas, tem de ter também
outras características que os sistemas de orientação comuns não possuem. Em seguida, estas irão ser
apresentadas, com uma breve descrição, assim como a sua importância para o utilizador final.
2.9.4.1. Fiabilidade
A fiabilidade de um sistema deste tipo é uma característica crucial. Dar uma indicação errada a um utilizador
invisual, num ambiente que ele próprio desconhece ou num momento em que este se encontra desorientado,
iria baixar exponencialmente o seu nível de confiança em relação ao sistema. Para além disso, informações
erradas podem colocar a integridade física da pessoa em risco, ao direccioná-la erradamente para os
diversos perigos existentes.
2.9.4.2. Disponibilidade
Disponibilidade é uma medida que indica o tempo que um sistema está operacional. Num sistema de
orientação, pode ser vista como a medida que indica a quantidade de locais em que a aplicação pode
ser usada. Esta característica está depende não só do próprio sistema, mas também da(s) tecnologia(s) de
localização que este suporta.
32
2.9.4.3. Escalabilidade
Um sistema escalável indica que, após a instalação de mais hardware, a sua performance aumenta proporcionalmente
às suas capacidades. Se existir um aumento dos utilizadores a usar o sistema, este tem de estar preparado
para continuar a funcionar, quer seja através de técnicas de "graceful degradation"ou com adição de mais
componentes de hardware.
2.9.4.4. Precisão
Esta característica indica o maior desvio (erro) possível de existir, ao definir a posição do utilizador. A
capacidade do sistema dar indicações e orientações detalhadas depende muito da sua precisão. Quanto
maior, melhor o sistema poderá direccionar o utilizador.
2.9.4.5. Custo e Hardware
A aceitação de um sistema depende muito do hardware que este utiliza e, consequentemente, do seu custo.
Logo, a aplicação deve fazer uso de hardware comum, de custo reduzido e acessível a todos os utilizadores.
Uma das limitações existentes em alguns sistemas actuais é o facto do hardware usado ser muito específico
e especialmente desenhado para as características de uma parte da população. Isso faz com que o seu
custo seja superior em relação a outros dispositivos que têm a mesma utilidade, mas são produzidos para
um mercado muito maior. Logo, a diferença não deve estar no hardware, mas sim no software que é usado,
visto este ter um impacto muito menor no custo final.
2.9.4.6. Fácil e Rápido de Usar
Um sistema de orientação tem de ser usado de uma forma fluída, sem que os seus procedimentos ocupem
a maior parte do tempo do utilizador. A interacção com o sistema tem de ser simples e fácil de compreender.
O modelo mental que o utilizador tem da aplicação deve ser construído rapidamente e ficar bem definido,
para que a sua utilização possa ser eficaz.
2.9.4.7. Eficiente
O sistema de orientação deve também ser eficiente na forma como guia o utilizador. Esta eficiência pode
nem sempre corresponder a levar o utilizador pelo percurso mais curto, mas sim pelo mais adequado (mais
seguro, mais rápido, menos distractivo, etc.).
2.9.4.8. Claro
O retorno que o sistema dá ao utilizador deve ser preciso e auto explicativo. Todas as descrições que o
sistema possa dar devem ser uma visão da realidade e suficientes para contextualizar o utilizador no espaço
33
em se encontra. As indicações e direcções do sistema têm de ser precisas e não podem conter ambiguidade,
para que o utilizador saiba exactamente em que direcção se deslocar.
2.9.4.9. Tempo de RespostaTodo o retorno do sistema deve ser dado o mais rapidamente possível ao utilizador. Ou seja, o retorno da
aplicação deve ser dado quando ainda é útil para orientar a pessoa ou descrever um determinado local, tendo
em conta a sua localização. Por exemplo, um possível alerta de que o utilizador irá encontrar escadas rolantes
ou outro tipo de perigo deve ser dado, efectivamente, antes do utilizador se deparar com esta situação. Do
mesmo modo, se o sistema orienta o utilizador numa determinada direcção, mesmo que algum pedido tenha
sido feito anteriormente, deve ter em conta a sua posição actual.
2.9.4.10. Modular e FlexívelO sistema deve ser dividido em vários módulos independentes entre si. Esta característica dá a flexibilidade
de se poder substituir ou alterar apenas um módulo, sem a necessidade de modificar os restantes. Deste
modo, o sistema pode, por exemplo, trabalhar da mesma forma, independentemente da tecnologia de
localização que é usada, bastando para isso substituir o respectivo módulo.
2.9.4.11. ContextoUm deficiente visual, ao entrar num espaço desconhecido, não tem qualquer noção da disposição do local ou
pontos de interesse. Um sistema de orientação para invisuais, para além de conseguir direccionar os seus
utilizadores até um destino, deverá também disponibilizar informações sobre todo o contexto em que estes
estão inseridos.
2.9.5. ConclusõesAo longo deste estado-da-arte foram discutidos e analisados diversos sistemas e abordagens, assim como
as suas tecnologias. Os sistemas de orientação para ambientes exteriores fazem uso, invariavelmente, do
GPS. Isto acontece, principalmente, devido à sua elevada disponibilidade, alcance e precisão, que o faz
destacar de todos os outros sistemas de localização.
A impossibilidade de usar o GPS em ambientes interiores, deu origem a uma "corrida"pela tecnologia que
será mais usada neste tipo de cenários. Apesar do espaço de acção ser muito menor, quando comparado
com ambientes exteriores, o grau de detalhe e precisão de um sistema de orientação interior deveria ser
necessariamente maior.
Ambas as tecnologias, WLAN e Bluetooth, consistem na transmissão de sinais de rádio, que é uma área
activa de investigação para tecnologias de localização. A sua precisão depende muito do número de APs
34
(Access Points) que são instalados no local, podendo atingir uma precisão de alguns metros. Visto a WLAN
ter um maior alcance que o Bluetooth e a sua disponibilidade ter vindo a aumentar ao longo dos anos,
esta parece ser a escolha óbvia. Além do mais, a instalação da WLAN possibilita a utilização de muitas
outras aplicações, numa rede local ou mesmo na Internet, com velocidades de transmissão de dados muito
superiores ao Bluetooth. No entanto, a utilização de uma tecnologia não exclui a outra. Ambas podem ser
usadas em conjunto para possibilitar uma maior precisão. Os beacons Bluetooth têm a vantagem de ser mais
baratos, mas em contrapartida têm um alcance menor. Se a precisão de uma WLAN for insuficiente para
orientar correctamente um utilizador num ambiente interior, então podem ser espalhados alguns beacons
Bluetooth em pontos estratégicos, sem que o preço do sistema suba consideravelmente. Caso o espaço
interior possa ser coberto com apenas alguns beacons Bluetooth, então a utilização da WLAN apenas traria
a vantagem de ter uma maior velocidade de comunicação e possibilitar o acesso a um servidor ou a redes
exteriores.
Apesar da escolha da WLAN e Bluetooth, como as melhores opções para tecnologia de localização, o sistema
tem de ser suficientemente modular e flexível, para que a sua substituição seja simples. Neste caso é
especialmente importante, visto que a área de investigação de tecnologias de localização, tem vindo a fazer
grandes progressos nos últimos anos.
O sistema de orientação não pode ser visto como um substituto da bengala ou cão-guia, mas sim um
complemento, que pode auxiliar um invisual nas suas capacidades de orientação. Como tal, o hardware
que o utilizador terá de carregar tem de ser de fácil transporte e não pode interferir com a forma como
este se desloca. Alguns dos sistemas vistos anteriormente usam hardware especialmente desenhado para
deficientes visuais, na esperança que uma produção em larga escala faça baixar os seus custos de comercialização,
o que raramente acontece. Por isso, o uso de hardware comum (Off-The-Self ) e acessível à maior parte da
população é a opção mais segura, se queremos garantir que o sistema venha a ser usado. Hoje em dia,
qualquer PDA ou telemóvel tem suporte Bluetooth e cada vez mais com ligação a WLAN’s. O uso deste tipo
de dispositivos faz, na maior parte dos casos, parte do dia a dia de um cidadão, mesmo que seja com outros
propósitos. Logo, as dificuldades de adaptação e utilização do sistema seriam minimizadas.
Grande parte das interfaces de entrada dos sistemas baseiam-se na interacção por voz ou teclado. O uso da
voz como interface de entrada tem a grande desvantagem de ser de difícil utilização em ambientes ruidosos
e pode ser constrangedor para o utilizador. Como os ambiente interiores são por natureza ruidosos, o uso
do teclado é a opção mais viável.
Em relação à interface de saída, a multimodalidade parece ser a melhor solução. Fazendo uso das capacidades
dos dispositivos móveis actuais, a fala, earcon’s, auditory icons e a vibração, podem ser usados para guiar
o utilizador de forma eficaz. No entanto, um aspecto que é invariavelmente deixado de parte e bastante
importante, é o estudo com os utilizadores. O contacto com a população-alvo é uma forma de compreender
as suas necessidades e capacidades, levando à construção de um sistema com maior qualidade.
35
3Sistema de
Orientação paraInvisuais
A área de sistemas de orientação tem sido alvo de muita investigação nas últimas duas décadas, como vimos
no Capítulo 2. Esta investigação lida, essencialmente, com a tecnologia de localização usada. Existem já
alguns sistemas de orientação disponíveis no mercado, principalmente para ambientes exteriores, mas todos
fazem uso de dispositivos desenhados para utilizadores invisuais. As características deste tipo de sistemas,
como o custo, portabilidade e usabilidade, tornam a sua aceitação bastante reduzida.
O facto da maior parte destes sistemas ser desenhado para ambientes exteriores, prende-se essencialmente
com a aceitação do GPS. Neste tipo de ambientes, o GPS tornou-se globalmente aceite, devido à sua
alta disponibilidade, precisão e baixo custo. O mesmo não acontece em ambientes interiores, onde ainda
não existe um sistema de localização equivalente. No entanto, a necessidade dos utilizadores invisuais se
deslocarem no interior de edifícios e as dificuldades existentes são reais.
Num sistema de orientação, a forma como o utilizador é guiado e todo o retorno que lhe é dado, torna-se
crucial para o seu desempenho. No entanto, esta é uma tarefa muitas vezes deixada para segundo plano. É
necessário fornecer uma interface que se adeqúe às suas necessidades e capacidades.
A nossa abordagem faz uso de telemóveis comuns e, através do estudo com utilizadores, tenta resolver os
problemas identificados acima. Por telemóvel comum, entenda-se que não se pretende recorrer a adereços
adicionais, tais como teclados ou outros acessórios em Braille. Através de um desenho centrado no utilizador
conseguimos caracterizar a população alvo, as suas necessidades e capacidades, assim como os principais
problemas que estes enfrentam, particularmente, quando se deslocam em locais desconhecidos.
37
O uso de telemóveis torna-se adequado, devido à elevada disponibilidade, portabilidade, flexibilidade e baixo
custo, no entanto, o seu desenho e dimensões tornam a interacção visualmente exigente. Logo, foi também
necessário estudar e adoptar novas formas de interacção, de modo a tornar o sistema acessível.
O principal objectivo de um sistema de orientação é conseguir guiar o utilizador até um destino, por um
percurso desconhecido. Devido às suas características, o retorno auditivo torna-se o principal canal de
comunicação entre o sistema e o utilizador. Foram estudadas diferentes formas de instruir os utilizadores,
com o objectivo de facultar um retorno auditivo adequado às suas capacidades e expectativas. Uma vez
mais, a maior parte dos sistemas vistos no capítulo 2 não tem em conta este factor e não apresenta formas
de interacção eficazes e adequadas a este tipo de tarefa e utilizador.
3.1. Estudos PreliminaresApesar de termos analisado muitos dos sistemas construídos nesta área e identificado alguns dos seus
problemas, é essencial envolver os utilizadores no processo de desenho. Mesmo que alguns dos requisitos
possam surgir através do senso comum, é necessário um convívio com este tipo de utilizadores, para
conseguir identificar os problemas e limitações que estes enfrentam, assim como as suas práticas. Esta
é também uma forma de assegurar um desenho apropriado e de qualidade, visto que vai ao encontro das
necessidades dos utilizadores [20].
De forma a conseguir caracterizar a população alvo quanto às suas capacidades, necessidades e práticas
correntes, foi feita uma análise de tarefas. Nesta fase, a colaboração com a Fundação Raquel e Martin
Sain foi essencial, tendo todo o estudo sido feito aos seus formandos. Esta instituição tem como principal
finalidade a reabilitação profissional e a integração sócio-profissional de deficientes visuais.
3.1.1. Concepção Centrada no UtilizadorA concepção centrada no utilizador é vista como uma filosofia e processo que coloca a pessoa no centro.
É um processo que se foca nas capacidades cognitivas dos utilizadores e na forma como estas podem
influenciar a interacção com os sistemas. A concepção centrada no utilizador pode melhorar a utilidade
e usabilidade de tudo com que as pessoas interagem, desde artefactos do dia-a-dia [41] a sistemas de
software, processos, etc.
Esta é uma das principais contribuições da dissertação, visto que toda a concepção foi centrada no utilizador,
tentando recolher o máximo de informação possível, para que, através de um processo de desenvolvimento
iterativo, em que o protótipo foi mudado de acordo com os resultados e retorno dos utilizadores, pudéssemos
garantir a sua qualidade. Esta metodologia trouxe vantagens para ambas as partes envolventes, ou seja,
permitiu-nos ganhar uma maior sensibilidade para os problemas que este tipo de utilizadores enfrenta, mas
38
também gerir as suas expectativas e criar um sistema alinhado com as suas visões e desejos.
Assim, para os estudos apresentados nesta dissertação, foi escolhida uma amostra significativa de utilizadores
com alguma deficiência visual. Todos os elementos da amostra eram formandos da Fundação Raquel e
Martin Sain e, apesar de alguns nos acompanharem durante todo o processo, outros não tiveram essa
possibilidade. Todas as experiências, testes e análises foram feitos, exclusivamente, a utilizadores com
algum grau de cegueira (total ou parcial).
3.1.2. Entrevistas e Questionários
A primeira técnica a ser usada foram as entrevistas, que tiveram como principal objectivo obter um primeiro
contacto com este tipo de utilizadores e identificar as principais dificuldades que enfrentam no seu dia-a-dia.
Estas entrevistas eram semi-estruturadas e a maior parte das perguntas abertas, o que levou a um diálogo
bastante informal e amigável. Foram feitas oito entrevistas, cada uma com cerca de vinte minutos de duração.
Numa segunda fase e após a análise das entrevistas, foi elaborado um questionário (Anexo A1.1) mais
preciso e conciso, de forma a abranger uma maior amostra da população. Os questionários foram feitos
individualmente a dezoito formandos e tiveram uma duração média de dez minutos. Tiveram como principais
objectivos traçar um perfil do utilizador, as suas limitações, práticas correntes, grau de independência e
conhecimentos tecnológicos. Na secção seguinte, serão apresentados os principais resultados.
Perfil do Utilizador
A amostra da população é maioritariamente do sexo masculino e com idades superiores a quarenta e cinco
anos (Tabela 3.1). Os utilizadores têm um baixo grau académico, sendo que apenas quatro terminaram o 12o
ano. Este resultado pode ser relacionado com a faixa etária em causa. Geralmente usam bengala e quando
tal não acontece, é porque andam constantemente acompanhados. Os resultados mostraram, também, que
apesar da maior parte dos utilizadores conseguir ler e escrever Braille, ainda apresenta muitas dificuldades,
principalmente na leitura.
Tabela 3.1: Perfil utilizador.
39
Uso de Dispositivos Móveis
Em relação ao uso de dispositivos móveis, todos os utilizadores possuem pelo menos um telemóvel e
usam-no diariamente, com excepção de um utilizador (Tabela 3.2). A maior parte dos entrevistados utiliza um
leitor de ecrã e, pela análise de resultados, este permite-lhes usar mais funcionalidades do seu telemóvel.
Mesmo assim, todos os utilizadores conseguem efectuar e receber chamadas. Podemos concluir que a
população alvo tem alguma experiência com dispositivos móveis, mas apenas consegue executar um número
muito limitado de tarefas.
Tabela 3.2: Uso de dispositivos móveis.
Outro resultado importante que surgiu desta análise foram as tecnologias disponíveis nos telemóveis dos
utilizadores. O Bluetooth revelou estar presente na maior parte dos dispositivos móveis.
Grau de Independência
Pela Tabela 3.3, podemos concluir que os utilizadores andam muitas vezes sozinhos, mesmo em locais
desconhecidos. No entanto, quando visitam um edifício público desconhecido, a esmagadora maioria referiu
que não consegue encontrar o balcão pretendido sem a ajuda de terceiros. Podemos concluir que a ajuda,
neste tipo de ambientes, é muitas vezes necessária, fazendo com que os utilizadores invisuais não tenham
o grau de independência e autonomia que desejam.
3.1.3. ObservaçãoOs sistemas de orientação têm como principal tarefa guiar um utilizador por um percurso que este não
conhece. Neste tipo de situação, ou seja, quando o utilizador não conhece o local, a maior parte dos
deficientes visuais recorre à ajuda de terceiros para chegar ao seu destino. Normalmente, esta ajuda consiste
em acompanhar a pessoa até ao local desejado. Um sistema de orientação pretende substituir este guia
40
Tabela 3.3: Grau de independência.
presencial por um guia virtual.
No entanto, o guia tem de ser capaz de interagir com o utilizador de uma forma compreensível, precisa e o
mais familiar possível. Por isso, decidimos efectuar uma observação dos utilizadores, que teve os seguintes
objectivos: analisar os comportamentos, dificuldades, capacidades, necessidades e técnicas usadas, num
cenário desconhecido; analisar a evolução dos mapas mentais de cada utilizador; identificar as informações
mais relevantes num cenário; estudar a forma como este tipo de utilizadores verbaliza um dado percurso;
estudar formas de comunicação entre utilizadores invisuais;
3.1.3.1. Procedimento
Nesta fase, foram escolhidas três pessoas, cuja principal tarefa seria a de explorar um local interior desconhecido,
com o objectivo de obter um total conhecimento do espaço. Entenda-se por total, o conhecimento suficiente
para, em qualquer ponto do cenário, conseguir inferir a sua localização, ou seja, o conhecimento suficiente
para se manter sempre orientado.
Cada utilizador teve três sessões (três dias consecutivos) de exploração, com a duração de quarenta e cinco
minutos cada. Todas as sessões obedeceram a um guião (Anexo A1.2), para que todos os exploradores
fossem expostos às mesmas situações. Seguindo a mesma metáfora desenvolvida em [55], em todas as
sessões foram recolhidas as histórias que os utilizadores construíram do percurso, dividido por troços e na
sua totalidade, para guiarem um colega invisual.
O local escolhido foi a cave da Fundação Raquel e Martin Sain, por ser um espaço que já não era frequentado.
Foi possível construir um percurso, com dois andares, diversos caminhos e obstáculos, de forma a simular
um cenário o mais real possível. O mapa e o percurso traçados encontram-se representados na Figura 3.1.
41
(a) Piso superior. (b) Piso inferior.
Figura 3.1: Mapa e percurso do local onde foi efectuada a observação.
3.1.3.2. Os Utilizadores
Nesta fase, voluntariaram-se três utilizadores para participar no estudo, como exploradores do local. Um
dos utilizadores ainda conseguia ver alguma luminosidade e os restantes eram cegos totais. Tinham idades
compreendidas entre os vinte e seis e os cinquenta e cinco anos e eram todos do sexo masculino. Os
participantes tinham a sua deficiência visual há mais de dezassete anos e apenas um deles frequentou um
curso de reabilitação, no qual lhe ensinaram técnicas básicas de mobilidade e orientação.
3.1.3.3. Conclusões
Este estudo permitiu-nos retirar algumas conclusões que serão enunciadas em seguida.
Pontos de Referência vs. Obstáculos: Todos os artefactos que fazem parte da infra-estrutura do local
e permitem ao utilizador inferir a sua localização são pontos de referência. Todos os outros objectos que
podem ser facilmente transportados são obstáculos.
Os olhos são a bengala: Enquanto uma pessoa visualmente capaz consegue ter um conhecimento do
local através das mais variadas pistas visuais, um invisual tem, obrigatoriamente, de se deslocar por todo
o espaço, de modo a conseguir construir um modelo mental apropriado. Este modelo é criado através de
pistas auditivas e hápticas, recorrendo a técnicas base de mobilidade, ou seja, o uso da bengala.
Exploração por tentativa e erro: Num local desconhecido, a única forma que um utilizador invisual tem de
explorar um espaço desconhecido é através de uma abordagem tentativa erro. Ou seja, usando as técnicas
42
básicas de mobilidade, o utilizador vai andando lentamente, identificando os obstáculos que o rodeiam e
construindo o seu mapa mental. Numa primeira fase, a identificação dos obstáculos é feita através do som
que estes emitem em contacto com a bengala. O tacto só é usado caso o utilizador deseje identificar o
objecto com uma maior exactidão.
Obstáculos dificultam percepção da realidade: Os obstáculos podem dar ao utilizador uma noção incorrecta
da dimensão de um local, transmitindo a falsa sensação de parede ou fim do caminho. Por exemplo, se um
ponto de referência, como um pilar, estiver rodeado de cadeiras (ou outro obstáculo), então o utilizador vai
ter muitas dificuldades em identificá-lo. Devido à própria natureza dos obstáculos e à facilidade com que se
podem mudar, esta é uma situação que pode ocorrer com alguma frequência.
Facilidade em decorar um percurso: Nesta experiência, todos os utilizadores conseguiram terminar o
percurso em menos de dez minutos e recriaram uma história, com base no seu modelo mental do local, que
apesar de ser pouco pormenorizada, correspondia à realidade.
Utilizadores cingem-se a um percurso: Um invisual, depois de ter um mapa mental de um local, já não tem
a necessidade de o explorar à procura de novos caminhos ou pontos de referência, cingindo-se apenas a
percursos que já domina. No entanto, este percurso pode não ser o mais seguro ou eficiente, mas é preferível
a explorar novos espaços desconhecidos.
Modelo mental incompleto: Como consequência do ponto anterior, o utilizador faz um mapa mental do
espaço que é, muitas vezes, incompleto. Isto leva a que, quando identifica algo de novo no seu percurso
e que não corresponde ao seu mapa mental, fique desorientado. Até descobrir novamente um ponto de
referência, o utilizador encontra-se num local totalmente desconhecido, que, em última instância, pode levar
a situações de stress ou pânico.
Em caso de desorientação, volta-se para atrás: Geralmente, quando os utilizadores se sentem perdidos, a
primeira reacção é tentar voltar para trás e identificar um ponto de referência, com o objectivo de se localizar
no espaço e adaptar o desconhecido ao seu modelo mental.
Menos é melhor: Durante esta experiência, mas em especial na última sessão, notou-se uma preocupação
nos participantes em construir uma história o mais simples possível, mas precisa. Os utilizadores referiram
que é preferível uma instrução simples, clara e precisa, em detrimento a muitas descrições.
História completa vs. História por troços: As histórias completas são mais detalhadas e descrevem
o percurso passo a passo, enquanto as histórias por troços são mais simples e objectivas. Visto que as
últimas foram recolhidas durante a execução do percurso, as histórias poderão pressupor que o utilizador
está envolvido num dado contexto, daí as instruções serem menos descritivas.
43
3.1.4. Reunião de GrupoApós a fase de observação e respectiva análise, esta reunião teve como principais objectivos discutir e
consolidar, com todos os participantes, algumas das conclusões retiradas da fase anterior.
3.1.4.1. ProcedimentoForam reunidos todos os utilizadores da fase anterior, assim como um ex-instrutor de técnicas de mobilidade
e orientação, para uma reunião de grupo. O plano de trabalhos (ver Anexo A1.3) tinha como principais
assuntos: obter uma única (a "melhor") história do percurso; qual o comportamento mais adequado a adoptar
quando um utilizador se perde; quais as informações mais relevantes num espaço interior e a melhor forma
de as transmitir;
Esta reunião durou cerca de duas horas e quinze minutos e todos os elementos participaram na discussão.
3.1.4.2. Os UtilizadoresOs participantes desta reunião foram exactamente os mesmos utilizadores que estiveram presentes na fase
anterior. Contamos também com a participação de um ex-instrutor de técnicas de mobilidade e orientação
para invisuais, que nos forneceu uma visão mais técnica e ajustada ao tipo de formação que estes utilizadores
recebem.
3.1.4.3. ConclusõesO principal resultado desta reunião foi a criação de uma só história, que descreve todo o percurso (Figura
3.1). Em seguida. será apresentada a história final, assim como algumas conclusões que foram retiradas
durante o estudo.
História final: "Entre na porta, siga em frente, desça a rampa do corredor e, no final, vire à direita. Vá em
frente, junto ao lado direito, até ao final e vire à esquerda, até às escadas. Desça dois lances de escadas,
que têm um corrimão do lado esquerdo. Siga em frente, encostado aos armários do lado direito, até ao
obstáculo. Vire à esquerda e vá em frente, até à secretária do telefone. Contorne-a pela direita, siga em
frente, até à porta e irá encontrar uma mesa, que deverá contornar pela direita. Vire à esquerda e suba três
lances de escadas. Em frente, irá encontrar o elevador."
Pontos de referência: Durante todo este estudo e em particular nesta reunião, ficou bem claro que os
pontos de referência são cruciais para um invisual. É a partir destes que o utilizador consegue inferir a
sua localização e orientar-se num dado local. Pelas histórias recolhidas anteriormente, durante a fase de
observação, estas referências correspondem, normalmente, a pontos de decisão onde o utilizador tem de
mudar de direcção. No entanto, nem todos os artefactos do cenário podem ser pontos de referência, apenas
44
elementos da infra-estrutura (pilares, portas, paredes, escadas, etc.) ou outros elementos que não sejam
facilmente movidos (electrodomésticos, balcões, etc.). Apesar dos utilizadores recorrerem muitas vezes às
propriedades (auditivas ou hápticas) destes elementos, elas não foram inseridas na história final, porque
diferentes pessoas podem identificar o mesmo ponto de referência, de diferentes formas. No entanto, temos
de garantir que um ponto de referência é facilmente identificável.
Nível de detalhe: As principais diferenças nas histórias anteriormente recolhidas diziam respeito ao nível de
detalhe das instruções. A descrição do espaço, o número de escadas ou o lado pelo qual o utilizador se deve
deslocar são alguns exemplos. Nesta reunião, todos os participantes concordaram que o nível de detalhe
deve ser o menor possível. Apenas quando existe perigo (por exemplo, escadas) ou uma necessidade
especial (por exemplo, quando existem sinais) deve ser dado mais detalhe.
Não substitui bengala: Como as histórias não fazem referência (nem devem) a obstáculos, o uso de bengala
é obrigatório. Um sistema de orientação não tenta substituir as técnicas de mobilidade e orientação, apenas
indicar um percurso pelo qual o utilizador deve seguir.
Contexto: Apesar de não ser descrito nas histórias, os utilizadores mostraram um grande interesse em
ter acesso a outras informações, que geralmente lhes está inacessível. Estas informações podem ser
divididas em duas categorias: estrutura do cenário - corresponde às características do local (dimensões,
forma, número de pisos, etc.); pontos de interesse - são todos os locais que podem ser possíveis destinos
(lojas, balcões, casas de banho, etc.).
3.1.5. Guias de DesenhoDepois do contacto com os utilizadores, algumas guias de desenho começaram a surgir. Nesta secção,
iremos especificar cada uma delas e construir um conjunto de princípios que devem ser respeitados no
desenho de uma interface de orientação para invisuais.
G1 - Adaptar-se às capacidades do utilizadorA interface utilizador deverá ter em conta o perfil da população alvo e adaptar-se às suas necessidades e
capacidades. Apesar da maior parte das interfaces actuais ser visualmente exigente, os utilizadores terão de
ser capazes de inserir dados no sistema e receber o seu retorno.
G2 - AceitaçãoUm factor importante de qualquer interface utilizador é a sua aceitação. Um sistema de orientação irá
provavelmente ser usado em público, logo, é importante que seja adequado a este tipo de situações. Intimamente
ligado à aceitação social está a aceitação do utilizador. A estética, o hardware necessário e os métodos de
45
interacção tornam-se factores cruciais. O estudo centrado no utilizador, ao desenhar este tipo de interface,
poderá garantir o seu sucesso.
G3 - Importância das InstruçõesOs sistemas de orientação tradicionais têm, normalmente, uma interface de saída gráfica e falada. Estas
duas modalidades têm o objectivo de dar ao utilizador instruções precisas e manter uma baixa carga cognitiva.
Neste caso, os diálogos podem ser desambiguados ou até mesmo excluídos, face à existência de uma
representação visual do local onde o utilizador se encontra.
No caso dos utilizadores invisuais, estes não têm acesso a pistas visuais e não conseguem interagir com uma
interface gráfica comum. Assim, o retorno auditivo torna-se essencial para a interacção pessoa-máquina.
Temos de ter em conta as necessidades e dificuldades que este tipo de utilizadores enfrenta e a interface
tem de reflectir as práticas e técnicas de orientação e mobilidade usadas, através de uma comunicação
clara, precisa, consistente e de acordo com as suas capacidades. As instruções devem usar um vocabulário
familiar e não ambíguo, de modo a evitar erros e situações de stress. Para além de se adaptar ao tipo de
utilizador, a interface deve ter em conta o cenário e o contexto em que este está inserido.
G4 - Carga CognitivaApesar de possuírem menos um sentido, a carga cognitiva dos utilizadores invisuais é, por vezes, superior
à dos utilizadores visualmente capazes. No simples processo de se deslocar, um invisual tem de estar a
empregar constantemente técnicas de mobilidade, recorrendo à sua bengala, na eventualidade de existir
algum obstáculo ou perigo, o que requer uma carga cognitiva adicional. A concentração necessária para
executar uma tarefa tão simples é superior à dos utilizadores sem deficiências. Ao usar um sistema de
orientação em que o retorno é dado através da fala, esta deve ser simples e concisa, de modo a minimizar a
atenção necessária para a compreender.
G5 - Fornecer AjudaDevido à complexidade da tarefa de guiar um utilizador invisual, num local desconhecido, a possibilidade
de este se perder ou desviar do percurso é uma realidade. No entanto, devem existir mecanismos que
permitam ajudar o utilizador a retomar a rota pretendida. Estes mecanismos poderão ser activados pelo
próprio utilizador ou inferidos pelo sistema.
G6 - Aumentar a RealidadeUm invisual, ao visitar um edifício desconhecido está dependente da ajuda que outras pessoas lhe possam
fornecer. Esta ajuda consiste em guiar e fornecer indicações, para que possa chegar ao seu destino em
46
segurança. Como este tipo de utilizadores não tem acesso a pistas visuais, que por vezes são cruciais para
a percepção de todo o ambiente envolvente, são também necessários métodos de contextualização, que
permitam aos utilizadores ter acesso a informações gerais, descrições do espaço ou pontos de interesse
existentes.
3.2. Sistema de Orientação em Dispositivos MóveisNa secção anterior, definimos um conjunto de guias de desenho, que surgiram depois da caracterização dos
utilizadores e das suas práticas. Nesta dissertação, iremos focar a nossa atenção em duas frentes: tornar
acessível um sistema de orientação, a partir de um dispositivo móvel comum; dar ao utilizador um retorno
auditivo apropriado e familiar;
3.2.1. Cenários do ProblemaA abordagem proposta faz uso de telemóveis comuns, para fornecer ao utilizador um discurso adequado às
suas capacidades e substituir a ajuda humana, em descrever e guiar o utilizador num local desconhecido.
Para além disto, o sistema terá de ser capaz de operar sobre diferentes interfaces de entrada, devido à
diversidade de dispositivos existente no mercado.
Loja do Cidadão
A validade do bilhete de identidade do Ruben vai expirar na próxima semana. Então, este decide ir até à
Loja do Cidadão mais próxima. Ao entrar, o Ruben consegue aperceber-se, através do barulho, da confusão
que está naquela sala. Não se deixando intimidar por não conhecer o local e não conseguir ver quaisquer
indicações, acede ao seu telemóvel e inicia o seu sistema de orientação, o Blobby. Por ser a primeira vez
que visita esta loja do cidadão, o Ruben decide pedir ao sistema uma pequena contextualização do local.
Este diz-lhe o tamanho da sala, posições dos balcões de atendimento, senhas e salas de espera. Em
seguida, apresenta-lhe uma lista de serviços disponíveis, tais como tirar/renovar o B.I., carta de condução
ou cartão-jovem. O Ruben escolhe o serviço de renovar o B.I. e, de imediato, a aplicação traça uma rota e
informa-o de todos os passos que terá de efectuar. A partir deste momento, o Ruben será constantemente
acompanhado pelo sistema, que o irá guiar até completar todos os passos para a renovação do seu bilhete
de identidade.
Visita ao Museu
O João, um aluno invisual do 3o ano de arqueologia, vai ao Núcleo Arqueológico da Rua dos Correios
(NARC). Ao entrar no edifício e como é a primeira vez que visita o local, liga o seu sistema de orientação, o
Blobby. A aplicação já tem uma visita pré programada e o João decide fazê-la, seguindo as instruções que
lhe são dadas. Entretanto, durante o decorrer da visita, ao entrar numa nova sala, o Blobby avisa-o que tem
47
uma nova mensagem e este decide ouvi-la. A aplicação indica que entrou num complexo industrial, banhos
e via, da época romana e permite ao utilizador obter uma descrição mais detalhada de todo o complexo. Ao
terminar a visita e já no período quinhentista, enquanto caminha, o João recebe uma indicação de que, ao
seu lado, se encontra uma parede de azulejos sevilhanos.
3.2.2. Interacção com Dispositivos Móveis
Os dispositivos móveis actuais possuem interfaces pessoa máquina visualmente exigentes, o que dificulta
ou impossibilita os utilizadores invisuais de interagir com o seu dispositivo. O utilizador comum consegue
apenas, através de mecanismos de memorização, efectuar e receber chamadas telefónicas, apesar das
vastas potencialidades e funcionalidades existentes neste tipo de dispositivos.
A crescente evolução dos telemóveis tem vindo a ser acompanhada de um crescente fosso entre estes
dispositivos e os utilizadores invisuais. A constante redução das suas dimensões, a adopção das interfaces
gráficas como paradigma dominante e os mecanismos de interacção existentes (i.e. teclado ou ecrã táctil)
tornam os dispositivos móveis inadequados a este tipo de utilizadores (Figura 3.2).
(a) Teclado (b) Ecrã Táctil
Figura 3.2: Métodos de interacção com dispositivos móveis.
No entanto, apesar de estar acessível apenas um número limitado de funcionalidades, este tipo de dispositivos
faz parte do quotidiano dos utilizadores e possui as tecnologias necessárias para a construção de um sistema
de orientação. O desafio é construir uma interface adequada, que permita aos utilizadores invisuais interagir
com uma aplicação complexa, onde é necessário seleccionarem opções, inserir texto e navegar entre menus.
3.2.3. Retorno Auditivo Familiar
Através de um estudo centrado no utilizador e na forma como estes comunicam entre si, foram identificados
os principais elementos e regras para a construção de uma instrução. Através destas regras, poderá ser
dado um retorno auditivo adequado, consistente e familiar, para guiar um utilizador ao longo de uma rota.
48
Porquê a fala?
Foi escolhida uma interface de saída falada, por ser uma forma natural de interacção e de grande expressividade.
Como alternativa, poderia ter sido usado o som (não fala) tridimensional, para guiar o utilizador ao longo de
um percurso. No entanto, este tipo de sistema [67] mostra-se muito intrusivo e com uma baixa aceitação,
devido à constante repetição de um som, indicativo do utilizador se encontrar dentro ou fora da rota. A
capacidade auditiva é um dos recursos mais importantes para o bem-estar e autonomia de um invisual. De
modo a receber um retorno auditivo em três dimensões, os utilizadores são obrigados a usar dois auriculares,
que, por sua vez, podem bloquear sons ambientais e tornar-se um incómodo.
Por outro lado, com o desenvolvimento dos sintetizadores de fala, esta é uma técnica que pode ser usada
para guiar um utilizador invisual. No entanto, apresenta uma elevada carga cognitiva. São necessárias novas
abordagens, que permitam ao utilizador uma fácil compreensão e memorização.
Elementos das Instruções
Com a recolha das histórias na fase de observação (Secção 3.1.3)e depois da reunião de grupo (Secção
3.1.4), conseguimos extrair um conjunto de elementos que são usados para guiar um invisual.
Acção: As instruções dadas aos utilizadores, tal como o nome indica, têm de o mandar fazer algo. Logo,
uma acção pode ser: vire, volte, siga, desça, suba, entre, saia.
Direcção: Algumas das acções vistas acima necessitam de uma direcção, para que possam fazer sentido.
Por exemplo, as acções: siga, vire ou volte, precisam de ser complementadas com a correspondente direcção
(esquerda, direita, frente, trás).
Lado: Por vezes, numa dada instrução, é necessário fazer referência ao lado pelo qual o utilizador se deve
deslocar, direita ou esquerda. Isto pode acontecer por várias razões: espaço muito amplo, segurança ou
evitar obstáculos.
Tempo / Distância: Geralmente, um ponto de referência está associado a um ponto de decisão (i.e. mudança
de direcção). A referência a estes pontos é feita através de elementos temporais ou de distância. Por
exemplo, "vire à direita depois de passar uma porta" ou "siga em frente três passos ...".
Objecto: Um objecto consiste em qualquer artefacto que possa existir no local. Portas, escadas, mesas,
cadeiras, armários, paredes ou pilares são alguns exemplos. A utilização de objectos serve, também, para
completar algumas acções: desça, suba, entre ou saia, têm de fazer referência a um objecto, escadas ou
portas, respectivamente.
49
Estrutura das InstruçõesA estrutura de uma instrução pode variar tendo em conta o cenário e o local onde o utilizador se encontra. A
Tabela 3.3 apresenta as estruturas mais frequentes numa instrução e um exemplo.
Figura 3.3: Estrutura das instruções mais frequentes.
Concluindo, todas as instruções podem ser definidas através da seguinte expressão regular [24]:
Acção Direcção? ([Tempo Lado Distância]* Objecto)?
Pontos de ReferênciaComo foi visto nas secções anteriores, os pontos de referências são essenciais para a construção das
instruções e, consequentemente, para conseguir guiar o utilizador. A dificuldade inerente a esta abordagem
consiste em escolher estes pontos de referência. Para que o utilizador consiga compreender o retorno do
sistema, estes têm de ser facilmente identificáveis, ou seja, têm de ser elementos do cenário que o utilizador
consiga distinguir de todos os outros, tais como: escadas, portas ou balcões. Os pontos de referência devem
ser escolhidos tendo em conta as capacidades e técnicas usadas por este tipo de utilizadores, logo, objectos
que estejam ao alcance da bengala e tenham propriedades sonoras ou hápticas únicas são bons candidatos.
ContextualizaçãoUm sistema de orientação, tal como o nome indica, tem o principal objectivo de aumentar as capacidades
de orientação do utilizador, guiando-o por um percurso até ao seu destino. Um sistema de orientação para
invisuais tem, obrigatoriamente, de ir mais além. Enquanto uma pessoa visualmente capaz consegue, com
facilidade, perceber o contexto em que se encontra inserida, um deficiente visual pode ter muitas dificuldades
na percepção das dimensões, pontos de interesse (casas de banho, recepção, etc.), sinais ou perigos do
local. Logo, este tipo de sistemas tem de ser capaz de contextualizar o utilizador.
Pelos estudos realizados, conseguimos dividir as informações necessárias em duas áreas: estrutura do
cenário - corresponde às características do local (dimensões, forma, número de pisos, etc.); pontos de
interesse - são todos os locais que podem ser possíveis destinos (lojas, balcões, casas de banho, etc.);
Mais uma vez, a utilização da fala como modalidade de saída mostra-se adequada, devido à sua elevada
expressividade.
50
3.3. Avaliação PreliminarUm invisual tem muitas dificuldades em se conseguir orientar num espaço desconhecido, sem a ajuda de
outrem. A nossa abordagem tira proveito das capacidades deste tipo de utilizadores e fornece um retorno
auditivo que vai ao encontro das suas necessidades.
A maior parte dos trabalhos vistos no Capítulo 2 não tem em conta a forma como o utilizador é guiado. Mesmo
os que tentam resolver este problema, não têm em conta as práticas dos utilizadores invisuais e originam
interfaces inadequadas. Devido a estas diferenças, era crucial proceder a uma validação da abordagem.
As próximas secções apresentam a nossa avaliação preliminar à abordagem apresentada.
3.3.1. ProcedimentoO objectivo desta avaliação era conseguir guiar o utilizador através de um percurso previamente definido.
Decidimos aplicar um teste de Feiticeiro de Oz [20], por este não requerer suporte computacional e permitir a
um humano simular as funcionalidades pretendidas. Neste caso, não existe qualquer componente computacional
e toda a interacção com o utilizador foi simulada (Figura 3.4). No entanto, as instruções existentes foram
previamente definidas (ver Secção 3.1.4). O guião desta avaliação está disponível no Anexo A2
O utilizador foi constantemente "seguido"por uma pessoa visualmente capaz, cujo papel era o de simular
o sistema de orientação e fornecer-lhe um conjunto de instruções. O local e percurso escolhidos foram os
mesmos da fase de observação (ver Secção 3.1.3). As instruções foram dadas em pontos previamente
definidos na reunião de grupo (ver Secção 3.1.4). Durante a realização do percurso, a única operação
acessível ao utilizador era a repetição da última instrução.
Para garantir uma análise fidedigna, toda a avaliação foi gravada (vídeo e som) e foi realizado um questionário
no inicio e final do teste, de modo a caracterizar e obter a satisfação dos utilizadores.
Figura 3.4: Representação da avaliação preliminar.
51
3.3.2. Os UtilizadoresPara esta avaliação voluntariaram-se nove utilizadores, com idades compreendidas entre os vinte e cinco e
sessenta e cinco anos. Dois dos utilizadores eram cegos parciais e os restantes, cegos totais. A maior parte
da população (cinco utilizadores) era do sexo masculino. Todos os participantes possuem, pelo menos, a
antiga terceira classe e todos frequentaram um curso de reabilitação, no qual lhes ensinaram técnicas de
mobilidade e orientação. É de salientar que nenhum dos utilizadores tinha um conhecimento prévio do local
onde se realizou o teste.
3.3.3. ResultadosEste foi o primeiro teste realizado com o objectivo de guiar um utilizador invisual. O primeiro resultado
relevante tem a ver com o comportamento dos utilizadores. Alguns dos participantes demonstraram um
comportamento de seguir sempre em frente até se sentirem "perdidos"e não esperavam para ouvir toda a
instrução até começarem a executá-la.
Apesar do vocabulário usado ter sido dado por utilizadores invisuais, houve uma instrução que gerou bastante
confusão. A instrução "contorne a mesa pela direita e siga em frente" foi interpretada de diferentes formas
(Figura 3.5): virar à direita ao encontrar mesa; virar à direita depois de encontrar a mesa; contornar a mesa
na totalidade pela direita e seguir em frente; passar a mesa e seguir em frente. A instrução "... desça a
rampa do corredor e, no final, vire à direita.", mostrou também alguma ambiguidade, por os utilizadores não
conseguirem detectar o final da rampa.
(a) Virar ao encontrar o
obstáculo.
(b) Virar depois de passar o
obstáculo.
(c) Contornar a mesa na
totalidade.
(d) Contornar o obstáculo e
seguir em frente.
Figura 3.5: Diferentes formas de contornar um obstáculo
Segundo esta abordagem, a identificação dos pontos de referência que foram dados nas instruções revelou
ser crucial. Caso o participante não detectasse um ponto de referência, então toda a instrução ficava
descontextualizada. Esta identificação foi útil também para o caso em que o utilizador se perdia. Caso
voltasse atrás e identificasse um dos pontos de referência, então podia retomar o seu percurso normal. Ou
seja, todos estes pontos devem ser facilmente identificados.
Um erro consiste num desvio do percurso traçado, que o utilizador pode vir a recuperar sozinho ou através
de ajuda (externa ou do sistema). Neste teste, as ajudas do sistema consistiam em pedir ao utilizador que se
deslocasse até ao último ponto de referência e, a partir daí, continuar a guiá-lo até ao seu destino. O pedido
de uma ajuda externa significa que o sistema (wizard) não conseguiu guiar o utilizador e a intervenção
52
humana (exterior ao sistema) foi necessária. Pela Figura 3.6, podemos ver que três dos participantes
necessitaram de ajudas externas, que corresponderam exactamente às instruções mais problemáticas. Com
a excepção de dois erros noutras zonas do percurso (que foram resolvidos pelo sistema), todas as ajudas
foram originadas por duas instruções cujo vocabulário era ambíguo (Figura 3.7): "... desça a rampa do
corredor e no final ..."; "contorne a mesa ...".
Figura 3.6: Ajudas por participante da avaliação preliminar.
Figura 3.7: Ajudas por zona (Figura A2.2) da avaliação preliminar.
No entanto, os utilizadores mostraram-se, na generalidade, bastante satisfeitos com a forma como foram
instruídos durante o percurso. Revelaram curiosidade e interesse pelo trabalho, argumentando que poderia
ser uma forma de aumentar a sua autonomia e um incentivo para conhecer locais nunca antes visitados.
Pelos resultados obtidos nesta avaliação, acreditamos que a nossa abordagem é válida e bem aceite pelos
utilizadores. Este teste permitiu-nos, também, responder a algumas perguntas que poderão ser usadas, em
trabalhos futuros, nesta linha de investigação.
A interacção através da fala é uma abordagem viável? Sim. O estudo com a população alvo e as
elações daí retiradas permitiram-nos construir um conjunto de instruções, que tiveram como objectivo guiar
os utilizadores por um percurso desconhecido. Os resultados mostraram que as instruções por fala permitem
uma interacção natural, fácil (sem necessidade de treino) e adequada às suas práticas.
53
Os pontos de referência escolhidos influenciam o desempenho do utilizador? Sim. A escolha dos
pontos de referência mostrou ser uma tarefa crucial. Pela sua importância, os pontos de referência devem
ser elementos do cenário facilmente identificáveis e pouco prováveis de mudar de localização. Caso estes
pontos não sejam identificados pelo utilizador, este terá uma elevada probabilidade de se perder e necessitar
de ajuda humana.
A informação de cada instrução é suficiente? Sim. Um dos grandes objectivos desta avaliação foi verificar
se as instruções precisavam de alguma contextualização (descrição do espaço) ou referência aos obstáculos
existentes, para guiar o utilizador. Através do uso adequado da bengala, os utilizadores conseguiram evitar
os obstáculos, mesmo sem terem conhecimento prévio da sua existência. Depois desta avaliação, podemos
concluir que as instruções devem ser curtas, simples e precisas, de modo a manter uma baixa carga cognitiva
e minimizar a necessidade de memorização.
Os utilizadores compreendem o vocabulário? Sim. Com excepção da palavra "contornar", que gerou
alguma confusão, todo o vocabulário foi facilmente entendido pelos utilizadores. Todo o discurso foi o reflexo
de um estudo centrado no utilizador, que teve como objectivo mapear o vocabulário (e todas as experiências
inerentes) usado por estes utilizadores.
Os utilizadores conseguem associar as instruções à realidade? Sim. Depois de ouvirem uma instrução,
os utilizadores vão já com a intenção de procurar um determinado ponto de referência e, na esmagadora
maioria dos casos, conseguem fazê-lo, mapeando as informações das instruções com a realidade.
54
4O Guia Móvel
Através do estudo centrado no utilizador, foi definida uma abordagem para fazer face a alguns dos problemas
actuais nos sistemas de orientação para invisuais. A nossa abordagem está focada nas limitações existentes,
no que diz respeito às interfaces pessoa máquina. O retorno auditivo e a interacção com dispositivos móveis
tradicionais foram os principais focos de trabalho. Para validar a nossa abordagem, foi desenvolvido um
protótipo que será apresentado em detalhe neste capítulo.
4.1. ArquitecturaNo Capítulo 3, definimos uma abordagem baseada num retorno auditivo familiar, através da fala. Para
conseguir validar esta abordagem, foi implementado um protótipo, constituído por diferentes módulos, que
permitem a separação entre a interface utilizador, o sistema de localização, a construção de instruções e o
modelo de domínio da aplicação. A arquitectura do sistema encontra-se representada na Figura 4.1
Figura 4.1: Arquitectura do sistema.
O Módulo de Localização diz respeito à capacidade do sistema inferir a localização do utilizador num dado
espaço. Este módulo está intimamente ligado à tecnologia de localização utilizada. No nosso sistema, foram
55
usados dois módulos: Bluetooth e WLAN, sendo que este último foi desenvolvido pelo Pedro Sousa [50].
Assim, conseguimos obter um sistema independente da tecnologia de localização, modular e flexível, em que
podem ser facilmente adicionados novos módulos (e.g. processamento de imagem, RFID ou GPS). De modo
a combinar todos estes módulos, a posição do utilizador pode ser encontrada através de uma abordagem de
colaboração, em que os resultados dos vários módulos são combinados, através de um gestor de localização.
A Lógica de Domínio corresponde ao núcleo da nossa aplicação e está relacionado com todas as entidades
e lógica de domínio. Toda a gestão de mapas, rotas, percursos, grafos, objectos e outras entidades de
domínio, são da sua responsabilidade. Um dos aspectos mais importantes deste módulo é a criação dos
mapas e percursos. Os percursos são calculados tendo em conta a posição do utilizador (módulo de
localização) e o destino pretendido, através do algoritmo de Dijkstra [19]. Como se pode ver, este módulo dá
suporte aos restantes componentes da arquitectura, fornecendo um estado do sistema, lógica aplicacional e
um modelo de domínio.
O Módulo de Orientação está directamente relacionado com a posição e percurso do utilizador. Tendo
estes parâmetros, é da sua responsabilidade construir um conjunto de instruções que permitam ao utilizador
chegar ao seu destino. Mais uma vez, a modularidade da aplicação foi um requisito, podendo facilmente
adicionar-se novos módulos de construção de instruções. A componente gramatical é usada como suporte
à construção de frases sintacticamente correctas.
A Interface Utilizador foi dividida em dois módulos distintos: entrada e saída. O módulo de entrada surgiu
da necessidade de criar diferentes mecanismos de interacção, tendo em conta a variedade de dispositivos
móveis actuais. Este módulo é responsável por tratar todos os eventos de entrada. É possível, também,
adicionar novos mecanismos de interacção, para além dos existentes (teclado e ecrã táctil), de forma a
proporcionar ao utilizador uma interface mais adequada. O módulo de saída é composto pelo retorno háptico
(vibratório), som (earcons) e fala (instruções). Obviamente, toda a interface está directamente relacionada
com o estado actual da aplicação.
Nas próximas secções, serão explicados com mais detalhe cada um dos módulos presentes na arquitectura,
com especial foco nos módulos de orientação e interface utilizador.
4.2. Material de TrabalhoPara o desenvolvimento do nosso trabalho, era necessário um dispositivo móvel comum com uma API
(Application Programming Interface) acessível. Por dispositivo móvel comum entenda-se, com um ecrã e
teclado (ou ecrã táctil). Era também necessário que o dispositivo tivesse disponível alguma das tecnologias
de localização analisadas no Capítulo 2. Olhando para o panorama actual, o Bluetooth e WLAN são as mais
comuns. Desta forma, temos a garantia que o nosso protótipo está alinhado com as características da maior
56
parte dos dispositivos móveis actuais e, consequentemente, com as necessidades dos utilizadores.
O protótipo foi desenvolvido em C# para a plataforma Windows Mobile 5.0. Os dispositivos usados nesta
fase (Figura 4.2) foram o HTC S310 e o HTC TyTn.
(a) HTC S310 (b) HTC TyTn
Figura 4.2: Dispositivos móveis usados.
Foi também usado o sistema de síntese de fala da Loquendo, em português (voz masculina, Eusébio).
4.3. Construção de InstruçõesDar ao utilizador um retorno compreensível e adequado às suas capacidades, através da construção automática
de instruções, foi um dos principais objectivos desta dissertação. A arquitectura do nosso sistema reflecte
esta opção, tendo sido criado um módulo de orientação, que é responsável por construir todo o discurso,
tendo em conta a posição actual do utilizador. O módulo de lógica de domínio fornece todas as informações
necessárias para a construção das instruções. Grande parte desta informação advém do mapa, como iremos
ver em seguida.
4.3.1. MapasComo qualquer sistema de orientação, este tem de ter acesso a um mapa, que representa um espaço e
todos os elementos nele contidos (Figura 4.3).
Um mapa é constituído por divisões, que normalmente correspondem a uma sala e têm uma descrição.
Esta descrição é dada ao utilizador quando este pede uma contextualização. Apesar da construção não ser
automática, de acordo com os estudos preliminares (ver Secção 3.1.4), esta contextualização deve conter
informações sobre a estrutura do cenário e pontos de interesse.
A secção de objectos corresponde à criação e posicionamento dos elementos no mapa. Os objectos
existentes no nosso protótipo são: escadas, porta, elevador, obstáculo e path. O objecto path é um elemento
genérico, que é utilizado apenas para ligar outros objectos e formar um percurso. Os restantes elementos
têm os atributos nome, isReferencePoint e isInterestPoint, que indicam o nome, se é um ponto de referência
57
(a) Excerto do ficheiro de configuração. (b) Possível representação gráfica.
Figura 4.3: Exemplificação de um mapa.
e se é um ponto de interesse, respectivamente. Cada um dos objectos pode ainda ter atributos próprios,
como é o caso do atributo up, que indica o sentido das escadas (subir ou descer). É de notar que o conjunto
de objectos pode ser facilmente estendido, de acordo com o cenário.
A secção de conexões corresponde à formação dos percursos existentes no mapa. Na realidade, um mapa
não é mais do que um grafo, com um conjunto de nós (objectos) e ligações. Cada ligação tem ainda um peso,
que indica o custo de navegar entre dois nós. Esta característica permite-nos escolher o melhor caminho,
recorrendo ao algoritmo de Dijkstra, de um dado nó de origem até um nó de destino. Neste caso, o custo
de cada ligação é fornecido, mas poderia ser calculado com base numa heurística. Por último, cada ligação
tem um atributo, que indica a existência de uma parede. Esta informação pode ser importante aquando da
construção de uma instrução, visto ser uma referência muito usada por utilizadores invisuais.
4.3.2. AlgoritmoComo foi dito anteriormente, o módulo de orientação é responsável pela criação das instruções, que são
dadas ao utilizador. Após o sistema inferir a sua posição, através do módulo de localização, são construídas
as instruções, tendo em conta o destino pretendido. Os elementos destas instruções e a sua estrutura foram
anteriormente identificados na Secção 3.2.3. O nosso algoritmo consiste, apenas, na implementação de um
conjunto de regras.
Cada um dos objectos que constituem o mapa tem um atributo, que nos indica se o módulo de localização
consegue inferir a sua posição. Logo, tendo em conta a posição actual do utilizador, o algoritmo procura
o próximo ponto no percurso que seja "localizável"e constrói o respectivo conjunto de instruções. Este
funcionamento é repetido até ao final do percurso. Logo, o ponto inicial e final do percurso têm, obrigatoriamente,
58
de ser localizáveis.
Aquando da construção das instruções entre dois pontos, estas são subdivididas, dependendo dos pontos
de referência existentes e das mudanças de direcção que o utilizador terá de fazer. Assim, poderemos obter
instruções como: "Siga em frente até à porta do elevador. Vire à esquerda e siga em frente até à casa de
banho" - neste caso, o elevador é um ponto de referência; "Siga em frente e vire à esquerda depois de passar
uma porta." - não existe um ponto de referência pré-definido, no entanto, é criada uma referência, tendo em
conta a mudança de direcção que o utilizador terá de realizar;
Uma mudança de direcção é detectada quando o ângulo entre a direcção actual (vector entre a posição
anterior e a posição actual) e a próxima direcção é maior que 45o. Caso o próximo ponto de destino não
seja um ponto de referência, então terá de ser criada uma referência, à semelhança do que acontece no
exemplo anterior. A criação de uma referência é feita de acordo com os objectos pelos quais o utilizador terá
de passar e que podem ser facilmente identificados, como é o caso das portas ou escadas. Uma instrução
pode ainda fazer referência ao lado pelo qual o utilizador deve seguir. Este comportamento pode ser útil,
exactamente para quando se pretende criar uma referência. Caso seja impossível criá-la, então a instrução
terá de ser dada tendo em conta a distância (e.g. "Siga em frente cinco passos e vire à esquerda...").
Nos casos em que o utilizador se desvia do percurso ou pede ajuda ao sistema porque se perdeu, então
ser-lhe-á pedido que volte até ao último ponto de referência, de modo a poder retomar a sua rota. De acordo
com o estudo realizado junto dos utilizadores (ver Secção 3.1.3), este é o comportamento normalmente
adoptado e mais simples de realizar. Caso o utilizador indique explicitamente que não consegue voltar atrás,
então terá de ser traçada uma nova rota, tendo em conta a sua posição actual e o destino pretendido.
De modo a construir frases sintacticamente correctas, existe ainda uma gramática, que é responsável por
identificar o género e número dos objectos. É também possível obter o artigo definido correcto (i.e., ’o’, ’a’,
’os’, ’as’) e as suas formas combinadas (e.g., ’aos’, ’à’, ’do’, ’pelo’) dado um objecto e uma preposição (i.e.,
’a’, ’de’, ’em’, ’por’). Assim, temos uma ferramenta de suporte, que nos permite evitar frases como, "Siga em
frente até ao porta."
4.4. Módulo de LocalizaçãoUm guia móvel ou sistema de orientação tem de conseguir localizar o utilizador, para o guiar correctamente.
Este módulo de localização tem como única responsabilidade, fornecer a posição actual do utilizador, para
que seja usada pelos outros componentes da arquitectura.
Podemos resumir a utilidade de um módulo de localização a duas funcionalidades básicas. Em primeiro lugar,
automatizar o retorno, ou seja, fornecer instruções ao utilizador, à medida que este se desloca. Por outro lado,
59
caso o utilizador se perca, conseguir reencaminhá-lo. Na verdade, a automatização das instruções podia ser
substituída por uma funcionalidade de navegar nas instruções que iriam ser dadas ao utilizador. Assim, à
medida que o utilizador completasse uma instrução, poderia pedir a próxima e assim sucessivamente, até ao
seu destino. A principal utilidade advém da necessidade de reencaminhar o utilizador, caso este se perca.
Sem um sistema de localização, não existe forma de inferir a sua posição.
Apesar deste ter sido o módulo de menor foco no nosso trabalho, não deixa de ser importante. Para
minimizar a dependência do sistema à tecnologia de localização, foi desenvolvida uma arquitectura, à qual
podemos adicionar novos componentes, que têm a responsabilidade de obter uma posição no mapa. No
caso do Bluetooth, existe uma correspondência entre o beacon e o identificador do objecto no mapa. Assim,
quando o utilizador se aproxima do beacon, o módulo de localização actualiza a posição actual do utilizador.
Foi também adicionada uma componente de localização que recorre à tecnologia WLAN. O algoritmo foi
desenvolvido por Pedro Sousa e Vera Saraiva [50] e faz uso da força do sinal rádio, emitido pelos pontos de
acesso no local.
Este módulo permite ainda a conjugação dos resultados das várias tecnologias de localização. Ou seja, se
as tecnologias Bluetooth e WLAN poderem ser usadas, o sistema irá automaticamente fazer uso delas. Caso
o resultado do módulo WLAN seja diferente do que foi dado pelo módulo Bluetooth, então o resultado terá
de ser desambiguado. Caso a diferença entre a posição dada pelo módulo WLAN e Bluetooth seja inferior
ao alcance dos beacons Bluetooth, então essa será a posição escolhida. Caso contrário, será escolhida a
posição do módulo Bluetooth (Figura 4.4). Apesar de ambos os módulos funcionarem independentemente,
o Bluetooth actua como uma espécie de corrector e complemento ao sistema WLAN.
(a) WLAN tem maior precisão do que o
beacon Bluetooth.
(b) Beacon Bluetooth actua como um
corrector do sistema WLAN.
Figura 4.4: Representação do sistema localização, WLAN e Bluetooth.
4.5. Interface UtilizadorGeralmente associamos as interfaces utilizador a elementos gráficos e, no caso particular dos dispositivos
móveis, a elementos de reduzidas dimensões. Tal como foi visto no Capítulo 3.2.2, este tipo de dispositivos
60
são adequados para guias móveis, no entanto carecem de interfaces que suportem uma interacção apropriada
por parte dos utilizadores invisuais.
De modo a combater as interfaces visualmente exigentes, são necessários novos mecanismos de interacção,
que façam uso dos canais de comunicação disponíveis. No caso dos utilizadores invisuais, temos como
alternativa à visão, a audição e o tacto. O nosso objectivo foi construir uma interface que pudesse estar
disponível nos dispositivos móveis actuais e de acordo com as necessidades e capacidades destes utilizadores.
Para este fim, recorremos à multimodalidade.
Em relação às interfaces de entrada, apesar de existirem já algumas abordagens para dispositivos móveis
com teclados, a sua constante evolução, aliada à elevada aceitação dos ecrãs tácteis, levou a que estes se
tornassem disponíveis a preços cada vez mais reduzidos e com maior qualidade, abrindo portas a novas
formas de interacção. Mas, mais uma vez, os utilizadores invisuais estão privados de interagir com este tipo
de dispositivos, tornando-se necessária a construção de uma interface apropriada. Esta é uma das principais
contribuições desta dissertação.
4.5.1. Módulo de EntradaOlhando para o panorama actual das interfaces de entrada para dispositivos móveis, conseguimos identificar
dois grupos: teclados e ecrãs tácteis. Devido à crescente adopção deste último, decidimos criar um módulo
de entrada, em que podem ser adicionados novos mecanismos de interacção. No nosso protótipo, existem
dois mecanismos de interacção: teclado e ecrã táctil.
Em seguida, iremos ver, com maior detalhe, duas tarefas presentes na maior parte das aplicações para
dispositivos móveis: navegação em menus e introdução de texto.
Navegação em Menus
O modelo subjacente à navegação em menus é bastante semelhante para ambos os mecanismos de interacção
(i.e. teclado e ecrã táctil) e encontra-se representado na Figura 4.5.
Figura 4.5: Modelo de navegação em menus.
61
No caso do teclado, a navegação é conseguida através das teclas ’2’, ’8’, ’4’ e ’6’, para navegar para cima,
baixo, trás e seleccionar opção, respectivamente. O utilizador consegue facilmente localizar estas teclas,
construindo um cursor em redor da tecla ’5’.
No caso do ecrã táctil, não existe qualquer retorno háptico, ao contrário dos teclados, logo é necessária
uma abordagem um pouco diferente. O nosso mecanismo baseia-se na utilização de gestos sobre o ecrã,
permitindo ao utilizador interagir com o dispositivo, sem a necessidade de retorno visual ou háptico, ou seja,
com uma baixa carga cognitiva. No entanto, os gestos têm de ser escolhidos com algum cuidado. Estes
devem ser simples, fáceis de memorizar e executar, de modo a permitir ao utilizador uma interacção natural.
Para a navegação em menus foram escolhidos os gestos ’cima’, ’baixo’, ’esquerda’ e ’direita’, para navegar
para cima, baixo, trás e seleccionar opção, respectivamente (Figura 4.6).
(a) Seleccionar opção (b) Menu anterior (c) Opção
anterior
(d) Opção
seguinte
Figura 4.6: Gestos para navegação em menus.
Introdução de TextoO método de introdução de texto em ecrãs tácteis surge da evolução do trabalho NavTap [29]. Este método
permite aos utilizadores navegar no alfabeto, usando o teclado dos telemóveis. O alfabeto é dividido em
cinco linhas, em que o inicio de cada linha corresponde a uma vogal, porque estas são de fácil memorização.
O método de navegação é semelhante à navegação em menus. As teclas ’4’ e ’6’ permitem ao utilizador
navegar na horizontal, enquanto as teclas ’2’ e ’8’ permitem saltar entre vogais, usando-as como atalhos no
alfabeto. Ambas as formas de navegação (horizontal e vertical) são cíclicas (Figura 4.7). A tecla ’5’ insere
um espaço ou outro caracter especial e a tecla ’7’ apaga o último caracter inserido. Este método reduz a
necessidade de memorização, existente no método tradicional e, consequentemente, exige uma menor carga
cognitiva. No pior cenário, o utilizador tem apenas de navegar para a frente, até ouvir a letra desejada. Com
este mecanismo não existem caminhos errados, apenas caminhos mais curtos.
Mais uma vez, a interacção com ecrãs tácteis baseia-se na utilização de gestos. Este método (NavTouch) usa
o mesmo modelo de matriz do NavTap e os gestos vistos na Figura 4.6. Em vez de usar o teclado, o utilizador
pode executar gestos sobre o ecrã, em quatro direcções diferentes. As direcções direita e esquerda permitem
ao utilizador navegar na horizontal, enquanto as direcções cima e baixo permitem saltar entre vogais. Depois
de executar um gesto, se o utilizador continuar a pressionar o ecrã, a navegação continuará automaticamente
na última direcção.
62
Figura 4.7: Duas abordagens de navegação, até à letra ’t’.
Tendo em conta que os cantos do ecrã são os únicos pontos de referência no dispositivo, para simplificar e
minimizar o número de gestos, ambos os cantos inferiores são usados para mapear elementos da interface,
que se distinguem de todos os outros. É o caso das acções apagar o último caracter e inserir um espaço,
que correspondem aos cantos inferior direito e esquerdo, respectivamente.
No nosso protótipo, a introdução de texto permite ao utilizador efectuar procuras por palavra-chave. Assim,
caso existam demasiados pontos de interesse ou possíveis destinos, o utilizador poderá efectuar uma pesquisa
e tem a possibilidade de adicionar os resultados à sua rota. No entanto, este método de introdução de texto
apresenta ainda algumas limitações, tais como, introdução de caracteres acentuados e numéricos.
4.5.2. Módulo de SaídaNo módulo de saída, existem três modalidades: fala, som (não fala) e vibração. A modalidade de fala é usada
para descrever o estado actual do sistema, através de um sistema de Text-To-Speech (TTS). Na navegação
em menus, é utilizada para descrever o menu em questão, assim como as opções pelas quais o utilizador
vai navegando. Na tarefa de introdução de texto, à semelhança do que acontece na navegação em menus,
é usada para ler a letra seleccionada e as palavras que foram escritas. Em relação ao sistema de orientação
a fala é usada para dar ao utilizador a instrução que este deve executar.
O uso do som (earcons) pode ser visto como um complemento à fala. A utilização de earcons torna-se
apropriada quando queremos dar apenas uma mensagem de confirmação ou erro, através de um retorno
rápido, simples e com uma baixa carga cognitiva. É o caso das acções: seleccionar uma opção, voltar atrás,
erro ou sair da aplicação. Cada uma destas acções tem um som associado, que transmite ao utilizador
informação sobre o estado actual do sistema.
Para fazer uso de todas as capacidades dos dispositivos móveis actuais, decidimos também usar o retorno
vibratório. A vibração é geralmente usada para alertar o utilizador em ambientes ruidosos, como é o caso
de muitos ambientes interiores. No nosso protótipo, o retorno vibratório foi usado para indicar a presença
de uma nova instrução. Esta pode ser uma abordagem alternativa ao uso constante de auriculares, que
63
pode prejudicar o desempenho e aceitação do sistema por parte do utilizador. Para além disso, a vibração
é menos intrusiva que a fala ou som, permitindo ao utilizador executar outras tarefas (e.g. comunicar com
outras pessoas) e só depois ouvir a instrução.
64
5Resultados e
Discussão
O estado da arte e os estudos com utilizadores permitiram-nos identificar alguns dos principais problemas
dos sistemas de orientação para invisuais. Para fazer face aos mesmos, definimos um conjunto de guias de
desenho e uma abordagem que tira partido das capacidades e técnicas dos utilizadores. Além do retorno
familiar e compreensível, o nosso guia móvel permite a interacção com dispositivos móveis tradicionais (sem
o uso de acessórios), em particular com ecrãs tácteis.
Para conseguir validar a nossa abordagem e contribuições, foi construído um protótipo funcional (Capítulo
4), ao qual se impõe uma avaliação, em situações reais, com utilizadores invisuais. De modo a alcançar este
fim, o sistema foi avaliado segundo um conjunto de tarefas. Apesar do principal objectivo deste processo ser
a avaliação das instruções, efectuámos também uma avaliação à navegação em menus e introdução de texto.
Apesar do protótipo ter sido construído para uma variedade de dispositivos (teclado e ecrã táctil), toda a
avaliação foi realizada num dispositivo com ecrã táctil. Ao contrário dos teclados, usados anteriormente em
muitos trabalhos, a interacção com ecrãs tácteis tem uma componente bastante inovadora. Logo, optámos
por avaliar todo o protótipo recorrendo apenas a este tipo de dispositivos. Toda a avaliação foi efectuada na
Fundação Raquel e Martin Sain, uma instituição de formação para invisuais.
5.1. Avaliação da Introdução de TextoUma das tarefas mais difíceis de realizar por um invisual, num dispositivo móvel, é a introdução de texto. De
facto, esta é uma tarefa transversal a muitas aplicações, logo, necessária. No entanto, no caso particular dos
dispositivos com ecrãs tácteis, com as interfaces actuais, impossível de realizar. Esta avaliação irá permitir
comparar, avaliar e validar este novo método de interacção, com alguns já existentes para teclados. O anexo
A3 apresenta em detalhe o guião da avaliação.
65
5.1.1. Os UtilizadoresNesta avaliação, participaram cinco utilizadores (Figura 5.1), invisuais, com idades compreendidas entre os
trinta e seis e os cinquenta e cinco anos. Quatro dos utilizadores eram do sexo masculino, com um grau
de escolaridade inferior ao nono ano. No entanto, todos os utilizadores eram alfabetizados. É de notar que
nenhum dos participantes tinha uma experiência anterior com ecrãs tácteis.
(a) NavTouch. (b) NavTouch em detalhe.
Figura 5.1: Utilizador durante uma sessão de avaliação.
5.1.2. ProcedimentoTendo em vista o objectivo de tornar a avaliação mais rica e interessante, este método de interacção (NavTouch)
foi comparado com outros. Para comparar todas as abordagens e garantir a consistência dos resultados,
todos os procedimentos, assim como as tarefas a realizar, foram iguais. Os restantes métodos de introdução
de texto são o Multitap e NavTap (Secção 4.5.1).
O Multitap corresponde ao método tradicional de introdução de texto em dispositivos móveis. O utilizador
carrega repetidamente numa tecla para percorrer as letras a ela associadas, aceitando a selecção através
de um tempo de espera ou pressionando qualquer outra tecla.
A avaliação foi composta por três sessões, nas quais foi pedido a cada utilizador para introduzir três frases
(todas diferentes). A primeira sessão incluiu ainda um período de treino de vinte minutos. Os testes ao
sistema foram realizados num dispositivo móvel HTC TyTn com Windows Mobile 5.0 e o sistema de síntese
de fala da Loquendo (voz masculina, Eusébio).
5.1.3. ResultadosO primeiro resultado relevante desta avaliação está relacionado com o tempo de treino necessário para os
utilizadores se sentirem prontos para o teste. Apesar de estar definido um período de treino de vinte minutos,
todos os participantes se mostraram preparados pouco tempo depois de serem instruídos (aproximadamente
66
cinco minutos), enquanto o método tradicional (Multitap) revelou ser mais difícil de aprender.
Nesta avaliação, todos os utilizadores conseguiram levar a cabo as tarefas propostas, incluindo no método
Multitap. No entanto, este aspecto pode ser discutível, como iremos ver pelos resultados obtidos, em
particular pela qualidade final das frases transcritas.
A dificuldade em utilizar o método tradicional (mesmo com leitor de ecrã) está patente na Figura 5.2(a),
onde é apresentada a taxa de erros, relativa a cada método, por sessão. Esta taxa é calculada dividindo o
número de erros efectuados (apagar uma letra) pelo número de caracteres da frase a ser escrita. Com o
método Multitap a taxa de erros aumentou ao longo das sessões (47%, 60%, 71%), enquanto diminuiu com
o NavTap (17%, 6%, 4%) e NavTouch (27%, 17%, 14%).
A taxa de erro da distância mínima entre a frase objectivo e a frase transcrita pelos utilizadores (Minimum
String Distance Error Rate) mede a diferença entre estas duas frases. Durante as três sessões, o método
Multitap situa-se sempre acima dos restantes (Figura 5.2(b)), enquanto o NavTap termina com uma taxa de
10% e o NavTouch abaixo dos 5%. É importante realçar que, apesar dos utilizadores apagarem mais letras
com o NavTouch, o resultado final é melhor que o NavTap. Por outro lado, o número de erros e o resultado
final é sempre pior com o Multitap, mostrando que o utilizador tem muitas dificuldades em associar as letras
a cada tecla e perde a noção da frase que já foi transcrita.
(a) Taxa de erros por sessão. (b) Minimum String Distance Error Rate.
Figura 5.2: Comparação de métodos de introdução de texto.
Em relação ao toques (ou gestos) necessários para cada caracter (TPC), o Multitap apresenta uma grande
vantagem teórica e, apesar dos resultados (Figura 5.3(a)) coincidirem com os esperados na primeira sessão
(Multitap - 4.96 TPC; NavTap - 8.07 TPC; NavTouch - 6.02 GPC), este é ultrapassado pelas restantes
abordagens, à medida que os utilizadores começam a adoptar (aprender) caminhos mais curtos (Multitap
- 5.68 TPC; NavTap - 5.47 TPC; NavTouch - 4.68 GPC). O elevado desempenho do Multitap, na primeira
sessão, pode também ser justificado pelo período de treino (utilizadores esqueceram-se do mapeamento
letra/tecla).
Em relação ao desempenho, as abordagens por navegação revelam um aumento do número de palavras
67
por minuto, ao longo das sessões (Figura 5.3(b)), enquanto a abordagem tradicional se mostra inconstante
(0.8; 0.88; 0.68) e o resultado, após três sessões é inferior ao obtido após a sessão de treino inicial.
A diferença entre o NavTap e o NavTouch pode ser explicada pela carga associada a encontrar a tecla
direccional pretendida. No método NavTouch, os utilizadores conseguiram navegar mais facilmente nas
quatro direcções, visto que os gestos podem ser executados livremente no ecrã, sem nenhuma carga
adicional.
(a) Toques (ou gestos) por caracter. (b) Palavras por minuto.
Figura 5.3: Comparação de métodos de introdução de texto.
5.2. Avaliação da Navegação em MenusA navegação em menus é uma das formas mais comuns de interacção com dispositivos móveis e essencial
para o uso da maior parte das suas funcionalidades. Tendo sido avaliada a introdução de texto, uma tarefa
também transversal a muitas aplicações, a validação da nossa abordagem para a navegação em menus
impõe-se, de forma a fornecer ao utilizador todos os meios para uma interacção completa. Assim, usando
apenas dispositivos móveis com ecrãs tácteis, teremos um sistema completo e que abrange as tarefas mais
comuns neste tipo de dispositivos.
5.2.1. Os UtilizadoresEsta avaliação foi realizada a seis utilizadores, três do sexo masculino e três do sexo feminino, com idades
compreendidas entre os vinte e seis e os cinquenta e cinco anos. Dois dos participantes possuíam ainda
algum resíduo visual, no entanto, insuficiente para conseguirem identificar objectos ao seu redor. Nenhum
dos utilizadores tinha qualquer experiência com ecrãs tácteis. É de notar também que os utilizadores não
tiveram qualquer treino prévio com o tipo de instruções que lhes iriam ser dadas nem com o local em causa.
5.2.2. ProcedimentoA avaliação da navegação em menus correspondeu à primeira parte da avaliação das instruções do sistema
(Anexo A4), em que o utilizador tinha de seleccionar o mapa e destino, para dar inicio à tarefa de orientação.
68
Antes de iniciar a tarefa, os utilizadores tiveram um período de cinco minutos de treino e familiarização com
o dispositivo móvel, onde lhes foi explicado o mecanismo de navegação e selecção de menus. Os testes
foram realizados num dispositivo móvel HTC TyTn com Windows Mobile 5.0 e o sistema de síntese de fala
da Loquendo (voz masculina, Eusébio).
5.2.3. ResultadosApesar de todos os utilizadores se mostrarem cépticos em relação à utilização de um dispositivo com ecrã
táctil, após o período de treino, revelaram-se bastante motivados e prontos para iniciar o teste. Alguns
dos utilizadores referiram ainda que a interacção era mais simples do que aquela realizada com os seus
telemóveis.
Nesta avaliação, todos os utilizadores conseguiram terminar a tarefa, sem cometer qualquer erro. Apesar de
ser algo positivo, temos de ter também em conta o número reduzido de selecções que foram efectuadas. No
entanto, é um indicador da simplicidade e facilidade do método.
Os tempos de cada uma das selecções estão ilustrados na Figura 5.4. Apesar da navegação nos menus
ser cíclica, todos os utilizadores optaram pela abordagem mais natural de navegação, usando apenas as
direcções ’baixo’ e ’esquerda’ (para seleccionar). Os tempos desta avaliação são bastante satisfatórios,
apesar do tempo necessário para captar o retorno auditivo de cada uma das opções estar reflectido nos
resultados. Ainda assim e devido ao breve período de treino, alguns dos utilizadores não necessitaram de
ouvir todo o retorno auditivo para iniciarem a navegação e selecção.
Figura 5.4: Tempos na navegação em menus, em segundos.
Durante a tarefa de orientação, apenas um dos utilizadores interagiu com a aplicação, para ouvir a repetição
da instrução. O tempo associado a este comando é significativamente inferior às restantes, porque, nesta
situação a aplicação não faz nenhuma pergunta ao utilizador (e.g. "Seleccione um mapa."). Este apenas tem
de navegar até à opção pretendida e seleccioná-la.
69
5.3. Avaliação das InstruçõesO principal objectivo do nosso trabalho é guiar utilizadores invisuais, num ambiente interior e desconhecido,
até um destino, recorrendo a dispositivos móveis tradicionais. A nossa abordagem consiste num retorno
auditivo (fala) familiar e compreensível, que permita aos utilizadores deslocarem-se pelo local, fazendo uso
dos seus utensílios e técnicas de M&O (Mobilidade e Orientação).
Na Secção 3.3, foi descrita uma avaliação preliminar, recorrendo a um teste de Feiticeiro de Oz, que nos
permitiu validar a nossa abordagem. No entanto, toda a aplicação e interacção pessoa-máquina foram
simuladas por um humano. Logo, para finalizar a avaliação da nossa abordagem, o nosso protótipo terá
de ser testado num cenário real com os utilizadores alvo. Irá ser posta à prova a qualidade das instruções
geradas, mas também de todos os outros componentes do protótipo (i.e. interface e sistema de localização).
5.3.1. ProcedimentoO local e percurso escolhidos foram os mesmos da avaliação preliminar (ver Secção 3.3), de modo a
podermos comparar alguns resultados. No entanto, foi usado apenas um piso, devido às limitações impostas
pelo sistema de localização. A tecnologia escolhida foi o Bluetooth, pela facilidade de instalação e maior
precisão, quando comparada com a WLAN. Foram colocados alguns telemóveis, em pontos estratégicos do
percurso, com o objectivo de localizar o utilizador. No entanto, como os dispositivos possuíam um alcance
máximo de dez metros (Bluetooth, classe dois), existia uma sobreposição de sinal. Para solucionar este
problema, todos os telemóveis foram envolvidos em papel de alumínio (Figura 5.5), de forma a reduzir a
força do sinal e permitir que o sistema identifique apenas um dispositivo em simultâneo. A utilização de
Bluetooth tem ainda a desvantagem de ser bastante lento no processo de descoberta de outros dispositivos.
Como foi dito anteriormente, usámos apenas um piso, devido ao número limitado de beacons Bluetooth
disponíveis.
Figura 5.5: Telemóvel envolvido em alumínio.
No inicio do teste, os utilizadores tiveram uma pequena sessão de acolhimento, onde lhes foram explicados
70
todos os procedimentos, objectivos do teste e lido o formulário de consentimento. Os utilizadores foram
também informados das limitações do sistema de localização, ou seja, foi-lhes pedido para que, ao completar
cada instrução, aguardassem até receberem a próxima.
Tal como na avaliação preliminar, a tarefa foi completar um percurso pré determinado e desconhecido de
todos os utilizadores (Figura 5.6). A tarefa terminava apenas quando o utilizador identificasse o destino.
Neste caso, seria a porta de acesso às escadas. Nenhum dos utilizadores teve qualquer treino prévio
com a aplicação, ou seja, não tinham conhecimento da forma como seriam dadas as instruções. Todos
os utilizadores tiveram, durante a tarefa, o primeiro contacto com este tipo de instruções.
Figura 5.6: Percurso da avaliação final.
Caso os utilizadores não se enganassem no caminho, as instruções que ouviam eram as seguintes: "Siga
em frente, junto ao lado direito, até à máquina." e "Vire à esquerda e siga em frente, junto ao lado direito, até
à porta de saída."
Por fim, foi realizado um questionário, que teve como objectivo obter o grau de satisfação e aceitação dos
utilizadores. O Anexo A4 descreve detalhadamente o guião desta avaliação.
5.3.2. ResultadosDos seis participantes, apenas um necessitou de ajuda externa para conseguir completar o percurso. Neste
caso particular, o utilizador mostrou bastantes dificuldades em diferenciar as direcções, direita e esquerda,
daí a necessidade de ajuda.
71
Todos os restantes participantes conseguiram terminar o percurso sem dificuldades de maior. A Figura 5.7
representa os tempos necessários, por utilizador, para completar a tarefa e a sua relação com o tempo de
espera, associado ao sistema de localização. O tempo de espera representa o processo de identificação
de outros dispositivos Bluetooth. Neste teste, representa em média (aproximadamente) 20% do tempo da
tarefa. Apesar das limitações, os utilizadores conseguiram interpretar as instruções e identificar os pontos
de referência, para esperarem pelas próximas instruções.
Figura 5.7: Tempos da tarefa, em segundos. Relação entre o tempo de deslocação e o tempo de espera pelas
instruções.
Na realidade, o sistema de localização foi usado apenas para conseguirmos validar a nossa abordagem
e era necessário, apenas para automatizar o retorno ao utilizador. De acordo com os estudos realizados
anteriormente, os utilizadores guiam-se através de um conjunto de pontos de referência, logo, as instruções
poderiam ser pedidas à medida que o utilizador atinge o final de cada instrução. O sistema de localização
seria realmente necessário, caso o utilizador se perdesse. Esta situação não sucedeu, nesta avaliação.
Em comparação com a avaliação preliminar, existiram menos erros e, consequentemente, menos ajudas,
por duas razões. Em primeiro lugar, as instruções mais problemáticas, em particular o seu vocabulário,
foram alteradas, de acordo com a opinião dos utilizadores. Em segundo lugar, estes foram informados das
limitações do sistema de localização e, portanto, tiveram de esperar pela instrução, após completarem a
anterior. No caso da avaliação preliminar, os utilizadores tiveram um comportamento de seguir sempre em
frente, até se perderem e, muitas vezes quando a instrução era dada, já não correspondia à realidade. Desta
vez, os utilizadores esperaram até lhes serem dadas as instruções, levando a menos erros e ajudas.
A Figura 5.8 representa o tempo, em média, que os utilizadores estiveram num dado local do percurso.
Como seria de esperar, passaram mais tempo nos locais em que necessitavam de receber novas instruções.
Analisando o mapa, podemos ver que todos os utilizadores tiveram percursos bastante semelhantes e o
desvio foi mínimo. Este resultado sugere que as instruções foram acessíveis e facilmente compreendidas.
72
No entanto, junto ao destino, os utilizadores tinham de realizar uma ligeira curva para a esquerda, que não
estava indicada na instrução, o que os levou a explorar com mais atenção o local. Outra possível razão, foi o
facto de essa zona não ter parede e transmitir uma falsa sensação de entrada, induzindo alguns utilizadores
em "erro". No entanto, todos conseguiram identificar a porta de saída sem problemas de maior.
Figura 5.8: Mapa termal dos percursos efectuados.
No final de cada sessão, efectuámos um pequeno questionário, de forma a obter o grau de satisfação e
opiniões dos utilizadores. Este questionário era composto por seis perguntas, que podiam ser classificadas
numa escala de cinco pontos [49]. Os resultados estão disponíveis na Figura 5.9
Figura 5.9: Resultados do pós-questionário. Classificação média, por pergunta.
73
5.4. DiscussãoDepois de descritos os resultados alcançados nas três principais tarefas do sistema, estamos em condições
de analisar e discutir a sua usabilidade. Nesta secção, iremos dividir os resultados em quatro factores
[11, 49]: utilidade, eficácia, aprendizagem e satisfação.
UtilidadeA utilidade está relacionada com a capacidade do sistema permitir ao utilizador atingir os seus objectivos.
Este é o factor mais importante, porque se o utilizador não conseguir atingir os seus objectivos, então o
sistema é inútil e a análise dos restantes factores desnecessária.
Pelos resultados obtidos, a nossa abordagem é útil. Na tarefa de orientação, os utilizadores foram capazes
de compreender e executar as instruções, sem a necessidade de qualquer treino prévio. A interacção com
o dispositivo móvel (tradicional), em particular com o ecrã táctil, mostrou ser bastante simples e acessível.
Ao abordar as principais tarefas: navegação em menus e introdução de texto, conseguimos validar a nossa
abordagem e tornar acessível grande parte dos cenários de interacção com este tipo de dispositivos.
EficáciaApós termos visto que os utilizadores conseguiram atingir os seus objectivos, podemos analisar a eficácia
com que o fizeram. Eficácia ou facilidade de uso quantifica a forma e os meios necessários para completar
uma tarefa. Em primeira análise, com excepção de um, todos os utilizadores conseguiram terminar a tarefa
de orientação. Todos os utilizadores seguiram um percurso semelhante, sem desvios, indicando um alto grau
de eficácia.
Na tarefa de navegação em menus, todos compreenderam e conseguiram completar a tarefa proposta, com
um treino prévio de apenas cinco minutos. Nenhum dos utilizadores cometeu qualquer erro, o que indica
uma abordagem de interacção bastante simples e fácil de executar.
Em relação à introdução de texto, o NavTouch apresenta um aumento do número de palavras por minuto,
em 150% e 300% em relação aos restantes métodos, NavTap e Multitap, respectivamente. O número de
gestos por caracter (4.68) é, em média, inferior ao NavTap e Multitap em 0.8 e 1 toques por caracter,
respectivamente. O número de erros apresenta-se três vezes superior ao NavTap, embora a qualidade
final das frases seja melhor.
AprendizagemA aprendizagem está relacionada com a evolução do desempenho, após um período pré determinado de
treino. É sobre a tarefa de introdução de texto que poderemos retirar as maiores conclusões, visto ter sido
74
realizada em mais de uma sessão. De acordo com os resultados, ao fim de três sessões, os utilizadores
mostraram uma melhoria de desempenho, diminuindo o número de erros e gestos por caracter e aumentando
o número de palavras por minuto. Em relação aos erros, estes foram reduzidos para aproximadamente
metade. O número de gestos por caracter foi reduzido em mais de 20% e o número de palavras por minuto
passou de 1,60 para 2,08. Todos os resultados indicam que a nossa abordagem promove a aprendizagem e
a melhoria de desempenho.
Tanto a tarefa de orientação como a de navegação de menus foram executadas apenas uma vez por cada
utilizador. No caso da navegação em menus, os resultados sugerem uma rápida aprendizagem e facilidade
de execução, visto que os utilizadores tiveram um treino prévio de apenas cinco minutos. Na tarefa de
orientação, nenhum dos utilizadores conhecia o local e não existiu qualquer treino à forma como iriam ser
dadas as instruções. No entanto, apenas um deles não conseguiu completar com sucesso a tarefa, sendo
que os restantes mostraram um percurso bastante semelhante e de acordo com o esperado.
SatisfaçãoA satisfação, do inglês likability, refere-se à opinião dos utilizadores e ao grau de aceitação do sistema.
Estes resultados foram obtidos através da realização de um questionário após os testes, onde os utilizadores
tiveram de classificar algumas características, numa escala de cinco valores. Em termos gerais, os resultados
foram bastante positivos (Figura 5.9). Todas as classificações foram, em média, superiores a quatro valores,
sendo que a avaliação global obteve uma classificação de quatro valores e meio, o que indica um alto grau
de satisfação.
75
6Conclusões
No inicio do nosso trabalho, definimos como principal objectivo, a criação de um sistema de orientação
para invisuais. De acordo com o estado da arte, apesar de existirem algumas soluções, estas carecem
de uma interface adequada para invisuais. Muito do trabalho centra-se na tecnologia de localização ou
numa abordagem que permita localizar o utilizador com maior precisão. Apesar de ser uma componente
importante, não garante, por si só, o sucesso do sistema. Tornam-se necessárias novas abordagens, que
permitam guiar o utilizador de uma forma eficaz e adequada às suas necessidades e capacidades.
6.1. Sumário da DissertaçãoPara atingir os objectivos propostos, a nossa abordagem consistiu num estudo das técnicas de mobilidade
e orientação, assim como as formas de comunicação usadas por este tipo de utilizadores. Em seguida,
identificámos um conjunto de elementos que podem constituir uma instrução (Acção, Direcção, Lado, Tempo,
Distância, Objecto), com o objectivo de formalizar a sua construção e dar aos utilizadores um retorno familiar
e compreensível.
Neste tipo de sistema, a mobilidade é essencial, por isso, a escolha de dispositivos móveis comuns foi óbvia.
No entanto, tendo em conta a população alvo, os processos de interacção tiveram de ser redesenhados.
Em particular, focámos a nossa abordagem no uso de ecrãs tácteis, devido à inexistência de soluções
apropriadas para utilizadores invisuais.
Para avaliar todas as opções tomadas, foi construído um protótipo, que permite guiar um utilizador, por um
percurso desconhecido, com base num conjunto de instruções. A criação das instruções obedece a um
conjunto de regras, retiradas dos estudos com utilizadores, garantindo assim um retorno familiar e facilmente
compreensível.
De forma a cobrir grande parte dos dispositivos móveis actuais, o uso do sistema pode ser efectuado a partir
de um teclado ou ecrã táctil, dependo do dispositivo que o utilizador possui. Não esquecendo a localização,
77
foi criado um módulo independente, que permite isolar esta componente, minimizando assim a dependência
do sistema a uma dada tecnologia.
A avaliação final mostrou que os utilizadores compreenderam as instruções dadas pelo sistema, sem a
necessidade de qualquer treino prévio. Isto, porque os utilizadores efectuaram um percurso bastante semelhante,
apesar de não conhecerem o local. Em relação à interacção com ecrãs tácteis, conseguimos validar a nossa
abordagem e disponibilizar um conjunto de cenários (i.e. navegação em menus e introdução de texto), que
cobrem a maior parte das interacções com este tipo de dispositivos.
Concluindo, nesta dissertação, apresentámos uma abordagem que permite aos utilizadores invisuais deslocar-se
em locais desconhecidos, recorrendo a um conjunto de instruções familiares. Os resultados obtidos mostram
que estas são acessíveis e facilmente compreendidas. Podemos também concluir que a utilização de
dispositivos móveis comuns é adequada, se os processos de interacção forem redesenhados e as capacidades
e necessidades dos utilizadores forem incluídas no processo de desenho.
6.2. Vantagens
Grande parte dos trabalhos na área não tem qualquer contacto com os utilizadores, durante o processo
de desenho, originando, muitas vezes, sistemas inadequados. A nossa abordagem surgiu de um estudo
centrado no utilizador, onde foram estudadas as suas capacidades e criado um sistema que vai ao encontro
das suas expectativas. Deste estudo, foi retirado um conjunto de conclusões e guias de desenho, que poderá
ser útil para trabalhos futuros na área.
A nossa abordagem dá ao utilizador um retorno familiar e de acordo com as suas capacidades, ao invés
de o forçar a adoptar novas técnicas de mobilidade e orientação. Após uma análise cuidada, foi definido
um conjunto de regras e sugestões, para a construção de instruções. Todos os utilizadores referiram que
o diálogo era adequado e facilmente entendido e mostraram-se bastante interessados na continuação do
nosso trabalho.
As interfaces tácteis começam a ser muito comuns no nosso dia-a-dia, em particular nos dispositivos móveis
mais recentes. O nosso método de interacção oferece, aos utilizadores invisuais, a possibilidade de usar
este tipo de dispositivos, de uma forma simples e eficaz, por vezes, com um desempenho superior ao uso do
teclado. Além do mais, este método pode ser estendido a várias tarefas, tais como a introdução de texto ou
navegação em menus, não só em dispositivos móveis, mas também noutro tipo de superfícies tácteis.
78
6.3. LimitaçõesApesar de termos criado uma interface que fornece aos utilizadores um conjunto de instruções familiares e
adequadas, existem algumas limitações.
Talvez a maior limitação do nosso trabalho esteja relacionada com o reduzido número de cenários e situações
em que foram realizados os estudos e a avaliação final. Apesar do cenário escolhido ter um número
significativo de obstáculos, perigos e ruído, assemelhando-se a um local público, o contexto não pode ser
igualado. Além do mais, a análise de um maior número de ambientes, situações e locais só iria contribuir
para o enriquecimento do nosso trabalho.
Outra das limitações é o sistema de localização. Apesar de termos desenvolvido uma arquitectura suficientemente
modular, para que possam ser adicionados novos mecanismos de localização, este não foi o principal foco do
trabalho. Ainda assim, conseguimos validar a nossa abordagem e obter um alto grau de satisfação junto dos
utilizadores. No entanto, o sistema de localização, em particular a sua precisão e desempenho, revelaram
ser factores bastante importantes para qualquer guia móvel.
6.4. Trabalho FuturoNo decorrer do nosso trabalho de investigação, surgiram várias ideias que podem ser vistas como futuros
projectos. Estes trabalhos têm como base a área de acessibilidade móvel, mais concretamente, sistemas de
orientação e interacção com dispositivos móveis, para utilizadores invisuais.
Mais cenáriosO nosso trabalho consistiu na construção de um sistema de orientação e no estudo de instruções para
ambientes interiores. No entanto, o número de cenários estudados foi bastante limitado. De forma a construir
um sistema robusto, torna-se necessária a utilização de uma maior diversidade de cenários. Esta expansão
poderia ser efectuada em ambientes interiores (e.g. edifícios públicos), mas também exteriores. Durante
o estudo com os utilizadores, tornar o sistema disponível em ambientes exteriores foi uma ideia sempre
presente e que poderia ser bastante útil num cenário urbano.
Guia PessoalTendo como ponto de partida o trabalho desenvolvido nesta dissertação, a forma de comunicação e em
particular, as instruções dadas aos utilizadores poderiam depender de um conjunto de características pessoais.
A criação de um guia, com um alto grau de personalização, poderia influenciar o comportamento da aplicação,
para que esta se pudesse adaptar a cada utilizador. O tipo de cegueira, a existência de outras deficiências
79
(e.g. motoras ou auditivas), o grau de escolaridade, a idade, a carga cognitiva ou interesses são apenas
alguns exemplos do tipo de personalização que se pretende. Todas estas características poderiam influenciar
a forma como a informação é apresentada ao utilizador.
FamiliarizaçãoDurante o desenvolvimento da nossa abordagem, um dos nossos objectivos era fornecer aos utilizadores um
retorno familiar. Como complemento à tarefa de navegação, seria interessante desenvolver uma solução que
permitisse ao utilizador familiarizar-se com o local em causa, mesmo antes de o visitar. Existem já algumas
soluções com vista a este objectivo, que permitem simular um espaço, mas todas necessitam de dispositivos
especializados e com elevado custo. O principal objectivo seria estudar de que forma um dispositivo comum
(e.g. computador ou telemóvel) poderia servir para este efeito.
Interacção com Ecrãs TácteisUma das contribuições do nosso trabalho é um novo método de interacção com ecrãs tácteis. Apesar da
nossa abordagem ter sido validada em dois cenários distintos - introdução de texto e navegação em menus -,
os dispositivos móveis possuem muitas outras funcionalidades. Com a crescente inclusão dos ecrãs tácteis
neste tipo de dispositivos, mais uma vez, os utilizadores invisuais ficam impossibilitados de usufruir das suas
potencialidades. Acreditamos que o nosso trabalho poderá servir de ponto de partida para a construção
de um sistema, baseado exclusivamente numa interacção com ecrãs tácteis, que permita aos utilizadores
invisuais aceder a grande parte das funcionalidades dos seus dispositivos móveis.
80
Bibliografia
[1] Infrared data association. Em http://www.crisp.nus.edu.sg/ research/tutorial/em.htm, última visita
24/07/2008.
[2] L. Aalto, N. Gothlin, J. Korhonen, and T. Ojala. Bluetooth and WAP push based location-aware mobile
advertising system. In Proceeding of the 2nd international conference on Mobile systems, applications
and services, pages 49–58, 2004.
[3] Direct Mobile Accessories. Nokia hands free kit. Em http://www.directmobileaccessories.co.uk/default.php?
cPath=137_3589, última visita 24/07/2008.
[4] G. Anastasi, R. Bandelloni, M. Conti, F. Delmastro, E. Gregory, and G. Mainetto. Experimenting na indoor
bluetooth-based positioning service. In Proceeding of the 23rd International Conference on Distributed
Computing Systems Workshops, pages 480–483, 2003.
[5] H. Auernhammer. Precision Farming - The environment challenge. In In Computers and Electronics in
Agriculture, pages 31–43, 2001.
[6] Axistive. Trekker. Em http://www.axistive.com/trekker.html, última visita 24/07/2008.
[7] P. Bahl and V. Padmanabhan. RADAR: An In-Building RF-based User Location and Tracking System. In
In Proceedings of the Nineteenth Annual Joint Conference of the IEEE Computer and Communications
Societies, pages 775–784, New York, 2000. IEEE.
[8] M.M. Blattner, D.A. Sumikawa, and R.M. Greenberg. Earcons and Icons: Their Structure and Common
Design Principles. Human-Computer Interaction, 4(1):11–44, 1989.
[9] Bluetooth.com. Wii controller. Em http://www.bluetooth.com/Bluetooth/Connect/Products/Product_Details.htm?
ProductID=2951, última visita 24/07/2008.
[10] S. Bohonos, A. Lee, A. Malik, C. Thai, and R. Manduchi. Universal Real-Time Navigational
Assistance (URNA): An Urban Bluetooth Beacon for the Blind. In Proceedings of the 1st ACM
SIGMOBILE international workshop on Systems and networking support for healthcare and assistive
living environments, pages 83–88, New York, 2007. ACM Press.
[11] P.A. Booth. An Introduction to Human-Computer Interaction. Psychology Press (UK), 1989.
[12] Sensing Centre for Remote Imaging and Processing. Electromagnetic waves. Em
http://www.crisp.nus.edu.sg/ research/tutorial/em.htm, última visita 24/07/2008.
81
[13] L.W. Ching and MKH Leung. SINVI: smart indoor navigation for the visually impaired. Control,
Automation, Robotics and Vision Conference, 2004. ICARCV 2004 8th, 2, 2004.
[14] V. Coroama. The Chatty Environment - A World Explorer for the Visually Impaired. In In Adjunct
Proceedings of Ubicomp, 2003.
[15] American Technologies Network Corporation. How night vision works. Em
http://www.atncorp.com/HowNightVisionWorks, última visita 24/07/2008.
[16] J. Coughlan and R. Manduchi. Functional Assessment of a Camera Phone-Based Wayfinding System
Operated by Blind Users. In In International IEEE Symposium on Research on Assistive Technology,
Washington DC, 2007. IEEE.
[17] W. Crandall, B. Bentzen, and L. Myers. Transit accessibility improvement through talking signs remote
infrared signage: A demonstration and evaluation. final report to us department of transportation, federal
transit administration and project action of the national easter seal society, 1995.
[18] Digisensory. Face detection. Em http://www.digisensory.com/facedetection.html, última visita
24/07/2008.
[19] EW Dijkstra. A note on two problems in connexion with graphs. Numerische Mathematik, 1(1):269–271,
1959.
[20] A.J. Dix, A. Dix, J. Finlay, and G.D. Abowd. Human-Computer Interaction. Prentice Hall, 2004.
[21] Ekahau. Ekahau positioning engine. Em http://www.ekahau.com/?id=4500, última visita 24/07/2008.
[22] Sound for Sight. The ultra cane. Em http://www.soundforesight.co.uk/product.htm, última visita
24/07/2008.
[23] United for Sight. Portugal statistics, 2001. Em http://www.uniteforsight.org/eye_stats.php, última visita
24/07/2008.
[24] J. Friedl. Mastering Regular Expressions. O’Reilly Media, Inc., 2006.
[25] Google. Wi-fi in mountain view. Em http://googleblog.blogspot.com/2005/11/wi-fi-in-mountain-view.html,
última visita 24/07/2008.
[26] D. Grantham and B. Moore. Handbook of Perception and Cognition: Hearing, pages 297–345. Academic
Press, New York, second edition, 1995.
[27] T. Green. Feds approve human rfid implants. The Register, 2004. Em
http://www.theregister.co.uk/2004/10/14/human_rfid_implants, última visita 24/07/2008.
[28] Sendero Group. Sendero gps. Em http://www.senderogroup.com/gpspromo.htm, última visita
24/07/2008.
82
[29] Tiago Guerreiro, Paulo Lagoá, Pedro Santana, Daniel Gonçalves, and Joaquim Jorge. Navtap and
brailletap: Non-visual input interfaces. In Proceedings of the Rehabilitation Engineering and Assistive
Technology Society of North America Conference, Washington DC, 2008.
[30] S. Helal, S. Moore, and B. Ramachandran. Drishti: An Integrated Navigation System for Visually Impaired
and Disabled. In In Proceedings of the Fifth International Symposium on Wearable Computers, pages
149–156, Washington DC, 2001. IEEE Computer Society.
[31] E. Hjelmas and B. Low. Face Detection: A Survey. In In Computer Vision and Image Understanding,
pages 236–274, 2001.
[32] A. Hub, J. Diepstraten, and T. Ertl. Design and Development of an Indoor Navigation and Object
Identification System for the Blind. In In Design for Accessibility, pages 147–152, New York, 2004.
ACM Press.
[33] A. Hub, T. Hartter, and T. Ertl. Interactive Tracking of Movable Objects for the Blind on the Basis of
Environment Models and Perception-Oriented Object Recognition Methods. In Proceedings of the 8th
international ACM SIGACCESS conference on Computers and accessibility, pages 111–118, New York,
2006. ACM Press.
[34] RFID Journal. Nokia unveils rfid phone reader, 2004. Em
http://www.rfidjournal.com/article/articleview/834/1/13/, última visita 24/07/2008.
[35] Y. Kawai and F. Tomita. A Visual Support System for Visually Impaired Persons Using Acoustic Interface.
IAPR Workshop on Machine Vision Applications, pp, pages 379–382, 2000.
[36] J. Loomis, R. Golledge, and R. Klatzky. Navigation System for the Blind: Auditory Display Modes and
Guidance. In Presence: Teleoperators and Virtual Environments, pages 193–203, Cambridge, 1998.
MIT Press.
[37] J.M. Loomis, Marston, J.R., Golledge, R.G., and R.L. Klatzky. Personal Guidance System for People with
Visual Impairment: A Comparison of Spatial Displays for Route Guidance. Journal of Visual Impairment
and Blindness, 98(3):135–147, 2004.
[38] H. Luo, Z. Jiang, B. Kim, N. Shankaranarayanan, and P. Henry. Integrating Wireless LAN and Cellular
Data for the Enterprise. In In IEEE Internet Computing, pages 25–33, Piscataway, 2003. IEEE
Educational Activities Department.
[39] A. Marsh, M. May, and M. Saarelainen. Pharos: Coupling GSM & GPS-TALK technologies to
provide orientation, navigation and location-based services for the blind. In In IEE EMBS International
Conference on Information Technology Applications in Biomedicine, pages 38–43, Washington DC,
2000. IEEE Computer Society.
[40] J.R. Marston, Loomis, J.M., Klatzky, R.L., and R.G. Golledge. Nonvisual Route Following with Guidance
from a Simple Haptic or Auditory Display. JOURNAL OF VISUAL IMPAIRMENT AND BLINDNESS,
101(4):203, 2007.
83
[41] D.A. Norman. The design of everyday things. New York: Doubleday, 1990.
[42] A. Patil, D. Kim, and L. Ni. A study of frequency interference and indoor location sensing with 802.11b
and Bluetooth Technologies. In International Journal of Mobile Communications, pages 621–644, 2006.
[43] J. Rajamaki, P. Viinikainen, J. Tuomisto, T. Sederholm, and M. Saamanen. LaureaPOP Indoor Navigation
Service for the Visually Impaired in a WLAN Environment. In In Proceedings of the 6th WSEAS Int. Conf.
on Electronics, Hardware, Finland, 2007. Laurea University of Applied Sciences.
[44] S. Ram and J. Sharf. The People Sensor: A Mobility Aid for the Visually Impaired. In In Proceedings of
the 2nd IEE International Symposium on Wearable Computers, pages 166–167, Washington DC, 1998.
IEEE.
[45] L. Ran, S. Helal, and S. Moore. Drishti: An Integrated Indoor/Outdoor Blind Navigation System and
Service. In In Proceedings of the Second IEEE Annual Conference on Pervasive Computing and
Communications, pages 23–30, Washington DC, 2004. IEEE Computer Society.
[46] S. Resnikoff, D. Pascolini, D. Etya’ale, I. Kocur, R. Pararajasegaram, G. Pokharel, and S. Mariotti. Global
data on visual impairment in the year of 2002. In Bulletion of the World Health Organization, 2002.
[47] D. Ross and B. Blasch. Wearable Interfaces for Orientation and Wayfinding. In In Proceedings of the
fourth international ACM conference on Assistive Technologies, pages 193–200, New York, 2000. ACM
Press.
[48] D. Ross and A. Lightman. Talking Braille: A Wireless Ubiquitous Computing Network for Orientation and
Wayfinding. In In Proceedings of the 7th international ACM SIGACCESS conference on Computers and
accessibility, pages 98–105, New York, 2005. ACM Press.
[49] J. Rubin and T. Hudson. Handbook of Usability Testing: How to Plan, Design, and Conduct Effective
Tests. John Wiley & Sons, Inc. New York, NY, USA, 1994.
[50] Pedro Sousa and Vera Saraiva. People finder, 2004. Universidade Técnica de Lisboa, Instituto Superior
Técnico, Departamento de Engenharia Informática, Trabalho final de curso.
[51] T. Starner, D. Kirsch, and S. Assefa. The Locust Swarm: And environmentally-powered, networkless
location and messaging system. In In First International Symposium on Wearable Computers, pages
169–170, Washington DC, 1997. IEEE.
[52] T. Strothotte, S. Fritz, R. Michel, A. Raab, H. Petrie, and V. Johnson. Development of Dialogue Systems
for a Mobility Aid for Blind People: Initial Design and Usability Testing. In In Proceedings of the second
annual ACM conference on Assistive technologies, pages 139–144, New York, 1996. ACM.
[53] N. Swami and S. Ahamed. Error Modeling in RF-based Location Detection (EMLD) for Pervasive
Computing Environments. In The Second International Conference on Availability, Reliability and
Security, pages 783–790, 2007.
84
[54] S. Takeda, I. Morioka, K. Miyashita, A. Okumura, Y. Yoshida, and K. Matsumoto. Age variation in upper
limit of hearing. European Journal of Applied Physiology, pages 403–408, 2004.
[55] Paulo Tavares and Rui Mendes. Homero - storytelling for wayfinding, 2004. Universidade Técnica de
Lisboa, Instituto Superior Técnico, Departamento de Engenharia Informática, Trabalho final de curso.
[56] F. Tomita, T. Yoshimi, T. Ueshiba, Y. Kawai, Y. Sumi, T. Matsushita, N. Ichimura, K. Sugimoto, and
Y. Ishiyama. R&D of versatile 3D vision system VVV. Systems, Man, and Cybernetics, 1998. 1998
IEEE International Conference on, 5, 1998.
[57] M. Turunen, J. Hakulinen, A. Kainulainen, A. Melto, and T. Hurtig. Design of a Rich Multimodal Interface
for Mobile Spoken Route Guidance. Proceedings of Interspeech, pages 2193–2196, 2007.
[58] M. Turunen, T. Hurtig, J. Hakulinen, A. Virtanen, and S. Koskinen. Mobile Speech-based and Multimodal
Public Transport Information Services. Proceedings of MobileHCI 2006 Workshop on Speech in Mobile
and Pervasive Environments, 2006.
[59] J.B.F. Van Erp, H.A.H.C. Van Veen, C. Jansen, and T. Dobbins. Waypoint navigation with a vibrotactile
waist belt. ACM Transactions on Applied Perception (TAP), 2(2):106–117, 2005.
[60] Vídeo-Surveillance-Guide. How does thermal imaging work? Em
http://www.video-surveillance-guide.com/how-does-thermal-imaging-work.htm, última visita 24/07/2008.
[61] A. Virtanen and S. Koskinen. NOPPA: Navigation and guidance system for the blind. In Proceedings of
the 11th World Congress and Exhibition on ITS, 2004.
[62] Paul Vittelo. A ring tone meant to fall on deaf ears. The New York Times, 2006.
[63] Y. Wang, X. Jia, and H. Lee. An indoors wireless positioning system based on wireless local area network
infrastructure. In In The 6th International Symposium on Satellite Navigation Technology Including Mobile
Positioning & Location Services, 2003.
[64] R.L. Welsh, B.B. Blasch, and W.R. Wiener. Foundations of Orientation e Mobility, pages 9–38. AFB
Press, second edition, 1997.
[65] David H. Williams. The strategic implications of wal-mart’s rfid mandate, 2004. Em
http://www.directionsmag.com/, última visita 24/07/2008.
[66] S. Willis and S. Helal. RFID Information Grid for Blind Navigation and Wayfinding. In In Proceedings of
the ninth International Symposium on Wearable Computers, pages 34–37, Washington DC, 2005. IEEE
Computer Spociety.
[67] J. Wilson, B.N. Walker, J. Lindsay, C. Cambias, F. Dellaert, and B.I.T. Center. SWAN: System for
Wearable Audio Navigation. Wearable Computers, 2007 11th IEEE International Symposium on, pages
1–8, 2007.
[68] I. Young, J. Gerbrands, and L. Vliet. Fundamentals of Image Processing. Delft University of Technology,
1995.
85
A1Análise Preliminar
A1.1. Questionário e Resultados
Tabela A1.1: Questionário e respectivos resultados, parte um.
87
Tabela A1.2: Questionário e respectivos resultados, parte dois.
88
A1.2. Plano de ObservaçãoEste anexo apresenta o plano de observação da análise preliminar.
A1.2.1. MotivaçãoEsta observação está focada no estudo das técnicas de mobilidade e orientação e nas formas de comunicação
entre utilizadores invisuais. Um dos principais desafios das interfaces de sistemas de orientação é dar
ao utilizador um retorno auditivo adequado. No final desta observação, esperamos ter retirado algumas
conclusões sobre a forma como os utilizadores exploram um espaço desconhecido, como constroem o seu
modelo mental, quais as informações mais relevantes, principais dificuldades e como transmitem toda essa
informação a colegas invisuais.
A1.2.2. Avaliação Preliminar dos Utilizadores
Tabela A1.3: Resultados dos pré-questionários da fase de observação.
A1.2.3. ProcedimentosSerá proposto ao participante um conjunto de tarefas de exploração de um local interior, desconhecido
e recolhidos dados sobre as técnicas utilizadas, opiniões, comentários e descrições do espaço. Serão
efectuadas três sessões a cada participante (individualmente), com a duração de quarenta e cinco minutos
cada. O objectivo será permitir ao utilizador explorar todo o espaço, de modo a obter um conhecimento total
do local, para que, no final, consiga guiar um colega invisual por um percurso.
Preparação: Em primeiro lugar, terá de ser escolhido um local desconhecido a todos os participantes. No
entanto, este deve proporcionar um ambiente controlado, para que as tarefas possam ser executadas sem
interrupções. Escolhido o local, será necessário escolher um ponto de origem, destino e o percurso. Visto
que o objectivo é estudar a forma como os participantes exploram o local e como comunicam entre si, temos
de garantir que todos têm um conhecimento total do espaço, para que consigam guiar outra pessoa. Logo,
será necessário elaborar um conjunto de tarefas, de modo a garantir que, no final, todos os utilizadores se
conseguem orientar no local. Devem ainda ser impressos os pré-questionários, formulários de consentimento
89
e guião do monitor.
Recebimento, consentimento e pré-questionário: No primeiro contacto com o participante, o monitor
deverá dar uma breve introdução do trabalho que está a ser efectuado e criar um ambiente confortável.
O monitor deverá deixar bem claro que o participante não estará de forma alguma a ser avaliado, apenas
a colaborar na investigação e mostrar gratidão por isso. Depois do primeiro contacto, será efectuado o
pré-questionário e lido o formulário de consentimento na presença de um terceiro elemento.
Orientação: Serão propostas aos participantes um conjunto de tarefas. Nesta fase, será explicado ao
utilizador o propósito de cada uma delas. Mais uma vez, é importante frisar que o participante não irá ser
avaliado. É também importante que este se sinta à vontade e preparado para executar cada tarefa. Apesar de
existir um conjunto de tarefas bem definidas, de modo a garantir alguma consistência entre os participantes,
estes não devem ser privados de explorar o local. Ou seja, devemos deixar o participante à vontade para
tomar iniciativa.
Execução das tarefas: Cada tarefa deverá ser lida ao participante e, caso seja necessário, esclarecer
alguma dúvida. Durante a execução da tarefa, apesar do monitor andar sempre por perto do participante,
para garantir alguma segurança, não deverá intervir, a não ser que seja absolutamente necessário. No
entanto, os participantes são encorajados a partilhar as suas opiniões e pensamentos, durante a execução
da tarefa. O monitor será responsável por tomar anotações, principalmente em relação aos comportamentos
adoptados, opiniões e comentários do participante.
Debriefing: Depois de terminada cada sessão, os participantes serão entrevistados, de modo a recolher
opiniões e comentários. Apesar de existirem linhas gerais para as entrevistas, estas poderão divergir, de
acordo com os comentários e comportamentos de cada participante. No final desta fase será agradecida a
sua participação.
A1.2.4. Lista de Tarefas:As tarefas de exploração propostas permitirão ao participante obter um conhecimento total do local e construir
um mapa mental adequado. No final de cada sessão o monitor terá de garantir que os objectivos de
exploração são cumpridos.
• Primeira sessão
– Explorar livremente o local, com o objectivo de chegar ao final do percurso
– Contar a história do percurso na totalidade
• Segunda sessão
– Encontrar a porta da dispensa da cave
– Descobrir quantos pilares existem no piso inferior
– Descrever os caminhos que existem, desde as escadas até à dispensa do piso inferior
90
– Descrever o que rodeia o participante: em frente às escadas do piso inferior; junto à mesa do
telefone; junto à porta de saída do piso inferior; junto à dispensa;
– Contar a história do percurso na totalidade
• Terceira sessão
– Contar a história do percurso na totalidade
– Contar a história, caso a pessoa se engane no percurso e esteja junto à dispensa
– Identificar os quatro pilares do piso inferior e em cada um deles apontar para os seguintes locais:
escadas; telefone; secretária; dispensa;
– Identificar os pontos mais importantes no percurso
• Em todas as sessões
– Contar a história divida por troços
A1.3. Plano da Reunião de GrupoEste anexo apresenta o plano da reunião de grupo da análise preliminar.
A1.3.1. MotivaçãoDe modo a solidificar alguns dos resultados e conclusões retiradas anteriormente no estudo com utilizador,
torna-se necessária uma reunião de grupo, onde possam ser debatidos estes pontos. Em particular, esta
reunião irá servir para construir um conjunto de instruções, de acordo com o percurso previamente traçado,
na fase de observação, reunindo a opinião de todos os participantes.
A1.3.2. Os ParticipantesOs participantes terão de conhecer o local e o percurso onde foi feita a observação, de modo a podermos
cumprir os objectivos da reunião. Iremos contar também com um ex-instrutor de técnicas de mobilidade e
orientação, que nos poderá dar uma opinião mais técnica e de acordo com o que este tipo de utilizadores
aprende em cursos de reabilitação.
A1.3.3. ProcedimentoIrão ser reunidos os participantes da fase de observação, assim como um ex-instrutor em técnicas de
mobilidade e orientação para invisuais. Durante a reunião, irão ser debatidos um conjunto de temas, com
especial foco nas histórias recolhidas anteriormente e na possibilidade de construir uma só história (a
"melhor"), tendo em conta a opinião de todos os participantes.
Preparação: Em primeiro lugar, terá de ser construído um plano de trabalhos para a reunião e comunicá-lo
aos participantes, para que estes possam ter algum tempo, caso seja necessário, para se preparar. É
91
necessário, também, imprimir o guião do monitor e obter um gravador de voz devidamente carregado.
Recebimento, consentimento: No início da reunião, o monitor deverá apresentar os objectivos, as principais
conclusões da fase anterior e explicitar detalhadamente o plano de trabalhos. Deverá, também, deixar bem
claro que os participantes não estarão a ser avaliados, apenas a colaborar no trabalho de investigação e
mostrar a sua gratidão. Em seguida, poderá ler o formulário de consentimento.
Plano de trabalhos: O monitor da reunião deverá assumir um papel de moderador e proporcionar um
ambiente de discussão e debate. O plano de trabalhos para esta reunião é o seguinte:
• Construção de uma só história
• Construção das histórias, caso o participante se engane no percurso
• Quais as informações mais relevantes para concluir um percurso
• Que outras informações, para além do percurso, também são desejáveis
• Qual a melhor forma de transmitir todas estas informações
A1.4. Resposta às 11 Perguntas1. Quem vai utilizar o sistema?
Qualquer pessoa poderá usar o sistema, no entanto, a interface terá características que o tornam ideal
para pessoas com deficiências visuais.
2. Que tarefas executam actualmente?
Utilizam um número muito limitado de funcionalidades no seu telemóvel, nomeadamente, receber e
efectuar chamadas. Em relação às capacidades de orientação e mobilidade, este tipo de utilizadores
consegue deslocar-se bastante bem em locais conhecidos. Caso o edifício seja desconhecido, então
dependem bastante da ajuda de terceiros.
3. Que tarefas são desejáveis?
O sistema de orientação deve conseguir: guiar o utilizador até um destino, previamente especificado;
contextualizar o utilizador, tendo em conta a sua localização; alertar o utilizador para a existência de
perigos ou sinais.
4. Como se aprendem as tarefas?
Actualmente, as técnicas de mobilidade e orientação são aprendidas num curso de reabilitação, realizado
pela maioria dos utilizadores deficientes visuais. Existe ainda a possibilidade de aprenderem estas
técnicas através da sua experiência pessoal ou convívio.
5. Como são desempenhadas as tarefas?
Actualmente, o utilizador tem de explorar o local ou pedir ajuda a terceiros, para construir um modelo
mental que lhe possibilite deslocar-se pelo espaço. Este processo torna-se bastante moroso e, por
vezes, perigoso para utilizadores invisuais.
92
6. Quais as relações entre utilizador e informação?
Não é relevante.
7. Que outros instrumentos tem o utilizador?
Os utilizadores invisuais andam sempre com uma bengala, numa das mãos, para conseguir evitar
obstáculos ou outros perigos iminentes (escadas, buracos, etc.)
8. Como comunicam os utilizadores entre si?
Os utilizadores comunicam pessoalmente, em particular no local de trabalho, centros de reabilitação,
edifícios públicos, etc.
9. Qual a frequência de desempenho das tarefas?
Este tipo de utilizadores faz uso das suas capacidades de orientação e mobilidade diariamente. Não
têm por hábito andar acompanhados, mas necessitam muitas vezes de ajuda, especialmente se o local
for desconhecido.
10. Quais as restrições de tempo impostas?
Tendo em conta que o utilizador se está a movimentar, ao fornecer qualquer tipo de ajuda, esta tem de
fazer sentido no espaço/tempo em que este se encontra.
11. Que acontece se algo correr mal?
Caso o utilizador se perca, tem como opções: pedir ajuda; tentar localizar-se no espaço;
A1.5. RequisitosO levantamento de requisitos é uma etapa importante no desenvolvimento de qualquer projecto. Cada
requisito identifica uma parte do que irá ser o sistema final, logo, o correcto levantamento de todos os
requisitos é crucial para o sucesso do sistema. Com base no estudo feito com os utilizadores irão ser
identificados os principais requisitos, divididos por: funcionais, de dados, ambientais, de utilizador e de
usabilidade.
Tabela A1.4: Requisitos do sistema.
93
A2Avaliação Preliminar
A2.1. Pré-Questionário e Resultados
Tabela A2.1: Resultados dos pré-questionários da avaliação preliminar.
A2.2. Plano de Avaliação PreliminarEste anexo apresenta o plano de observação da avaliação preliminar.
A2.2.1. IntroduçãoEste documento descreve o guião da avaliação preliminar, onde o principal objectivo é validar a nossa
abordagem e a forma como o utilizador é guiado por um percurso e local desconhecidos.
A2.2.2. MotivaçãoEsta avaliação preliminar tem como principal foco o retorno auditivo. Um dos principais desafios das interfaces
de sistemas de orientação é dar ao utilizador um retorno auditivo adequado. As instruções que irão ser dadas
são o reflexo de um estudo centrado no utilizador, em particular das técnicas de mobilidade e orientação e
formas de comunicação usadas. Assim, pretendemos validar a informação que é dada ao utilizador através
do seu desempenho e resultados qualitativos (comentários e opiniões).
95
Para garantir a validade das nossas conclusões, iremos efectuar um teste de Feiticeiro de Oz, onde o
Feiticeiro substitui o comportamento do dispositivo móvel e do nosso sistema.
A2.2.3. Questões de InvestigaçãoEsta avaliação tenta responder às seguintes questões:
1. A interacção através do diálogo é uma abordagem viável?
2. Os pontos de referência escolhidos influenciam o desempenho do utilizador?
3. A informação de cada instrução é suficiente?
4. Os utilizadores compreendem o vocabulário?
5. Os utilizadores conseguem associar as instruções à realidade?
A2.2.4. Perfil de UtilizadorEsta avaliação irá contar com um total de nove participantes. O único requisito necessário para efectuar esta
avaliação é não ter um conhecimento prévio do local.
A2.2.5. Metodologia de AvaliaçãoEsta avaliação consiste numa simulação Feiticeiro de Oz [20], que permitirá validar as instruções recolhidas
na fase de observação e na reunião de grupo. A sessão de avaliação é composta por seis secções:
Preparação: Devem ser impressos os pré-questionários, formulários de consentimento e guião do Feiticeiro
de Oz. É necessário obter equipamento de filmagem e testá-lo. Por último, verificar se o percurso construído
na fase de observação continua intacto.
Recebimento, consentimento e pré-questionário: No primeiro contacto com o participante, o monitor
deverá dar uma breve introdução do trabalho que está a ser efectuado e criar um ambiente confortável. O
monitor deverá deixar bem claro que o participante não estará, de forma alguma, a ser avaliado, apenas a
colaborar na investigação e mostrar gratidão por isso. Em seguida, deverá ler o formulário de consentimento,
na presença de uma testemunha e efectuar o pré-questionário.
Configuração do equipamento: O único equipamento necessário para esta avaliação é a câmara de filmar,
logo o monitor deverá certificar-se que estará operacional durante toda a sessão.
Orientação: Será proposto aos participantes que sigam um conjunto de instruções, desde um ponto de
partida até um destino, previamente definidos. Mais uma vez, é importante frisar que o utilizador não estará
a ser avaliado. É também importante que o mesmo se sinta à vontade e preparado para executar a tarefa.
96
Execução do teste: Cada tarefa deverá ser lida ao participante e esclarecidas as dúvidas, caso seja
necessário. Durante a execução da tarefa, apesar do monitor (Feiticeiro de Oz) andar sempre por perto,
para garantir alguma segurança, não deverá intervir, a não ser que seja absolutamente necessário. Caso
tenha de fazê-lo, devido a alguma situação não prevista, então será contabilizado como uma ajuda externa
ao sistema.
Debriefing: Depois de terminada cada sessão, os participantes serão entrevistados, de modo a recolher
opiniões e comentários. Apesar de existirem linhas gerais para as entrevistas, estas poderão divergir,
de acordo com os comentários e teste de cada participante. No final desta fase, será agradecida a sua
participação.
A2.2.6. Lista de Tarefas
Esta avaliação será composta por apenas uma tarefa:
• Seguir um conjunto de instruções ao longo de um percurso (Figura A2.1), previamente definido.
A2.2.7. Ambiente de Avaliação
A avaliação preliminar será realizada no mesmo local da observação, na cave da Fundação Raquel e Martin
Sain. Este espaço não é utilizado pelos formandos desta instituição e foi-nos possível simular um cenário
real, com diversos percursos e obstáculos.
(a) Primeiro piso. (b) Segundo piso.
Figura A2.1: Mapa e percurso do local onde foi efectuada a avaliação preliminar. As marcas a azul indicam os pontos
onde serão dadas as instruções.
97
A2.2.8. Monitor da AvaliaçãoNeste caso, o monitor da avaliação corresponde ao Feiticeiro de Oz, que tem como responsabilidade simular
o sistema e dar ao utilizador as instruções, de acordo com a sua posição no espaço. É esperado que o
monitor não ajude os participantes, a não ser que estes a peçam ou a sua integridade esteja em risco.
A2.2.9. Dados da AvaliaçãoDurante a avaliação preliminar foram recolhidas as seguintes informações:
• Pensamentos, comentários e opiniões dos participantes
• Captura de vídeo e áudio do teste
• Avaliação subjectiva do monitor
A2.2.10. Relatório da AvaliaçãoO relatório final deverá incluir o procedimento, objectivos, resultados e discussão.
A2.3. Resultados da Avaliação PreliminarNeste anexo irão ser apresentados os resultados do teste e da entrevista posterior.
A2.3.1. Resultados do TestePara a análise de alguns dos resultados o mapa foi dividido por zonas (Figura A2.2)
(a) Piso superior. (b) Piso inferior.
Figura A2.2: Mapa do local, dividido por áreas.
98
Tabela A2.2: Resultados da avaliação preliminar.
A2.3.2. Entrevista Posterior e ResultadosA escala usada para classificar algumas das perguntas é limitada entre um e quatro, onde um corresponde
à pior classificação e o quatro à melhor classificação.
Tabela A2.3: Resultados da entrevista posterior.
99
A3Avaliação da
Introdução de Texto
A3.1. Pré-Questionário e Resultados
Tabela A3.1: Resultados dos pré-questionários da avaliação da introdução de texto.
A3.2. Plano de AvaliaçãoEste anexo apresenta o plano da avaliação da introdução de texto. O principal objectivo é validar a nossa
abordagem de introdução de texto em dispositivos móveis com ecrãs tácteis.
A3.2.1. MotivaçãoApesar de não ser o principal foco do nosso trabalho, a introdução de texto mostra-se como uma das
principais e mais complexas tarefas de interacção com dispositivos móveis. Para além disso, caso a nossa
abordagem seja válida, irá permitir a este tipo de utilizadores efectuar procuras por pontos de interesse,
através da introdução de uma palavra-chave.
101
A3.2.2. Metodologia de AvaliaçãoA sessão de avaliação é composta por cinco secções:
Preparação: Devem ser impressos os pré-questionários, formulários de consentimento e guião da sessão. O
monitor deverá, também, certificar-se que todo o equipamento de filmagem e telemóveis estão devidamente
carregados. A aplicação deverá estar instalada nos dispositivos móveis.
Recebimento, consentimento e pré-questionário: No primeiro contacto com o participante, o monitor
deverá dar uma breve introdução do trabalho que está a ser efectuado e criar um ambiente confortável. O
monitor deverá deixar bem claro que o participante não estará, de forma alguma, a ser avaliado, apenas a
colaborar na investigação e mostrar gratidão por isso. Em seguida, deverá ler o formulário de consentimento,
na presença de uma testemunha e efectuar o pré-questionário.
Configuração do equipamento: O equipamento de filmagem deverá ser montado, para que sejam capturadas
todas as interacções utilizador / dispositivo. O monitor deverá, também, certificar-se que a aplicação foi
iniciada e está a funcionar correctamente.
Orientação: Serão propostas aos utilizadores um conjunto de tarefas. Em cada sessão, cada utilizador terá
de transcrever três frases. Cada uma delas será comunicada verbalmente, após a conclusão da anterior.
Na primeira sessão, haverá um período de treino de vinte minutos. Este treino irá consistir na explicação do
método ao utilizador e numa fase de experimentação da aplicação.
Execução do teste: Cada tarefa deverá ser lida ao participante e esclarecidas as dúvidas, caso seja
necessário. Durante a execução da tarefa, o monitor não deverá intervir, a não ser que o utilizador lhe
peça a descrição da tarefa.
A3.2.3. Lista de TarefasEsta avaliação será composta por três tarefas por sessão. Cada tarefa corresponde à transcrição de uma
frase.
• Primeira sessão: "acabei de chegar"; "ja comprei o jornal de hoje"; "amanha nao vou poder ir";
• Segunda sessão: "hoje vou jantar fora"; "ainda vou apanhar o comboio"; "ontem consegui acabar o
trabalho todo";
• Terceira sessão: "obrigado pela prenda"; "ja estou quase a acabar"; "este foi o ultimo teste";
102
A3.2.4. Ambiente de AvaliaçãoA avaliação será efectuada na Fundação Raquel e Martin Sain, num ambiente controlado. O dispositivo
móvel que irá ser usado é o HTC TyTn, com Windows Mobile 5.0.
A3.2.5. Dados da AvaliaçãoIremos recolher os seguintes dados:
• Tempo de cada tarefa e caracter
• Número de erros (apagar caracter)
• Número de gestos por caracter
• Frase transcrita
• Avaliação subjectiva
A3.3. Resultados da AvaliaçãoNeste anexo irão ser apresentados os resultados da avaliação da introdução de texto.
(a) Erros por sessão. (b) Minimum String Distance Error Rate.
(c) Toques (ou gestos) por caracter. (d) Palavras por minuto.
Figura A3.1: Resultados da avaliação da introdução de texto.
103
A4Avaliação das
Instruções
A4.1. Pré-Questionário e Resultados
Tabela A4.1: Resultados dos pré-questionários da avaliação final.
105
A4.2. Plano da Avaliação das InstruçõesEste anexo apresenta o plano da avaliação das instruções. O principal objectivo é validar a nossa abordagem
de construção automática de instruções, assim como a interacção com dispositivos móveis com ecrã táctil.
A4.2.1. MotivaçãoDepois de construído o protótipo, torna-se necessário efectuar uma avaliação com utilizadores, de modo
a validar o sistema. Em particular nesta avaliação, irão ser avaliadas as instruções e interacções com o
dispositivo móvel. Depois de uma avaliação preliminar, em que todo o sistema foi simulado por um humano,
nesta altura, exige-se uma avaliação ao protótipo em tempo real. Por fim, serão recolhidos os resultados
qualitativos, que permitem validar a aceitação e satisfação dos utilizadores.
A4.2.2. Metodologia de AvaliaçãoA sessão de avaliação é composta por seis secções:
Preparação: Devem ser impressos os questionários, formulários de consentimento e guião da sessão. O
monitor deverá, também, certificar-se que todo o equipamento de filmagem e telemóveis estão devidamente
carregados. A aplicação deverá estar instalada no dispositivo móvel.
Recebimento, consentimento e pré-questionário: No primeiro contacto com o participante, o monitor
deverá dar uma breve introdução do trabalho que está a ser efectuado e criar um ambiente confortável. O
monitor deverá deixar bem claro que o participante não estará, de forma alguma, a ser avaliado, apenas a
colaborar na investigação e mostrar gratidão por isso. Em seguida, deverá ler o formulário de consentimento,
na presença de uma testemunha e efectuar o pré-questionário.
Configuração do equipamento: O monitor da sessão deverá escolher um local apropriado de filmagem,
para que seja possível filmar todo o percurso, sem intervir na tarefa. Deverá, também, configurar e instalar
todo o equipamento de localização no local e certificar-se do seu correcto funcionamento. Por fim, iniciar a
aplicação.
Orientação: No inicio da sessão, o utilizador terá um período de treino, em que lhe será explicado o método
de navegação em menus com ecrã táctil, seguido de uma fase de experimentação, não superior a cinco
minutos. Em seguida, o utilizador será guiado até ao ponto inicial do percurso e estará apto para iniciar a
tarefa de orientação.
Execução do teste: A tarefa será lida ao participante e esclarecidas as dúvidas, caso seja necessário.
Durante a execução da tarefa, o monitor não deverá intervir, excepto se o utilizador pedir explicitamente
106
ajuda ou a sua integridade esteja em risco. Caso aconteça, será contabilizado como uma ajuda externa ao
sistema. Durante a tarefa, o utilizador irá receber instruções provenientes do dispositivo móvel, à medida que
se desloca pelo local.
Debriefing: Depois de terminada cada sessão, os participantes serão entrevistados, de modo a recolher
opiniões e comentários. Apesar de existirem linhas gerais para as entrevistas, estas poderão divergir, de
acordo com os seus comentários. No final desta fase, será agradecida a participação dos utilizadores.
A4.2.3. Lista de TarefasEsta avaliação será composta por uma tarefa:
• Escolher o mapa "Fundação", o destino "Porta de saída"e executar as instruções.
A4.2.4. Ambiente de AvaliaçãoA avaliação final será efectuada na cave da Fundação Raquel e Martin Sain. Este é um espaço que não
é usado pelos formandos desta instituição, logo ideal para a avaliação do sistema, visto que os utilizadores
desconhecem o local.
A4.2.5. Dados da AvaliaçãoOs dados que iremos recolher são:
• Tempo necessário para seleccionar cada opção dos menus
• Número e direcção dos gestos efectuados sobre o ecrã
• Número de erros de navegação em menus
• Tempo de recuperação dos erros de navegação em menus
• Tempo de deslocação e espera (pelo sistema de localização) de cada participante
• Número de erros efectuados durante a tarefa de orientação
• Ajudas externas e do sistema
• Percurso efectuado por cada participante
• Avaliação subjectiva do monitor
A4.3. Resultados da AvaliaçãoNeste anexo, irão ser apresentados os resultados da avaliação e respectiva entrevista.
107
A4.3.1. Resultados do Teste
Tabela A4.2: Resultados da navegação em menus.
Tabela A4.3: Resultados da tarefa de orientação.
Figura A4.1: Mapa termal dos percursos efectuados.
A4.3.2. Entrevista Posterior e ResultadosA escala usada para classificar as perguntas é limitada entre um e cinco, em que o um e o cinco correspondem
à pior e melhor classificação, respectivamente.
108
Tabela A4.4: Resultados da entrevista posterior.
109