125
Outubro de 2008 Blobby Guia Móvel para Invisuais Hugo Miguel Aleixo Nicolau Dissertação para obtenção do Grau de Mestre em Engenharia Informática e de Computadores Júri Presidente: Professor Doutor Paulo Jorge Pires Ferreira Orientador: Professor Doutor Joaquim Armando Pires Jorge Vogais: Professor Doutor João Manuel Brisson Lopes

Blobby - ULisboa

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Blobby - ULisboa

2 cm 2 cm

Outubro de 2008

BlobbyGuia Móvel para Invisuais

Hugo Miguel Aleixo Nicolau

Dissertação para obtenção do Grau de Mestre em

Engenharia Informática e de Computadores

JúriPresidente: Professor Doutor Paulo Jorge Pires Ferreira

Orientador: Professor Doutor Joaquim Armando Pires Jorge

Vogais: Professor Doutor João Manuel Brisson Lopes

Page 2: Blobby - ULisboa
Page 3: Blobby - ULisboa

Agradecimentos

Em primeiro lugar, como sempre em toda a minha vida, os meus maiores e mais especiais agradecimentos

vão para a minha família. Devo-lhes a eles, em particular aos meus pais e avó, tudo aquilo que sou e alcancei

até hoje. À minha namorada Matilde, obrigado pelo apoio, motivação e ajuda incondicional demonstrada

neste último ano.

Os meus agradecimentos a todos os meus amigos, que me proporcionaram momentos de diversão e me

deram forças para continuar o trabalho nos momentos mais difíceis.

Um agradecimento muito especial ao Tiago Guerreiro pela disponibilidade demonstrada desde o primeiro

dia. Mais do que um colega, foste uma fonte de incentivo e ajuda, com quem pude sempre contar. Foste

também em grande parte, responsável pela minha paixão pela investigação, em particular nesta área de

acessibilidade. Gostaria de mostrar também a minha gratidão ao Professor Joaquim A. Jorge, por todas as

oportunidades que me foram dadas e pela confiança que depositou em mim.

A todos os membros do grupo de Visualização e Interfaces Multimodais Inteligentes do INESC-ID, obrigado

por toda a ajuda e suporte. Ao professor Daniel Gonçalves, obrigado pelo template da dissertação. Um

agradecimento também especial a todos os meus amigos do IST, nomeadamente aos meus "irmãos de

armas", Manuel e Ruben, que estiveram sempre presentes durante este processo, mas também na minha

vida pessoal. Desejo-vos a melhor das sortes, para esta nova fase das nossas vidas.

Os meus agradecimentos a todos os formandos da Fundação Raquel e Martin Sain por participarem neste

estudo, em especial ao Dr. Carlos Bastardo, pelo tempo despendido, sugestões e comentários ao longo de

todo o trabalho.

Por último, esta dissertação é dedicada ao meu avô, a melhor pessoa que alguma vez conheci. Obrigado

por todos os bons exemplos e influências.

iii

Page 4: Blobby - ULisboa
Page 5: Blobby - ULisboa

Resumo

A autonomia de um ser humano é essencial para o seu bem-estar e a capacidade que este tem de se

deslocar faz parte da sua rotina e dia-a-dia. Para a maior parte dos invisuais, andar em locais desconhecidos

é uma tarefa muito difícil ou até mesmo impossível de realizar, sem ajuda. A adopção da bengala pela

comunidade de invisuais é o principal meio de auxílio à sua capacidade de mobilidade. No entanto, as

grandes dificuldades surgem na orientação, em particular em locais que o utilizador não conhece. A inexistência

de pontos de referência e a impossibilidade de aceder às mais diversas pistas visuais são as principais

causas.

As soluções existentes no mercado estão limitadas a ambientes exteriores, têm um elevado custo e diversos

problemas de usabilidade. Por outro lado, grande parte do trabalho de investigação feito até então está

focado no estudo de uma tecnologia de localização que permita obter uma maior precisão, deixando para

segundo plano as necessidades dos utilizadores.

Nesta dissertação apresentamos uma abordagem que consiste em dar ao utilizador um retorno auditivo

familiar e facilmente compreensível. Esta baseou-se num estudo centrado no utilizador, em que foram

analisadas as suas necessidades e capacidades, de forma a criar um sistema mais adequado. Foi criado

um protótipo, que permite a interacção de invisuais com dispositivos móveis tradicionais, em particular com

ecrãs tácteis, que os auxiliam na sua tarefa de orientação. Por fim, foram realizados estudos com utilizadores

que validaram a nossa abordagem.

Palavras-chave: Invisual, Orientação, Acessibilidade, Ecrãs tácteis, Móvel, Avaliação.

v

Page 6: Blobby - ULisboa
Page 7: Blobby - ULisboa

Abstract

The autonomy of a human being is essential to his welfare and the ability he has to move around is part of his

routine. For the majority of blind people, walking in unknown places is very difficult or even impossible to do,

without help. The adoption of the white cane by blind community is the main aid to their mobility. However,

the major difficulties arise in their orientation task, particularly in places that users don’t know. The lack of

reference points and the inability to access visual clues are the main causes.

The existing products are limited to outdoor environments and have a high cost and usability problems.

Moreover, much of the research done so far is focused on the study of location systems and technologies,

leaving the user needs behind.

In this dissertation we present an approach that allows users to walk through unknown places, while receiving

a familiar and easily understandable feedback. This approach arise from a user centered design, that

consisted in analyze user’s needs and capacities, which allowed us to create a better prototype. This prototype

allows blind users to interact with traditional mobile devices, particularly the ones with touch screens, while

still guiding them. Finally, we have conducted user studies that validate our approach.

Keywords: Blind, Orientation, Accessibility, Touch Screens, Mobile, Evaluation.

vii

Page 8: Blobby - ULisboa
Page 9: Blobby - ULisboa

Conteúdo

Agradecimentos iii

Resumo v

Abstract vii

Lista de Figuras xii

Lista de Tabelas xiii

Lista de Acrónimos xv

1 Introdução 1

1.1 Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 Abordagem Proposta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3 Resumo do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.4 Contribuições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.5 Publicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.6 Estrutura da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2 Trabalho Relacionado 9

2.1 GPS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.2 Bluetooth . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.3 RFID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.4 Processamento de Imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.5 Infravermelho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.6 WLAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.7 Ultra-Som . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.8 Sistemas Híbridos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.9 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3 Sistema de Orientação para Invisuais 37

3.1 Estudos Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.2 Sistema de Orientação em Dispositivos Móveis . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.3 Avaliação Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

ix

Page 10: Blobby - ULisboa

4 O Guia Móvel 55

4.1 Arquitectura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.2 Material de Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.3 Construção de Instruções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.4 Módulo de Localização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.5 Interface Utilizador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

5 Resultados e Discussão 65

5.1 Avaliação da Introdução de Texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.2 Avaliação da Navegação em Menus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.3 Avaliação das Instruções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5.4 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

6 Conclusões 77

6.1 Sumário da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

6.2 Vantagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

6.3 Limitações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

6.4 Trabalho Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

Bibliografia 80

A1 Análise Preliminar 87

A1.1 Questionário e Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

A1.2 Plano de Observação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

A1.3 Plano da Reunião de Grupo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

A1.4 Resposta às 11 Perguntas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

A1.5 Requisitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

A2 Avaliação Preliminar 95

A2.1 Pré-Questionário e Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

A2.2 Plano de Avaliação Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

A2.3 Resultados da Avaliação Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

A3 Avaliação da Introdução de Texto 101

A3.1 Pré-Questionário e Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

A3.2 Plano de Avaliação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

A3.3 Resultados da Avaliação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

A4 Avaliação das Instruções 105

A4.1 Pré-Questionário e Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

A4.2 Plano da Avaliação das Instruções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

A4.3 Resultados da Avaliação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

x

Page 11: Blobby - ULisboa

Lista de Figuras

1.1 Mapa e sinal em Braille. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 UltraCane, um detector de obstáculos para deficientes visuais. . . . . . . . . . . . . . . . . . 3

1.3 Dispositivos de orientação para invisuais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.1 Modelo N95 da Nokia, já com um receptor de GPS integrado. . . . . . . . . . . . . . . . . . . 10

2.2 Exemplo de uma instrução do sistema Drishti. . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.3 Exemplo de um diálogo no sistema NOPPA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.4 Sistema SWAN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.5 Auricular Bluetooth para telemóveis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.6 Conjunto de etiquetas RFID. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.7 Dispositivo com câmara, bússola e sensor de inclinação, integrado numa bengala. . . . . . . . 18

2.8 Sistema de orientação baseado no processamento de imagem, de uma câmara de vídeo,

integrada num telemóvel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.9 Fotografia de um utilizador com as interfaces do sistema. . . . . . . . . . . . . . . . . . . . . 20

2.10 Exemplo de um diálogo do sistema Drishti, num espaço interior. . . . . . . . . . . . . . . . . . 22

3.1 Mapa e percurso do local onde foi efectuada a observação. . . . . . . . . . . . . . . . . . . . 42

3.2 Métodos de interacção com dispositivos móveis. . . . . . . . . . . . . . . . . . . . . . . . . . 48

3.3 Estrutura das instruções mais frequentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3.4 Representação da avaliação preliminar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3.5 Diferentes formas de contornar um obstáculo . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3.6 Ajudas por participante da avaliação preliminar. . . . . . . . . . . . . . . . . . . . . . . . . . . 53

3.7 Ajudas por zona (Figura A2.2) da avaliação preliminar. . . . . . . . . . . . . . . . . . . . . . . 53

4.1 Arquitectura do sistema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.2 Dispositivos móveis usados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.3 Exemplificação de um mapa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.4 Representação do sistema localização, WLAN e Bluetooth. . . . . . . . . . . . . . . . . . . . 60

4.5 Modelo de navegação em menus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.6 Gestos para navegação em menus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4.7 Duas abordagens de navegação, até à letra ’t’. . . . . . . . . . . . . . . . . . . . . . . . . . . 63

5.1 Utilizador durante uma sessão de avaliação. . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

xi

Page 12: Blobby - ULisboa

5.2 Comparação de métodos de introdução de texto. . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.3 Comparação de métodos de introdução de texto. . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.4 Tempos na navegação em menus, em segundos. . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.5 Telemóvel envolvido em alumínio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5.6 Percurso da avaliação final. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

5.7 Tempos da tarefa, em segundos. Relação entre o tempo de deslocação e o tempo de espera

pelas instruções. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.8 Mapa termal dos percursos efectuados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.9 Resultados do pós-questionário. Classificação média, por pergunta. . . . . . . . . . . . . . . 73

A2.1 Mapa e percurso do local onde foi efectuada a avaliação preliminar. As marcas a azul indicam

os pontos onde serão dadas as instruções. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

A2.2 Mapa do local, dividido por áreas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

A3.1 Resultados da avaliação da introdução de texto. . . . . . . . . . . . . . . . . . . . . . . . . . 103

A4.1 Mapa termal dos percursos efectuados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

xii

Page 13: Blobby - ULisboa

Lista de Tabelas

2.1 Comparação entre tecnologias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.2 Comparação entre modalidades de entrada. . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.3 Comparação entre modalidades de saída. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.4 Comparação entre interfaces. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.1 Perfil utilizador. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.2 Uso de dispositivos móveis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.3 Grau de independência. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

A1.1 Questionário e respectivos resultados, parte um. . . . . . . . . . . . . . . . . . . . . . . . . . 87

A1.2 Questionário e respectivos resultados, parte dois. . . . . . . . . . . . . . . . . . . . . . . . . 88

A1.3 Resultados dos pré-questionários da fase de observação. . . . . . . . . . . . . . . . . . . . . 89

A1.4 Requisitos do sistema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

A2.1 Resultados dos pré-questionários da avaliação preliminar. . . . . . . . . . . . . . . . . . . . . 95

A2.2 Resultados da avaliação preliminar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

A2.3 Resultados da entrevista posterior. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

A3.1 Resultados dos pré-questionários da avaliação da introdução de texto. . . . . . . . . . . . . . 101

A4.1 Resultados dos pré-questionários da avaliação final. . . . . . . . . . . . . . . . . . . . . . . . 105

A4.2 Resultados da navegação em menus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

A4.3 Resultados da tarefa de orientação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

A4.4 Resultados da entrevista posterior. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

xiii

Page 14: Blobby - ULisboa
Page 15: Blobby - ULisboa

Lista de Acrónimos

2D Duas Dimensões

3D Três Dimensões

AP Acess Point

API Application Programming Interface

FR Frequência de Rádio

GPS Global Positioning System

IV Infravermelho

TPC Toques Por Caracter

GPC Gestos Por Caracter

LED Light-Emitting Diode

PDA Personal Digital Assistant

RFID Radio Frequency Identification

TTS Text To Speech

WLAN Wireless Local Area Network

xv

Page 16: Blobby - ULisboa
Page 17: Blobby - ULisboa

1Introdução

Existem aproximadamente 163 mil deficientes visuais em Portugal, mais de 1.6% da população, de acordo

com os dados recolhidos em 2001 [23], dos quais 17 mil são invisuais. Na Europa, o número de invisuais

chega aos 7% e em todo o mundo existem mais de 161 milhões de deficientes visuais [46]. A autonomia

de um ser humano é essencial para o seu bem-estar e a capacidade que este tem de se deslocar faz

parte da sua rotina e dia-a-dia. Para a maior parte dos deficientes visuais, andar em locais desconhecidos

é um desafio quase impossível de ultrapassar sem a ajuda de terceiros. A orientação e mobilidade são,

certamente, as componentes mais importantes no processo de reabilitação e integração de um deficiente

visual. No entanto, são duas capacidades muitas vezes confundidas. Mobilidade diz respeito à capacidade

de coordenar acções de modo a evitar obstáculos e perigos imediatos, enquanto que a orientação diz respeito

à capacidade de estabelecer e manter a consciência da posição relativamente a pontos de referência e a um

destino [26, 64].

Com o uso de uma bengala e/ou cão-guia, um invisual consegue evitar a maior parte dos obstáculos que

lhe vão aparecendo no caminho, especialmente se o trajecto for bem conhecido. Caso contrário, existem

outro tipo de dificuldades às quais está sujeito. Apesar de se conseguir deslocar, com mais ou menos

dificuldade, não existe qualquer ponto de referência no seu modelo mental. Ou seja, os seus principais

"utensílios"são bastante úteis ao nível da mobilidade, mas ajudam muito pouco ao nível da orientação. As

pessoas visualmente capazes conseguem guiar-se através das mais variadas pistas visuais, como setas,

marcos, referências ou movimentações. Um deficiente visual, normalmente, tem um número limitado de

percursos bem definidos no seu dia-a-dia e orienta-se através de pontos referenciais bem conhecidos, que já

fazem parte do seu modelo mental. Como possíveis soluções, temos os mapas tácteis ou os sinais em Braille

(Figura 1.1). Ambas são claramente insuficientes, devido à sua distribuição limitada e aos problemas de

usabilidade que apresentam: os mapas tácteis são demasiado grandes, de difícil transporte e compreensão;

os sinais em Braille são bastante difíceis de localizar num edifício, tendo em conta que o utilizador não

vê. Além do mais, ambas as soluções fazem uso do sistema Braille, que por si só é inacessível a muitos

deficientes visuais, em particular àqueles que só recentemente tiveram de lidar com esta deficiência. É o

caso dos idosos, que vão perdendo as suas capacidades visuais [46] e nunca aprendem Braille.

1

Page 18: Blobby - ULisboa

(a) Sinal em Braille (b) Mapa táctil.

Figura 1.1: Mapa e sinal em Braille.

Esta dissertação foca-se na área das interface utilizador, ou seja, consiste em estudar, formalizar e desenvolver

novos métodos de interacção que se adeqúem às necessidades e capacidades dos utilizadores. Grande

parte dos progressos que têm vindo a ser feitos têm auxiliado os utilizadores invisuais em ambientes exteriores.

Isto deve-se principalmente à divulgação, alta precisão e disponibilidade que o Global Positioning System

(GPS) tem vindo a ganhar ao longo dos anos. Em ambientes interiores, não existe ainda nenhuma tecnologia

de localização que se destaque de todas as outras. No entanto, existem diversas opções, tais como o

Bluetooth, Wireless Local Area Network (WLAN), infravermelho, Radio-Frequency IDentification (RFID) ou

ultra-som. O estudo destas diferentes abordagens tem sido o principal tema de investigação, com objectivo

de optimizar o desempenho, precisão, disponibilidade e custos.

Devido à própria natureza deste tipo de sistemas, cujo retorno para o utilizador é da maior importância,

torna-se necessário compreender as suas necessidades e capacidades. Esta é uma área em que não têm

existido muitos progressos, no entanto, revela-se crucial para o sucesso dos sistemas de orientação. Este

trabalho está focado apenas no estudo de ambientes interiores, com o objectivo de limitar o vocabulário e

cingir-se apenas a uma área de interesse. No entanto algumas das conclusões poderão ser estendidas a

cenários exteriores.

1.1. ProblemaAo longo do tempo, tem existido um grande esforço em utilizar a tecnologia como meio de assistir pessoas

com deficiências visuais nas suas tarefas de mobilidade. A adopção da bengala pela comunidade de invisuais

é o seu principal meio de detectar obstáculos e muita da investigação que tem sido feita até ao momento, tem

o objectivo de acrescentar mais funcionalidades a este objecto. É o caso de dispositivos como a Ultra Cane

[22] (Figura 1.2) ou o People Sensor [44], em que os autores tentam aumentar as capacidades de mobilidade

dos utilizadores, oferecendo-lhes mecanismos de detecção de obstáculos à distância.

Estes sistemas acrescentam muito pouco às necessidades destes utilizadores. O verdadeiro problema

2

Page 19: Blobby - ULisboa

Figura 1.2: UltraCane, um detector de obstáculos para deficientes visuais.

encontra-se nas suas capacidades de orientação. Tendo como exemplo um terminal de aeroporto, mesmo

para pessoas que conseguem usar os seus cinco sentidos, por vezes é difícil saber para onde se devem

dirigir para fazer check-in, para embarcar ou levantar as malas. Para um invisual, as dificuldades são ainda

maiores, pois não têm acesso a indicações ou outras pistas visuais. Sem a ajuda de um familiar, amigo ou

outra pessoa, estas tarefas seriam praticamente impossíveis de realizar.

O Sendero GPS [28] e o Trekker [6] (Figura 1.3) são dois sistemas disponíveis no mercado, mas operam

apenas em cenários exteriores. A fraca penetração de mercado destes sistemas deve-se principalmente ao

seu custo. Ambos os sistemas estão incorporados em dispositivos desenhados para invisuais, logo estão

limitados a um segmento reduzido da população.

(a) Sendero GPS (b) Trekker

Figura 1.3: Dispositivos de orientação para invisuais.

Um sistema de orientação tem como principal objectivo guiar um utilizador. Sendo esta tarefa realizada,

geralmente, através da fala, é essencial que o utilizador entenda e consiga executar todas as instruções

dadas. Algo que raramente acontece, pois o discurso não corresponde às práticas, especialmente em

cenários interiores, onde o grau de precisão tem obrigatoriamente de ser maior e o espaço para erros é

menor. Em detrimento da fala, podem ser usadas outras abordagens, como o retorno háptico ou sonoro

(não fala). No entanto, têm a desvantagem de ser menos expressivos e inadequados a algumas tarefas (e.g.

descrever um dado local).

3

Page 20: Blobby - ULisboa

A forma como o utilizador interage com o sistema é igualmente importante. Ter necessidades especiais

significa que são necessários mecanismos ou abordagens diferentes, que permitam a utilização eficaz do

sistema. Muitas vezes estes mecanismos não estão presentes, o que significa que uma parte ou a totalidade

do sistema não é acessível. Por exemplo, a navegação entre menus, a introdução de texto, efectuar procuras,

etc.

1.2. Abordagem PropostaPara fazer frente aos problemas da mobilidade e do custo, a nossa abordagem faz uso de dispositivos móveis

comuns. A interacção pessoa-computador deixou há muito tempo de ser exclusividade dos computadores de

secretária. Hoje em dia, existem inúmeros dispositivos que podem ser facilmente transportados e que fazem

parte do dia-a-dia do cidadão comum. É o caso dos telemóveis, cujo poder computacional e funcionalidades

têm vindo a aumentar, desde integração da câmara fotográfica e de vídeo, leitor mp3, calendário, Internet,

jogos, etc. Estes dispositivos trazem consigo um leque de novas potencialidades, especialmente no que diz

respeito à mobilidade, característica que os computadores pessoais não têm.

No entanto, muitos destes cenários de interacção estão inacessíveis à comunidade invisual, em particular, os

dispositivos com ecrãs tácteis. Através de um redesenho dos processos de interacção, a nossa abordagem

permite aos utilizadores invisuais aceder ao seu guia, através do seu dispositivo móvel tradicional.

Por outro lado, o sistema tem de ser capaz de guiar um invisual por um percurso desconhecido. Um estudo

centrado no utilizador é essencial para caracterizar e identificar as técnicas de orientação e mobilidade

utilizadas, assim como as informações mais relevantes num espaço interior. Igualmente importantes são

as formas de comunicação usadas por estes utilizadores. Como resultado destes estudos, foi proposta uma

forma de construção automática de instruções, tendo em conta o local e a localização do utilizador.

Concluindo, a nossa abordagem baseia-se na metáfora de um amigo invisual, que já conhece o local e

acompanha o utilizador, fornecendo-lhe instruções familiares e adequadas, para que este chegue ao seu

destino.

1.3. Resumo do trabalhoDe acordo com a nossa abordagem definimos como primeira prioridade um estudo do estado da arte na

área de sistemas de orientação para invisuais. Os sistemas vistos foram classificados segundo a abordagem

adoptada para localizar o utilizador: GPS, RFID, WLAN, Bluetooh, Infravermelho, Ultra-som e Processamento

de Imagem. Estes trabalhos foram depois comparados tendo em conta a sua tecnologia de localização e um

conjunto de características essenciais, tais como, fiabilidade, disponibilidade, alcance, velocidade, precisão,

4

Page 21: Blobby - ULisboa

hardware e custo. Para completar este estudo, os sistemas foram ainda comparados tendo em conta as suas

interfaces. A interface por fala, assim como a utilização de earcons e teclado mostraram ser as melhores

opções.

Com todo o conhecimento adquirido na área, foram identificados os principais problemas e limitações dos

sistemas actuais. O passo seguinte foi efectuar uma análise preliminar, onde os principais objectivos foram:

caracterizar o utilizador quanto ao seu perfil, conhecimentos tecnológicos e grau de independência; estudar

técnicas de mobilidade e orientação usadas pelos utilizadores; identificar as principais necessidades e

problemas; estudar a forma como constroem o mapa mental de um local e o verbalizam;

Os resultados mostraram que a esmagadora maioria dos invisuais necessita de ajuda para os guiar ou

contextualizar, sempre que visitam um local público desconhecido. Neste estudo centrado no utilizador,

conseguimos também identificar um conjunto de elementos e regras, provenientes da verbalização dos seus

mapas mentais, tendo em vista a construção automática de instruções.

Para validar a nossa abordagem, foi realizado um teste do tipo Feiticeiro de Oz. Este teste permitiu-nos

compreender os principais problemas e a complexidade da tarefa de guiar um utilizador invisual. O timing da

instrução, as ambiguidades no vocabulário e a detecção dos pontos de referência, mostraram ser os pontos

críticos do sistema.

Tendo já um vasto conhecimento do estado da arte, das características do utilizador e após criar um conjunto

de guias de desenho, estávamos finalmente prontos para a construção da interface. O protótipo final faz uso

da fala, som e retorno vibratório como interface de saída. Devido à crescente adopção e substituição dos

teclados por ecrãs tácteis, foi também implementado um método de introdução de texto e navegação em

menus para este tipo de dispositivos. O protótipo foi testado num cenário semelhante àquele em que foram

feitos os estudos iniciais e todos os utilizadores desconheciam o local. Os resultados obtidos foram bastante

satisfatórios e as instruções mostraram-se adequadas. Com este protótipo conseguimos validar um conjunto

de opções e regras que poderão ser de grande utilidade em trabalhos futuros nesta área.

1.4. ContribuiçõesEste trabalho permitiu-nos dar uma visão geral do que tem sido feito na área de interfaces para orientação

de invisuais e contribuir com um conjunto de aspectos que têm de ser levados em conta, aquando da sua

construção. Os principais contributos desta dissertação são:

Construção de uma interface para orientação de invisuais

Foi construída uma interface de orientação para invisuais. Esta interface tem como principais contributos

a geração automática de instruções e a contextualização do utilizador, de acordo com a sua posição. O

5

Page 22: Blobby - ULisboa

protótipo final, foi testado com utilizadores invisuais, num cenário desconhecido. Os participantes completaram

um percurso desconhecido, efectuando rotas muito semelhantes, o que revela uma fácil compreensão e

adequação das instruções à realidade. É de salientar que nenhum dos participantes teve qualquer treino

prévio, o que sugere um retorno familiar.

Implementação de um método interacção para invisuais em ecrãs tácteis

Foi implementado um novo método de interacção com ecrãs tácteis, que abrange as tarefas de navegação

entre menus e introdução de texto. Através do estudo com utilizadores invisuais, conseguimos validar a nossa

abordagem e permitir a este tipo de utilizadores interagir com ecrãs tácteis. De acordo com os resultados

obtidos, este método de interacção mostrou ser mais adequado que o sistema tradicional de introdução de

texto (i.e. Multitap), apresentando um maior desempenho e taxa de aprendizagem. Em relação à utilização

de teclados, esta nova forma de interacção mostrou ser mais rápida e eficaz.

Estudo centrado no utilizador

Esta é uma das principais falhas identificadas no estado da arte. Os sistemas actuais carecem de um

estudo centrado no utilizador, principalmente no que diz respeito ao retorno auditivo. A forma como estes

utilizadores exploraram, interpretam e transferem a informação de um local (interior), foi estudada com o

principal objectivo de formalizar a construção de instruções.

Estado da arte em sistemas de orientação para invisuais

Foram estudados e discutidos alguns dos principais sistemas de orientação para invisuais, com especial

interesse na sua tecnologia de localização e interface. Este estado da arte disponibiliza uma vista geral

desta área de investigação e poderá servir como ponto de partida para trabalhos futuros.

Caracterização do utilizador-alvo em relação ao uso de dispositivos móveis e grau de independência

Realizámos uma análise de tarefas com o objectivo de entender o que faziam os utilizadores e quais as

principais dificuldades que enfrentavam. Foram recolhidos dados sobre a utilização de dispositivos móveis,

as tarefas que neles executavam e o contexto em que eram usados. Foi também estudado o grau de

independência dos utilizadores, ou seja, se tinham por hábito deslocar-se sozinhos, que tipo de locais

visitavam, se necessitavam de ajuda e as principais dificuldades que encontravam. Esta caracterização teve

como principal resultado o facto dos utilizadores necessitarem quase sempre de ajuda em locais desconhecidos,

devido à falta de informação.

Guias de desenho para sistemas de orientação e respectivas interfaces

Com base na análise dos trabalhos da área e no estudo com utilizadores, foi definido um conjunto de guias

de desenho que deverão ser cumpridas, de modo a construir um sistema de orientação apropriado para

invisuais.

6

Page 23: Blobby - ULisboa

1.5. PublicaçõesO trabalho apresentado nesta dissertação deu origem a três publicações. Serão em seguida listadas, por

ordem cronológica de aceitação.

1. Guerreiro, T., Lagoá, P., Nicolau, H., Santana, P., Jorge, J., Mobile Text-Entry Models for People with

Disabilities, Proceedings of the European Conference on Cognitive Ergonomics (ECCE 2008), Madeira,

Portugal, Setembro 2008.

2. Lagoá, P., Nicolau, H., Santana, P., Guerreiro, T., Gonçalves, D. e Jorge, J., Acessibilidade Móvel:

Soluções para Deficientes Visuais, Actas da 3a Conferência Nacional em Interacção Pessoa-Máquina

(Interacção 2008), Évora, Portugal, Outubro 2008.

3. Guerreiro, T. , Nicolau, H., Lagoá, P., Gonçalves, D., e Jorge, J., From Tapping to Touching: Making

touch screens accessible to blind users, IEEE Multimedia, Special Issue on Accessibility, 2008, Aceite

para publicação.

1.6. Estrutura da DissertaçãoO restante desta dissertação é composto por cinco capítulos:

O segundo capítulo corresponde a um trabalho de investigação na área dos sistemas de orientação para

invisuais. Foram recolhidos os principais trabalhos e analisados segundo a sua tecnologia de localização

e interface utilizador. Neste capítulo, foram ainda identificados os principais problemas destes sistemas.

Após esta análise, foi proposta uma abordagem, no Capítulo 3, que tem como principal objectivo garantir

aos utilizadores um retorno auditivo familiar. Para este efeito, foram realizados estudos com utilizadores

invisuais, que tiveram como objectivo o levantamento de requisitos, assim como a criação de algumas guias

de desenho, para a construção de uma interface. Depois de uma avaliação preliminar da abordagem,

o Capítulo 4 descreve o protótipo criado, detalhando cada uma das suas componentes. Este protótipo

permitiu-nos avaliar o sistema com utilizadores e obter alguns resultados, disponíveis no Capítulo 5. Por

fim, o Capítulo 6 encerra esta dissertação, com uma discussão geral das vantagens e limitações do sistema

construído. São também apresentadas as principais conclusões desta investigação, assim como algumas

sugestões para trabalhos futuros nesta área.

7

Page 24: Blobby - ULisboa
Page 25: Blobby - ULisboa

2Trabalho

Relacionado

A área de sistemas de orientação e mobilidade para deficientes visuais tem vindo a ser alvo de muitos

trabalhos de investigação nas últimas duas décadas. Têm existido muitos e diferentes tipos de abordagens a

este problema. Esta diversidade de abordagens e os sistemas que geram têm como principal característica a

tecnologia que adoptam. Como irá ser descrito, existem diversas opções, como RFID, Infravermelhos, WLAN,

GPS, etc. Cada uma destas tecnologias apresenta várias vantagens e desvantagens e, com a excepção do

GPS, que tem sido globalmente aceite para ambientes exteriores, nenhuma das outras ainda vingou em

ambientes interiores.

Nesta secção encontram-se descritos grande parte dos trabalhos relacionados com sistemas de orientação

para ambientes interiores e exteriores, com especial foco no primeiro.

2.1. GPSO Sistema de Posicionamento Global ou GPS (do acrónimo do inglês Global Positioning System) é um

sistema de posicionamento por satélite, utilizado para a determinação da posição de um receptor na superfície

da terra ou em órbita. O GPS foi criado e é controlado pelo Departamento de Defesa dos Estados Unidos

e pode ser utilizado por qualquer pessoa, gratuitamente, necessitando apenas de um receptor que capte o

seu sinal. O sistema está dividido em três partes: espacial, de controlo e utilizador. O segmento espacial

é formado pela constelação de satélites. O segmento de controlo é composto pelas estações terrestres

dispersas pelo mundo ao longo da zona equatorial, responsáveis pela monitorização das órbitas, sincronização

dos relógios atómicos e actualização dos dados de almanaque dos satélites. O segmento do utilizador

consiste num receptor que capta os sinais emitidos. Este receptor tem a função de descodificar as transmissões

do sinal e calcular a sua posição, em termos de latitude, longitude e altitude.

9

Page 26: Blobby - ULisboa

2.1.1. Aplicações, Vantagens e DesvantagensEste sistema tem aplicações óbvias na aviação geral e comercial e na navegação marítima, mas qualquer

pessoa que queira saber a sua posição, encontrar um caminho para determinado local ou conhecer a

velocidade e direcção a que viaja, pode fazer uso do GPS. Este sistema tem-se tornado cada vez mais

popular entre ciclistas, pescadores, ecoturistas ou leigos. A comunidade científica utiliza-o muitas vezes pelo

seu relógio altamente preciso.

Na agricultura surgiu um novo conceito, agricultura de precisão [5]. Uma máquina agrícola, dotada de um

receptor de GPS, armazena dados relativos à produtividade e constrói um mapa de produtividade da lavoura.

Estas informações permitem optimizar a aplicação de correctivos e fertilizantes.

Recentemente, o GPS tem vindo a ser integrado em dispositivos comuns, como Personal Digital Assistants

(PDAs) ou telemóveis (Figura 2.1). As principais vantagens deste sistema são a sua alta disponibilidade,

custo e precisão. Apesar do sistema estar disponível em muitos locais, o seu sinal pode ser bloqueado por

infra-estruturas (e.g. edifícios), daí a sua utilização não ser apropriada em ambientes interiores.

Figura 2.1: Modelo N95 da Nokia, já com um receptor de GPS integrado.

2.1.2. Sistemas que usam GPSO sistema MoBIC Travel Aid (MOTA) [52], é composto por dois componentes principais, o MoBIC Pré-Journey

System e o MoBIC Outdoor System. O principal objectivo deste sistema é auxiliar um utilizador invisual a

programar a sua rota antecipadamente, tendo em conta todo o seu contexto (usando mapas, horários de

transportes, horários de abertura de edifícios, etc.) e posteriormente explorar esse trajecto, com a ajuda do

sistema.

O MOTA é constituído por um computador portátil com receptor de GPS, uma bússola e um sistema de

telecomunicações. Toda a interacção é feita a partir de um teclado e o output é dado através de um

sintetizador de voz. Em 1996, um sistema com estas características pesava cerca de 6kg. O MOTA apesar

de tentar resolver os principais problemas aos quais os deficientes visuais estão sujeitos, tem ainda algumas

10

Page 27: Blobby - ULisboa

falhas. O planeamento da rota é bastante complicado, visto que o sistema é baseado em mapas digitais

e ecrãs sensíveis ao toque. Grande parte dos utilizadores não ficou satisfeito com o uso de auriculares,

argumentando que podia bloquear sons ambientais. Por isso, os autores decidiram usar um telemóvel, para

que o utilizador pudesse ouvir instruções apenas quando desejasse. Um dos principais problemas deste

sistema é o facto da rota não poder ser modificada durante a viagem.

Um sistema mais recente, proposto por Marsh et al. [39], faz uso de um simples telemóvel com receptor GPS,

em detrimento dos 6kg de hardware usados no MOTA. Toda a interacção é feita a partir de mensagens SMS

enviadas para um servidor ou por diálogo directo com uma operadora. Esta interface tem, obviamente, a

desvantagem de não funcionar em tempo real, ou seja, o utilizador tem de esperar pela resposta do servidor.

As SMS’s recebidas são depois ouvidas, usando um sistema TTS (Text-to-Speech).

Os sistemas anteriores dão pouca ou nenhuma importância à tarefa de refazer uma rota durante a execução

do percurso. É exactamente esta a principal contribuição do Drishti [30]. O sistema está constantemente a

guiar o deficiente visual, baseando-se numa base de dados, que pode ser alterada por outros utilizadores ou

entidades responsáveis, com o objectivo de manter os mapas sempre actualizados e o mais detalhados

possível. Assim, uma rota pode ser dinamicamente refeita, caso seja necessário, sem intervenção do

utilizador. Este sistema usa a voz como interface de entrada e saída (Figura 2.2).

Figura 2.2: Exemplo de uma instrução do sistema Drishti.

Loomis et al. [37] realizaram um estudo com quinze participantes, com o objectivo de perceber qual a

interface mais adequada para um sistema de route guidance. Foram estudadas cinco interfaces diferentes

que faziam uso de fala/som 3D, uma bússola digital e um joystick. Das cinco interfaces, o virtual speech

foi o que apresentou o melhores resultados e obteve maiores níveis de satisfação junto dos utilizadores.

Mais uma vez, existiram algumas críticas quanto ao uso de auriculares. Nesta interface, era colocada uma

bússola digital na cabeça do utilizador e, através da sua posição e orientação, era emitido um sinal de fala

tridimensional, que indicava a distância até ao próximo destino. Este resultado foi semelhante ao obtido num

estudo anterior [36].

11

Page 28: Blobby - ULisboa

Mais tarde, os mesmos autores [40] provaram que, usando apenas retorno vibratório ou som (não fala), é

possível guiar um invisual por uma rota. Em ambos os casos, é colocada uma bússola digital na cabeça do

utilizador, de modo a obter a sua orientação. Ao contrário de Van Erp et al. [59], que usam um cinto com

oito vibradores igualmente espaçados, neste caso é usado apenas um. Dependendo se o utilizador está

dentro da rota ou não, é emitido o respectivo sinal. No caso em que o retorno é sob a forma de som 3D, o

comportamento é semelhante, bastando substituir a vibração por um sinal sonoro.

O sistema NOPPA descrito por Turunen et al. [58], cujo domínio são os serviços de informação para

transportes públicos, faz uso das capacidades dos dispositivos móveis actuais, para obter informações sobre

a localização e o contexto em que o utilizador está inserido. Esta aplicação faz uso da fala como modalidades

de entrada e saída de forma a simular um diálogo natural. No entanto, este diálogo é sempre guiado pela

aplicação e o utilizador apenas tem de responder de acordo com as suas necessidades (Figura 2.3).

Figura 2.3: Exemplo de um diálogo no sistema NOPPA.

Com o objectivo de conceber uma interface que pudesse ser usada por diversos tipos de utilizadores, Turunen

et al. [57] propõem uma interface multimodal que inclui: sintetização de fala, reconhecimento da fala, menus

fisheye, gestos, retorno táctil e earcons. Os menus fisheye, em conjunto com a voz podem ser usados

por utilizadores com alguma deficiência visual, mas também por pessoas visualmente capazes, que tenham

uma alta elevada cognitiva. O mesmo acontece na utilização de gestos (tilt, frente, trás) para navegar entre

menus. A utilização de earcons pode ser vantajosa em relação à fala, para transmitir uma mensagem de

forma rápida e pouco intrusiva, como por exemplo, ao chegar a uma paragem de autocarro ouvir o som

característico deste local. Por último, o retorno táctil consiste em pequenas vibrações que podem ter origem

em alguma operação que se distingue das restantes. Neste sistema, a câmara também não foi deixada de

fora e pode ser usada para receber mais informações sobre um objecto do mundo real, apontando-a para

este. Para utilizadores invisuais esta funcionalidade é pouco útil, por razões óbvias de utilização, mas poderia

ser substituída por um sistema que não necessitasse de retorno visual (e.g. RFID ou Bluetooth).

12

Page 29: Blobby - ULisboa

O SWAN [67] (System for Wearable Audio Navigation) é um sistema que tem o som (não fala) como única

modalidade de saída e uma mouse wheel com dois botões como entrada (Figura 2.4).

(a) Hardware usado. (b) Interface de navegação em

menus.

Figura 2.4: Sistema SWAN.

A posição do utilizador e a sua orientação são calculadas recorrendo a métodos de sensor fusion, entre GPS

e sensores de orientação (e.g. bússolas digitais), assim como as características contextuais em que está

inserido (e.g. obras no percurso ou horários de edifícios). O utilizador pode ainda gravar os seus movimentos

e rotas, para uso posterior e anexar mensagens de voz a objectos ou locais. Os autores defendem que as

interfaces por fala, que são muitas vezes usadas em sistemas de orientação, são demasiado intrusivas e

têm uma carga cognitiva bastante alta. Por isso, optaram por usar um sistema de som 3D, que faz uso de

earcons e auditory icons [8].

2.2. Bluetooth

Bluetooth é uma tecnologia emergente, de baixo consumo e alcance, que, através de ondas de rádio,

fornece uma forma de conectar e trocar informações entre dispositivos, como computadores portáteis, PDA’s,

telemóveis, impressoras, câmaras, etc. Os dispositivos podem comunicar entre si através de uma rede, onde

existe um "master" que pode comunicar com mais sete aparelhos. Este tipo de rede denomina-se piconet

e consiste numa rede ad-hoc, que usa os protocolos da tecnologia bluetooth para se conectar com outros

dispositivos.

Existem três classes de dispositivos Bluetooth, cada uma com as suas características de consumo e alcance.

As classes um, dois e três têm um alcance de um, dez e cem metros, respectivamente.

13

Page 30: Blobby - ULisboa

2.2.1. Aplicações, Vantagens e DesvantagensUma das aplicações mais populares no uso de Bluetooth são os kit’s de mãos livres [3] para telemóveis

(Figura 2.5). O uso de auriculares sem fios e outros dispositivos, que permitem controlar e comunicar com

telemóveis, foram das primeiras aplicações Bluetooth a ter uma grande adesão. Comunicação sem fios entre

dispositivos de entrada ou saída (rato, teclado, etc.) é também uma aplicação bastante usada hoje em dia.

Devido às suas vantagens, esta tecnologia veio substituir, em alguns casos, os controlos por infravermelho.

A lista de aplicações continua, desde a criação de pequenas redes sem fios, publicidade com base na

localização do utilizador, controlos remotos para consolas de vídeo jogos [9], etc.

Figura 2.5: Auricular Bluetooth para telemóveis.

Esta tecnologia permite criar pequenas redes de dispositivos, à semelhança do que acontece com a WLAN,

por isso, tem-se vindo a apostar também no Bluetooth tecnologia de localização. Anastasi et al. [4] descrevem

um sistema de localização interior, que poderá ter diversas aplicações, como por exemplo, de carácter

publicitário [2].

O Bluetooth tem como principais vantagens o seu baixo consumo e custo, a possibilidade de criar pequenas

redes sem fios e não haver necessidade de existir uma linha de visão entre o emissor e receptor. Como

contrapartida, tem um curto alcance e a sua velocidade de transferência é mais lenta, quando comparada

com a WLAN.

2.2.2. Sistemas que usam BluetoothApesar desta tecnologia ter um curto alcance, Bohonos et al. [10] criaram um sistema para ser usado

em ambientes exteriores, que permite a um utilizador invisual saber quando deve passar numa passadeira.

Como seria de esperar, o sistema não tem o objectivo de guiar o utilizador numa longa viagem, à semelhança

do GPS, mas auxiliá-lo numa das suas tarefas mais difíceis, que é a travessia de uma estrada. O sistema

funciona com base nas informações recolhidas de um controlador de trânsito e envia directamente para

o utilizador, através do seu telemóvel e de um sistema TTS, a indicação do estado do sinal. O sistema

consegue ainda informar o utilizador do tempo restante até à próxima transição do estado do sinal. Os testes

realizados mostraram resultados satisfatórios, mas existem ainda problemas de sobreposição de informação,

quando várias intersecções estão muito próximas.

14

Page 31: Blobby - ULisboa

2.3. RFIDRFID é o acrónimo do nome em língua inglesa Radio-Frequency IDentification. Consiste num método de

identificação automática através de sinais de rádio, para recuperar e armazenar dados remotamente, através

de dispositivos denominados leitores e etiquetas RFID.

Uma etiqueta RFID é um pequeno chip que pode armazenar dados (geralmente um identificador) e contém

uma antena, responsável por emitir sinais de rádio (Figura 2.6). Existem três tipos de etiquetas RFID:

passivas, activas e semi-passivas. As etiquetas passivas não necessitam de qualquer fonte de energia e

são activadas quando um leitor está por perto, para lhes fornecer essa energia. Têm um alcance desde os

dez centímetros até alguns metros, dependendo da frequência de rádio e antenas escolhidas. As etiquetas

activas, ao contrário das passivas, têm a sua própria fonte de energia, que é usada para alimentar os

circuitos integrados e enviar o sinal para o leitor. Muitas destas etiquetas têm alcances de centenas de

metros, baterias que duram cerca de dez anos e podem ser usadas em ambientes difíceis. As etiquetas

semi-passivas são muito semelhantes às activas, porque também têm a sua própria fonte de energia, mas

a bateria é usada apenas para alimentar os circuitos integrados e não para difundir o sinal. A energia é

reflectida para o leitor, tal como nas etiquetas passivas.

O leitor RFID é responsável por obter os dados armazenados nas etiquetas e, geralmente, converte as ondas

de rádio noutra forma, para que possam ser enviadas para outro sistema, como um computador ou PDA.

2.3.1. Aplicações, Vantagens e DesvantagensEsta tecnologia tem diversas aplicações, todas elas com o objectivo comum de identificar. Recentemente,

a cadeia de hipermercados Wal-Mart tem vindo a substituir os seus códigos de barras por etiquetas RFID,

devido às suas potencialidades de monitorização [65]. Um pequeno chip RFID implantado por baixo da pele,

pode fornecer automaticamente todo o registo médico de um paciente [27], reduzindo assim o tempo de

acesso e erros humanos.

Figura 2.6: Conjunto de etiquetas RFID.

15

Page 32: Blobby - ULisboa

Como seria de esperar, esta tecnologia pode também ser usada como tecnologia de localização. Os leitores

de RFID podem ser instalados em dispositivos que façam parte do dia-a-dia dos cidadãos, como os telemóveis

[34] e, espalhando várias etiquetas por um espaço, é possível monitorizar todas as deslocações de um

indivíduo.

As grandes vantagens do RFID são as pequenas dimensões e baixo custo das suas etiquetas. No entanto,

existem etiquetas de alto alcance, cujo preço é muito superior. Em ambos os casos a velocidade de

transmissão é a sua principal desvantagem.

2.3.2. Sistemas que usam RFIDA ideia do sistema The Chatty Environment [14] é o "mundo"falar com o utilizador. São espalhadas etiquetas

RFID por diversos objectos e sempre que o utilizador se aproxima de um, com o respectivo leitor, este

emite uma mensagem de voz. O sistema disponibiliza quatro opções: information, que permite obter mais

informações sobre um dado objecto/localização; actions, permite que o utilizador realize uma acção sobre

um dado objecto, por exemplo, abrir uma porta; leave traces, é uma forma de um utilizador deixar uma

mensagem ou acrescentar informação à tag RFID; take me there, permite que o utilizador seja guiado até à

entidade em causa.

S. Willis e S. Helal [66] descrevem um sistema clássico que usa esta tecnologia, para localizar um utilizador

invisual em ambientes interiores ou exteriores. As etiquetas RFID (passivas) são colocadas em pontos

estratégicos e contêm a sua localização (latitude e longitude), assim como outras informações acerca do

espaço. Os leitores podem ser integrados, por exemplo, no calçado ou na bengala. As etiquetas, apesar de

poderem ser instaladas em ambientes exteriores, devido às suas características e curto alcance, são mais

eficientes em cenários interiores.

2.4. Processamento de ImagemProcessamento de imagem é qualquer forma de processar informação, na qual a entrada é uma imagem,

como fotografias ou frames de um vídeo. A saída não tem de ser obrigatoriamente uma imagem, mas pode,

por exemplo, ser um conjunto de características da imagem. A maior parte das técnicas envolve tratar a

imagem como um sinal bidimensional, no qual são aplicadas técnicas de processamento de sinal [68].

2.4.1. Aplicações, Vantagens e DesvantagensUma das aplicações mais conhecidas e que tem sido uma área de investigação nos últimos anos, é a

detecção de faces, que, por sua vez, pode ser usada em sistemas de vigilância em tempo real [18]. Este é

o primeiro passo para o reconhecimento automático de faces, que hoje em dia já é utilizado para sistemas

de identificação, juntamente com outros sistemas de biometria, tal como foi descrito por E. Hjelmas e B. Low

16

Page 33: Blobby - ULisboa

[31]. Nos sistemas de orientação, estas técnicas são essencialmente usadas em conjunto com uma câmara

fotográfica ou de vídeo, de modo a poder identificar objectos, ou pessoas no cenário, como iremos ver em

seguida.

A principal vantagem deste tipo de abordagem é a inexistência de hardware especial ou qualquer instalação/manutenção

do local. Em contrapartida, tendo em conta o perfil do utilizador-alvo, este poderá ter dificuldades em lidar

com uma câmara. Por último, as condições ambientais em que o sistema opera têm de ser óptimas e

controladas.

2.4.2. Sistemas que usam Processamento de ImagemKawai et al. [35] criaram um sistema que permite inferir a posição do utilizador através da análise de imagens.

Foram colocadas três câmaras e auriculares num capacete e, à medida que o utilizador se desloca, é

feito o processamento de imagem, com o objectivo de reconhecer pontos ou objectos de interesse. Para

este efeito, é utilizado um sistema que permite obter informação tri-dimensional (3D) a partir de imagens

bidimensionais (2D) [56]. Depois de identificados os objectos, através da comparação com o modelo 3D,

estes são convertidos em mensagens sonoras tridimensionais. Mais uma vez, os utilizadores mostraram

algum desagrado pelo uso de auriculares. Em relação ao uso de som 3D, existiram alguns problemas na

diferenciação das direcções cima/frente e baixo/trás.

O sistema SINVI [13] foi criado especialmente para cenários interiores, mais concretamente corredores. A

câmara é montada no utilizador e, através da detecção de contornos, são identificadas portas, intersecções e

fim de corredores. A maior parte das pistas visuais são capturadas do tecto, por ter uma maior probabilidade

de estar iluminado. Os autores fazem uso das características comuns dos corredores (curvas, portas, fim do

corredor e estruturas no tecto), para conseguir inferir a posição do utilizador. O retorno é mais uma vez dado

através de pistas auditivas.

O sistema construído por Hub et al. [32], utiliza um modelo 3D de um cenário interior, para auxiliar os invisuais

na sua tarefa de orientação. Foi criado um dispositivo especial que pode ser anexado a uma bengala, como

uma espécie de lanterna. Este dispositivo é composto por: uma câmara, bússola e sensor de inclinação,

que permitem identificar os objectos e relacioná-los com o modelo 3D. É ainda usada uma rede WLAN para

comunicar com o servidor, responsável por fazer todo o processamento.

Este sistema tem a grande vantagem de não ser necessária qualquer instalação de hardware no local. Em

contrapartida, tem de ser feito um modelo 3D do cenário, que pode levar desde alguns dias a alguns meses.

Existe também a desvantagem do utilizador ter de estar constantemente a pedir ao servidor para identificar

objectos. Mais tarde, o algoritmo de reconhecimento de objectos foi alterado para detectar objectos não

estáticos, através da sua cor e forma [33].

17

Page 34: Blobby - ULisboa

Figura 2.7: Dispositivo com câmara, bússola e sensor de inclinação, integrado numa bengala.

J. Coughlan e R. Manduchi [16] usam o processamento de imagem como principal técnica para orientar um

deficiente visual. É usado um telemóvel, com câmara, de forma a identificar imagens que estão espalhadas

ao longo do edifício. Estas imagens têm de contrastar com todo o cenário, para que sejam facilmente

reconhecidas pelo algoritmo de processamento de imagem. Junto de cada imagem está um sinal em Braille,

que permite ao utilizador obter mais informações sobre todo o espaço, tal como na Figura 2.8. Apesar do

sistema ser relativamente simples e barato de implementar, apresenta alguns problemas. Em primeiro lugar,

o processo de "varrimento"de todo o cenário pode ser muito moroso e susceptível de erro, tendo em conta

o tipo de utilizador. Nos testes realizados, foram encontrados alguns problemas no reconhecimento das

imagens, devido ao movimento da câmara (motion). Outra limitação é a necessidade de saber ler Braille,

que pode ser colmatada usando outro tipo de sistema (e.g. substituir sinal Braille por etiqueta RFID).

(a) Um utilizador invisual com

um Nokia 7610.

(b) Imagem com três cores e o

respectivo sinal em Braille. A

imagem é utilizada para guiar o

utilizador até ao sinal.

(c) Uma versão da imagem com

quatro cores.

Figura 2.8: Sistema de orientação baseado no processamento de imagem, de uma câmara de vídeo, integrada num

telemóvel.

18

Page 35: Blobby - ULisboa

2.5. InfravermelhoRadiação infravermelha é uma parte da radiação cujo comprimento de onda é maior que o da luz (visível ao

olho humano), no entanto, menor que o das microondas [12]. O nome significa abaixo do vermelho (do latim

infra, "abaixo").

2.5.1. Aplicações, Vantagens e DesvantagensA transmissão de dados por infravermelhos é muito utilizada na comunicação, em curtas distâncias, entre

periféricos. Estes dispositivos, na maior parte dos casos, cumprem as normas publicadas pela IrDA [1],

Infrared Data Association. Os controlos remotos e outros dispositivos são compostos por um LED (do

acrónimo inglês light-emitting diode), que emite radiação infravermelha. O receptor, por sua vez, converte

essa radiação num sinal eléctrico. Devido ao seu curto alcance, este tipo de comunicação é muito usado em

ambientes interiores.

Os infravermelhos são também usados em equipamento de visão nocturna [15]. O uso da luz infravermelha

e os dispositivos de visão nocturna não devem ser confundidos com imagem térmica, que cria imagens

baseadas na diferença de temperatura de superfícies, emitindo radiação infravermelha (calor) [60].

Esta tecnologia necessita de pouca energia, é bastante fiável e portável. No entanto, o transmissor e receptor

têm de estar na mesma linha de visão. O sinal infravermelho tem a desvantagem de ser bloqueado por

materiais comuns, tais como paredes, pessoas, plantas, etc.

2.5.2. Sistemas que usam InfravermelhoUm sistema típico do uso desta tecnologia é o Locust Swarm [51], criado no MIT. Foi desenhado especialmente

para ambientes interiores, em que um conjunto de placas de infravermelho (IV), alimentadas por energia solar

e auto suficientes, estão espalhadas pelo edifício, para que os utilizadores possam interagir com elas.

O sistema Talking Signs [17] foi uma tentativa de ajudar deficientes visuais na sua necessidade de obter

informações à distância, para que se possam orientar em espaços desconhecidos. Os sinais (Talking Sign’s)

estão constantemente a enviar um sinal IV e o utilizador, através de um receptor, pode localizar e obter

a informação que lá está armazenada. Para além do seu elevado custo, este sistema apresenta outros

problemas que dizem respeito à sua utilização. O utilizador tem de estar, permanentemente, a varrer todo

o espaço à sua volta, na esperança de encontrar um sinal, tornando-se um processo bastante cansativo,

frustrante e moroso.

D. Ross e B. Blasch [47] descrevem alguns dos problemas da interface do sistema anterior, o Talking Signs

[17]. Os autores realizaram um conjunto de testes com três tipos de interfaces, não só vocacionadas para

19

Page 36: Blobby - ULisboa

Figura 2.9: Fotografia de um utilizador com as interfaces do sistema.

deficiências visuais, mas também para pessoas com limitações auditivas.

O sistema é constituído por uma bússola digital, um auricular, três "tapping contact speakers" e um computador

portátil, tal como ilustra a Figura 2.9. As três formas de interacção são: sonic carrot, em que é emitido um

sinal sonoro tridimensional; output falado, em que são dadas instruções de como chegar ao destino, por

exemplo, virar para uma hora, virar para as nove horas, etc.; shoulder tapping, em que as indicações são

dadas por pequenas vibrações nas costas do utilizador, indicando uma direcção. Pelos testes realizados,

os utilizadores mostraram grande satisfação na combinação das interfaces de fala e vibrações. Apesar de

ser uma interface bastante completa, todo o hardware que o utilizador tem de transportar e o seu preço são

características a ter em conta.

2.6. WLAN

WLAN ou Wireless LAN (Wireless Local Area Network ) é uma rede local que usa ondas de rádio para fazer

uma conexão entre dois ou mais computadores. Isto dá aos utilizadores a possibilidade de se deslocarem

dentro da área que está coberta e manterem-se ligados à rede.

A tecnologia WLAN é definida pela família de especificações IEE 802.11. Existem actualmente quatro

especificações: 802.11a, 802.11b, 802.11g, 802.11n. Ambas usam os protocolos Ethernet e CSMA/CA

(Carrier Sense Multiple Access with Collision Avoidance). A diminuição dos custos do equipamento WLAN, a

facilidade de instalação e a crescente popularidade dos computadores portáteis, PDA’s, telemóveis e outros

dispositivos, trouxe este tipo de conecção para o mercado doméstico. Serviços públicos, como estações de

comboio ou metro, centros comerciais e aeroportos, começaram também a oferecer aos seus clientes acesso

a redes sem fios.

20

Page 37: Blobby - ULisboa

2.6.1. Aplicações, Vantagens e DesvantagensGrandes projectos para a cobertura de cidades inteiras estão a ser iniciados. É o caso do Google, que

fornece um serviço totalmente grátis em Mountain View, Califórnia [25]. Este tipo de serviço permite a um

conjunto de computadores ligarem-se entre si, formando uma rede local, mas também ligar-se a outras redes,

como por exemplo a Internet.

As empresas de telecomunicações móveis têm reconhecido que este tipo de tecnologia irá ser crucial na

transmissão de dados, num futuro próximo e têm vindo a integra-la na sua arquitectura [38]. Esta situação

deve-se às vantagens que estas redes apresentam sobre as redes móveis (i.e. mais rápidas e baratas). No

entanto, a sua cobertura ainda é bastante limitada, impedindo que seja usada a nível global.

A WLAN também tem sido alvo de investigação, para ser usada como tecnologia de localização. Mesmo

que o seu uso esteja ainda muito limitado a alguns ambientes interiores, com o seu rápido crescimento e

adopção, pode no futuro ser bastante útil. É o caso dos sistemas [7, 63] que usam técnicas baseadas na

força de um sinal de rádio para localizar um dispositivo numa área coberta por WLAN.

As principais vantagens deste tipo de redes são o seu alcance, facilidade de instalação, possibilidade de

ligação a outras redes e a velocidade de transmissão.

2.6.2. Sistemas que usam WLANO LaureaPOP [43] é um sistema bastante recente, que consiste na continuação do trabalho NOPPA [61], mas

que inclui um módulo interior. O utilizador precisa apenas de um telemóvel com acesso a WLAN e, através de

um software de posicionamento, o Ekahau Positioning Engine (EPE) [21], é calculada a sua posição. Existe

também um servidor, responsável por traçar rotas, guiar e comunicar com o utilizador, ao longo de todo o

processo. Esta comunicação entre o servidor e o dispositivo móvel, é feita através do protocolo VoIP. Para

completar a interface, é usado um kit de mãos livres, com ligação por Bluetooth. No entanto, os autores não

deixam claro como o sistema constrói as rotas ou instruções que serão dadas aos utilizadores.

2.7. Ultra-SomUltra-som é um som a uma frequência superior àquela que o ouvido humano pode perceber (aproximadamente

20.000 Hz). O que nos impede de ouvir o ultra-som é o ouvido médio, que actua como um filtro passa-baixo.

Porque nos humanos o limite da frequência máxima até ao qual se consegue ouvir vai diminuindo com a

idade [54], uma companhia de telefones desenvolveu um toque, que supostamente só pode ser ouvido por

crianças [62].

21

Page 38: Blobby - ULisboa

2.7.1. Aplicações, Vantagens e Desvantagens

A ultra-sonografia ou ecografia é um método de diagnostico que aproveita o eco produzido pelo som para

ver, em tempo real, as reflexões produzidas por músculos, tendões e órgãos do organismo. O ultra-som tem

sido utilizado neste tipo de procedimentos há mais de cinquenta anos e é um dos métodos mais usados na

medicina moderna.

Uma aplicação comum do ultra-som é o SONAR (SOund Navigation And Ranging). Este sistema emite ondas

numa direcção e, caso existam objectos no caminho, é medido o tempo entre a transmissão e a recepção do

sinal, de forma a obter a posição dos obstáculos. Na água, consegue-se uma precisão muito superior, visto

que a velocidade de propagação do som é muito maior do que no ar, podendo atingir os 1498 km/h. Esta

tecnologia é, no entanto, bastante sensível a interferências, principalmente sons cintilantes.

2.7.2. Sistemas que usam Ultra-Som

O sistema Drishti anteriormente descrito [30], veio mais tarde possibilitar a navegação em ambientes exteriores

e interiores [45]. O módulo de navegação interior usa um sistema de posicionamento de ultra-som e pretende

dar ao utilizador invisual uma visão geral do espaço, distâncias e informações entre dois pontos, assegurando

assim uma deslocação segura (evitando obstáculos estáticos). No local, têm de estar instalados os pilots do

sistema ultra-som e o mapa previamente carregado na base de dados, com toda a mobília, paredes, etc. O

utilizador, para além do hardware usado no módulo exterior, tem de usar mais dois beacons nos ombros. A

Figura 2.10 mostra um exemplo de um diálogo deste sistema.

Figura 2.10: Exemplo de um diálogo do sistema Drishti, num espaço interior.

22

Page 39: Blobby - ULisboa

2.8. Sistemas HíbridosNesta secção, estão todos os sistemas interiores que não se enquadram em nenhuma das secções anteriores,

por usarem, não apenas uma tecnologia, mas uma combinação de várias.

O sistema Talking Braille [48] é baseado na metáfora do trilho de migalhas. Como tal, consiste num conjunto

de sinais (Talking Braille Signs) que são activados por IV ou FR (frequência de rádio). O utilizador leva

consigo um telemóvel, um auricular e um receptor (CharmBadge receiver). É um sistema muito parecido

com o Talking Signs [17] e tem o seguinte modo de funcionamento: o utilizador, ao entrar no edifício usa o

seu receptor para localizar o primeiro sinal, que está ligado a um quiosque informativo e permite-lhe, usando

o seu telemóvel, aceder a todos os pontos de interesse e planear a sua rota. Em seguida, o utilizador vai

sendo guiado de sinal em sinal (trilho de migalhas) até ao seu destino. Neste sistema não é feita qualquer

referência à interface do telemóvel, nem à forma como o utilizador planeia ou refaz a sua rota. O hardware

utilizado é muito específico e, por isso, o preço é um entrave à sua instalação. Com os testes realizados,

foram também identificados alguns problemas na coordenação das mensagens enviadas pelos vários sinais

aos utilizadores.

2.9. DiscussãoNesta secção e após termos visto alguns dos principais sistemas de orientação para invisuais, irão ser

retiradas algumas conclusões acerca das abordagens, tecnologias e interfaces usadas. Vão também ser

descritas as falhas das aplicações existentes e definidas as principais características de um sistema de

orientação para invisuais.

2.9.1. Comparação entre TecnologiasAo longo deste capítulo, foram descritos vários sistemas e respectivas tecnologias. Nesta secção, essas

tecnologias vão ser comparadas, com base num conjunto de características: fiabilidade, disponibilidade,

alcance, velocidade, hardware e custo.

2.9.1.1. Fiabilidade

Fiabilidade é a capacidade de uma dada tecnologia manter o seu normal funcionamento sob interferências,

ruído ou outras circunstâncias indesejáveis. Um sistema de orientação tem de fazer uso de uma tecnologia

fiável, para que funcione correctamente e com o menor número de erros possível.

O processamento de imagem faz, obrigatoriamente, uso de uma câmara de filmar ou fotográfica, para que a

análise das frames recolhidas seja efectuada. Um sistema que faça uso deste tipo de técnica depende muito

23

Page 40: Blobby - ULisboa

da análise de cores e contornos. Como tal, as condições ambientais têm de ser "perfeitas". Num ambiente

interior, apesar de ser mais fácil garantir essas condições, a iluminação dos locais pode sempre ser alterada,

devido à existência de janelas, falha das lâmpadas, etc.

A tecnologia infravermelha é conhecida como sendo imune a interferências e ruído, mas é facilmente bloqueada

pela maior parte dos objectos sólidos, paredes, pessoas, plantas, etc.. Ou seja, tem de existir uma linha de

visão entre os dois dispositivos. Helal et al. [45] fizeram vários testes ao seu sistema, de modo a simular um

ambiente interior, recorrendo à fala, gritos, música, chaves a tilintar, etc, de modo a comprovar a fiabilidade

do ultra-som. Sons com altas-frequências, como chaves a tilintar, interferem com um sistema ultra-som,

deixando-o bastante instável.

Todas as outras tecnologias, RFID, WLAN e Bluetooth, como todas as frequências de rádio, estão sujeitas

a uma grande variedade de interferências ou efeitos de propagação. No entanto, este tipo de tecnologia

apresenta níveis de fiabilidade bastante bons.

2.9.1.2. DisponibilidadeA disponibilidade de uma tecnologia indica a facilidade de acesso à mesma. Um sistema que use uma

tecnologia com baixa disponibilidade tem fortes probabilidades de nunca vir a ser útil ou sequer utilizado.

Os sistemas ultra-som são muito utilizados na medicina, mas com um propósito muito diferente do que é

aplicado nos sistemas de orientação. Este tipo de tecnologia não se encontra muito difundido no mercado,

ao contrário do Bluetooth, que já está disponível em qualquer telemóvel das novas gerações e pode ser

utilizado entre quaisquer dois dispositivos, através de uma rede ad-hoc. A WLAN tem vindo a ser instalada

em muitos locais públicos e cada vez mais em nossas casas, muito devido à difusão dos computadores

portáteis. No entanto, a sua instalação ainda se encontra muito limitada. Nos dias que correm, tal como o

Bluetooth, a integração de câmara fotográfica ou de vídeo nos telemóveis é bastante comum. Isto possibilita

que técnicas de processamento de imagem possam ser feitas a partir de qualquer telemóvel, não sendo

necessário adquirir hardware especializado. O RFID é outra tecnologia emergente e que tem sido muito

falada como substituta dos códigos de barras. No entanto, esta mudança ainda não sucedeu por completo.

2.9.1.3. AlcanceO alcance de uma dada tecnologia pode ser um factor determinante para saber com exactidão a localização

e todos os movimentos de um utilizador, ao longo do seu percurso. Esta característica está intimamente

relacionada com a área que se pretende abranger e o número de dispositivos que têm de ser instalados para

a cobrir.

Sem dúvida, o sistema com maior alcance é o GPS, que tal como o nome indica, pode ser usado globalmente,

excepto dentro de edifícios. As etiquetas RFID podem ter um alcance desde trinta centímetros (etiquetas

24

Page 41: Blobby - ULisboa

passivas) a algumas centenas de metros (etiquetas activas). O processamento de imagem, dependendo da

natureza dos artefactos que estão a ser identificados, pode variar desde alguns centímetros a alguns metros.

Os infravermelhos são usados em especial nos ambientes interiores exactamente pelo seu curto alcance

de alguns metros. À semelhança do infravermelho, o ultra-som também é usado para distâncias de alguns

metros, apesar de sistemas como o SONAR poderem atingir distâncias de dezenas de quilómetros, mas

em ambientes totalmente diferentes. Uma WLAN típica tem um alcance na ordem das dezenas de metros,

mas pode ser facilmente estendida, com a adição de repetidores, chegando a atingir algumas centenas de

metros. O Bluetooth é uma tecnologia tipicamente, de curto alcance, mas, dependendo da sua classe pode

variar desde um a cem metros.

2.9.1.4. VelocidadeNos sistemas em que as informações não estão associadas apenas a um dispositivo, mas a um conjunto, a

troca de informação é indispensável e a velocidade a que esta é transferida pode ser muito importante para

os tempos de resposta do sistema.

As quatro tecnologias que irão ser comparadas são WLAN, infravermelho, Bluetooth e RFID. Estas tecnologias

têm, por si só, objectivos e papéis diferentes, no que diz respeito à comunicação entre dispositivos. A

WLAN foi criada para substituir os cabos que ligam uma rede, de modo a oferecer mais mobilidade, ao

contrário das outras três tecnologias, que são utilizadas para troca de pequenas quantidades de informações

entre dispositivos a curtas distâncias. Logo, é de esperar que a WLAN apresente maiores velocidades de

transferência de dados, seguida do Bluetooth, infravermelho e RFID.

2.9.1.5. Hardware necessário e CustoO custo associado a uma tecnologia e ao respectivo hardware está geralmente ligado à sua aceitação no

mercado, quer seja individualmente ou integrado noutros dispositivos. Este custo também está geralmente

associado a outras características como o alcance, fiabilidade, etc.

As tecnologias mais baratas são aquelas que já se encontram incorporadas em dispositivos comuns. É o

caso do Bluetooth, que hoje em dia já está disponível em qualquer computador, PDA ou telemóvel. Para

utilizar esta tecnologia em sistemas de localização é necessária a instalação de alguns beacons Bluetooth,

por forma a cobrir a área desejada. No caso da WLAN o seu alcance é muito maior, mas em contrapartida

o seu preço também o é. Cada vez mais, esta é uma tecnologia acessível a partir de dispositivos comuns,

como PDA’s ou telemóveis. O infravermelho é uma tecnologia mais antiga que, por exemplo, o Bluetooth, mas

os seus preços podem ser equiparados. O processamento de imagem só é possível através de uma câmara

fotográfica ou de filmar e, com a integração destes dispositivos em telemóveis, é uma técnica relativamente

barata. Mas devido às limitações de processamento dos telemóveis, normalmente é usada em conjunto com

a WLAN ou outras tecnologias de transferência de dados. Por último, o custo de um receptor GPS pode ser

equiparado a uma WLAN doméstica (sem repetidores) ou leitor de RFID.

25

Page 42: Blobby - ULisboa

2.9.1.6. PrecisãoA precisão, num sistema de orientação, é bastante importante, pois permite saber com exactidão a posição e

o deslocamento de um utilizador. Quanto maior for esta precisão, maiores são as possibilidades do sistema

ser aceite e mais detalhadas poderão ser as suas indicações.

A precisão associada a uma tecnologia está inerente a todo o trabalho de investigação, baseado em tecnologias

de localização. Ao analisar o grau de precisão de uma tecnologia temos de ter em conta o rácio entre o seu

alcance e o erro (DOP - Dilution of Precision). Técnicas de medição da força dos sinais de rádio(e.g. WLAN’s,

Bluetooth ou RFID) são uma área de investigação que continua bastante activa [7, 42, 53, 63]. A precisão

que estas técnicas podem oferecer depende muito do número de pontos de acesso ou beacons, que se

deseja instalar e das características do próprio local, mas geralmente apresentam erros de alguns metros.

Ao contrário das tecnologias anteriores, o GPS pode ser usado globalmente, em ambientes exteriores e tem

um erro mínimo de um metro.

2.9.1.7. ConclusõesCada tecnologia tem as suas vantagens e desvantagens, tendo em conta cada problema em particular.

Uma das principais conclusões deste estado-da-arte, ao comparar cada uma das tecnologias existentes

em sistemas de orientação, é que o Bluetooth e a WLAN são cada vez mais utilizadas como tecnologias de

localização. A WLAN tem sido instalada em muitos locais públicos, como estações, cafés, centros comerciais,

etc., o que faz de si um potencial meio para obter a localização de um utilizador. Uma das vantagens de

instalar este tipo de infra-estrutura é a diversidade de aplicações que poderá oferecer.

O Bluetooth é uma tecnologia bastante recente, que tem como principal vantagem o seu baixo custo e

consumo. Apesar de ter um curto alcance, que pode ser o suficiente para um ambiente interior, já deu

origem a muitas aplicações, algumas delas para substituir o antigo infravermelho. O Bluetooth não veio, nem

pode, competir directamente com a WLAN, mas em vez disso, estas duas tecnologias complementam-se.

Ambas estão em posição de vingar no mercado da comunicação móvel, talvez mais do que qualquer outra.

O infravermelho é uma tecnologia já antiga que, à semelhança do Bluetooth, é usada para a comunicação

entre dispositivos a curtas distâncias. Tem a grande desvantagem de ambos os dispositivos terem de estar na

mesma linha de visão. No entanto, é uma tecnologia bastante estudada, barata e que já mostrou resultados

práticos. Hoje em dia, está a cair em desuso e a ser substituída pelo Bluetooth, devido às vantagens que

este apresenta.

O RFID é também usado para a comunicação a curtas distâncias, mas tem uma forma de funcionamento

muito diferente. É utilizador como etiqueta ou código de barras, que pode conter mais informação, alterável

ao longo do tempo. As etiquetas passivas são de baixo custo e não necessitam de qualquer tipo de bateria

ou fonte de energia, sendo apenas activadas por um leitor RFID. Por ser uma solução económica, é usada

26

Page 43: Blobby - ULisboa

muitas vezes para localizar o utilizador numa grelha ou trilho de etiquetas. Este tipo de sistemas pode ser

vistos como sinais em Braille, mais ricos em informação e que podem ser lidos à distância. Como cada

etiqueta está limitada à sua capacidade de armazenamento, por vezes torna-se necessária a instalação de

uma rede sem fios (e.g. WLAN ou Bluetooth), para que possam ser armazenadas maiores quantidades de

informação.

O processamento de imagem é também uma área de grande interesse e que tem gerado diversas abordagens.

No entanto, as condições ambientais, assim como o movimento da câmara são um factor crucial e que têm

um impacto directo na fiabilidade dos sistemas. Apesar das câmaras de filmar ou fotográficas poderem ser

facilmente encontradas nos telemóveis actuais, a sua capacidade de processamento ainda é limitada e por

isso raramente são usados por si só.

O ultra-som é uma tecnologia que é muito usada em detecção de obstáculos, devido às suas características

e modo de funcionamento. Os sistemas de orientação que usam esta tecnologia fazem uso exactamente

destas características para localizar o utilizador e dar-lhe instruções. A instalação desta tecnologia num

ambiente interior, ao contrário do que acontece com a WLAN, seria para uso exclusivo do sistema de

orientação, logo, teoricamente não será tão rentável.

Por último, o GPS é o sistema mais usado em orientação, mas ao contrário das tecnologias vistas anteriormente

só pode ser usado em ambientes exteriores. Neste tipo de ambiente, o sistema apresenta vantagens

que mais nenhuma tecnologia é capaz de oferecer, como o seu alcance, disponibilidade e fiabilidade. A

tabela 2.1 resume as comparações que foram feitas entre as diversas tecnologias, sendo uma estrela a pior

classificação e três estrelas a melhor.

Tabela 2.1: Comparação entre tecnologias.

27

Page 44: Blobby - ULisboa

2.9.2. Comparação de InterfacesAo longo deste estudo, foram descritos vários sistemas de orientação e respectivas interfaces. Neste secção,

irão ser comparadas, com base num conjunto de características: modalidade de entrada, modalidade de

saída, hardware e custo.

2.9.2.1. Modalidade de Entrada

A forma como o utilizador, deficiente visual, interage com o sistema é uma característica fundamental para a

sua adopção. Enquanto uma pessoa visualmente capaz consegue usar um conjunto de periféricos comuns

(e.g. rato ou teclado), juntamente com as mais diversas pistas visuais, um invisual necessita de novos

mecanismos de interacção.

Existem três modalidades principais de interacção com um dispositivo móvel. São elas: fala, gestos ou

teclado. Cada uma destas modalidades tem as suas vantagens e desvantagens e podem, muitas vezes,

completar-se. Tendo em conta o tipo de utilizadores a que estes sistemas se destinam, a fala é muitas

vezes utilizada como modalidade de entrada. A fala pode substituir uma interface gráfica, por ser um

mecanismo natural de interacção, no entanto, os reconhecedores de fala actuais para dispositivos móveis

ainda apresentam alguns problemas de desempenho e fiabilidade. Além disso, este método de interacção

pode ser impraticável em cenários ruidosos.

Os gestos são uma forma rápida e pouco intrusiva de executar uma acção. No entanto, a sua utilização

implica a existência de hardware especial. Hoje em dia, a existência de acelerómetros é cada vez mais

comum e é possível que, no futuro, possamos vir a presenciar novos métodos de interacção. É também

possível detectar gestos simples, através de uma câmara e, neste caso, qualquer telemóvel poderá ter esta

funcionalidade. Uma das desvantagem poderá ser a sua aceitação social.

O teclado é, com certeza, o método de interacção com maior disponibilidade nos dispositivos móveis actuais

e também o que apresenta maior fiabilidade. Algumas soluções passam por criar teclados em Braille. No

entanto, estes apresentam uma menor disponibilidade. A tabela 2.2 resume a comparação das modalidades

vistas anteriormente.

Tabela 2.2: Comparação entre modalidades de entrada.

28

Page 45: Blobby - ULisboa

2.9.2.2. Modalidade de Saída

Um sistema de orientação tem de ser eficaz na forma como orienta um utilizador, especialmente no caso

deste não conseguir validar as instruções dadas pelo sistema, através de pistas visuais.

As modalidades de saída usadas neste tipo de sistemas têm de ser não convencionais, ou seja, não fazem

uso de uma interface gráfica. Como modalidades alternativas, temos a fala ou o som (earcons ou auditory

icons), que podem ser emitidos em mono, estéreo ou com uma terceira dimensão. Por último, o retorno ao

utilizador pode ser dado através do tacto, ou seja, por vibração ou força. A tabela 2.3 resume a comparação

das modalidades de saída.

Tabela 2.3: Comparação entre modalidades de saída.

2.9.2.3. Conclusões

Pela tabela 2.4, podemos ver que a modalidade de entrada mais utilizada é a fala. Esta é, talvez, a forma mais

natural de interacção com uma máquina. No entanto, estes sistemas [45, 57, 58] fazem uso de servidores

remotos, responsáveis por reconhecer a fala do utilizador. Isto porque os reconhecedores actuais para

dispositivos móveis ainda apresentam alguns problemas de desempenho e fiabilidade. Logo, o custo e

hardware do sistema são aspectos a ter em conta.

Como alternativa, temos os gestos, que podem ser usados como atalhos para acções ou navegação em

menus [57]. Os gestos são detectados, normalmente, por hardware especial (e.g. acelerómetros) ou por

uma câmara. Esta modalidade tem a vantagem, em relação à fala, de poder ser usada em ambientes

ruidosos.

Por último, temos o teclado (comum), que se apresenta como a opção mais viável, pela sua disponibilidade,

fiabilidade e custo. Esta escolha não quer necessariamente dizer que existirão apenas alguns comandos

pré definidos e associados a cada tecla, como acontece em vários sistemas. Terão de existir abordagens

que permitam a um deficiente visual utilizar o teclado de uma forma eficiente e realizar as mesmas tarefas

que um utilizador visualmente capaz (introduzir texto, fazer pesquisas, navegar entre menus, etc.). Todos os

29

Page 46: Blobby - ULisboa

sistemas presentes na tabela 2.4 têm um custo equiparável.

Tabela 2.4: Comparação entre interfaces.

Em relação às modalidades de saída, o áudio é, sem surpresas, o mais utilizado. Uma alternativa é o uso

de retorno táctil, vibratório ou háptico. O retorno vibratório é bastante limitado na sua expressividade e serve

geralmente para indicar a ocorrência de um acontecimento [37, 47, 57]. O retorno háptico, apesar de ter

uma maior expressividade que a vibração, tem também um maior custo e menor portabilidade, devido ao

hardware necessário.

O áudio pode ser dividido em duas classes: fala e não fala. Pode ainda ser classificado segundo a sua

dimensão: mono, estéreo ou 3D. Wilson et al. [67] argumentam que a utilização de áudio (não fala) é mais

apropriada para sistemas de orientação, devido à sua baixa carga cognitiva e flexibilidade. No entanto, um

sistema que use apenas áudio (não fala) para guiar um utilizador invisual tem de fazer uso de som 3D, que,

apesar de apresentar uma menor carga cognitiva, está constantemente a ser repetido e pode ser bastante

incomodativo. Para além disso, é necessário o uso de dois auriculares, que têm o inconveniente de poder

bloquear sons ambientais. Um sistema de orientação deve ser capaz de contextualizar o utilizador, indicando

os pontos de interesse, perigos ou outras informações do local. Utilizando apenas áudio (não fala) é bastante

difícil conseguir esta funcionalidade.

Uma alternativa será usar a fala para interacções mais complexas, como instruções ou descrições e earcons

ou auditory icons para contextualizações de menor importância, às quais o utilizador poderá pedir mais

30

Page 47: Blobby - ULisboa

detalhes. Para combater a carga cognitiva que é necessária com a modalidade de fala, podem ser usadas

outras modalidades, como a vibração, para indicar a necessidade de atenção.

A utilização de auriculares torna-se apropriada em cenários ruidosos ou quando o som tem mais de uma

dimensão. No entanto, existe o incómodo de bloquear os sons ambientais, que são extremamente importantes

para um invisual. Como alternativa, o retorno auditivo pode ser ouvido directamente do dispositivo (e.g.

telemóvel). Neste caso, o utilizador teria de saber quando ouvir a mensagem, através de algum aviso sonoro

ou vibratório. O uso directo do telemóvel, em vez de um auricular, tem a desvantagem do utilizador ter de

estar constantemente com o dispositivo na mão. Talvez uma combinação destas duas abordagens seja a

mais indicada, em que o utilizador pode optar por um retorno constante ou com avisos. Ambas só poderão

ser avaliadas e comparadas através do estudo com utilizadores, de forma a identificar a mais indicada.

2.9.3. Limitações das Aplicações ActuaisEm ambientes exteriores, têm sido desenvolvidos inúmeros sistemas de orientação para invisuais usando

GPS [36, 39, 52]. No entanto, este sistema não é uma solução viável para ambientes interiores, porque

o seu sinal é bloqueado pelas infra-estruturas dos edifícios. Ou seja, é necessária uma nova solução, à

semelhança do que acontece no exterior, comum a todos os sistemas de orientação.

Grande parte dos sistemas actuais estão dependentes da sua tecnologia de localização, tornando-se uma

das suas principais limitações. São necessárias novas aplicações, mais modulares e flexíveis, que permitam

integrar novas abordagens de localização, independentemente da sua tecnologia.

As pessoas, no seu dia-a-dia, deslocam-se tanto em ambientes interiores como exteriores. A maior parte

dos sistemas actuais funciona apenas num tipo de ambiente, logo, um utilizador teria de ter dois dispositivos

diferentes para poder realizar as suas tarefas diárias. Caso as aplicações façam uso de dispositivos comuns,

então o utilizador apenas teria de instalar duas aplicações distintas. Mesmo assim, para um invisual, pode

ser difícil distinguir entre os dois tipos de cenários e não saber qual das aplicações usar.

O custo e a manutenção de um sistema são características bastante importantes para que este seja adoptado

na maioria dos edifícios e estão intimamente relacionadas com a escolha das tecnologias de localização.

Logo, são necessários sistemas ubíquos e de custo reduzido, para que a sua adopção e penetração no

mercado possa ser maximizada.

Outra limitação reside na própria funcionalidade de um sistema de orientação. Este tem como principal

objectivo fornecer um conjunto de instruções, para que o utilizador chegue a um destino. Para um invisual,

isto não é suficiente. Enquanto uma pessoa visualmente capaz, ao entrar num edifício desconhecido,

consegue facilmente perceber o contexto em que está inserida (através das mais variadas pistas visuais),

um deficiente visual poderá ter dificuldades na percepção das dimensões, pontos de interesse (recepção,

31

Page 48: Blobby - ULisboa

WC, etc.) ou perigos existentes (e.g. escadas rolantes ou portas automáticas). Logo, para além de guiar o

utilizador, este tipo de sistemas tem de ser capaz de o contextualizar, sempre que necessário.

Por último, uma das principais falhas dos sistemas actuais é a falta de estudo com os utilizadores. Ao

construir uma interface que tem como objectivo dar instruções, surgem um conjunto de perguntas que

devem ser respondidas: qual a melhor forma de guiar um invisual? como é que este tipo de utilizadores

se comporta? como se desloca? quais as técnicas que usa? qual a sua carga cognitiva? etc. Em relação à

contextualização, surge igualmente outro conjunto de perguntas: quais as informações que são relevantes?

quando devem ser dadas as informações? quais os perigos? como deve ser dada esta informação?

etc. Todas estas questões devem ser respondidas antes da construção dos sistemas, de forma a originar

aplicações mais adequadas. Podemos também ter em conta o perfil do utilizador a que se destina o sistema,

ou seja, a forma como a aplicação se comporta pode fazer uso das capacidades do utilizador. Por exemplo,

o tipo de cegueira, os problemas auditivos, o grau de escolaridade, o grau de independência, a idade, a

carga cognitiva, as restrições de tempo e os seus interesses, são características que podem ser estudas e

que devem influenciar a forma como o utilizador é guiado. Concluindo, é necessário um estudo centrado no

utilizador, que tenha em linha de conta todos estes aspectos e que irão certamente trazer um novo conjunto

de possibilidades e restrições.

2.9.4. Características do Sistema de OrientaçãoUm sistema de orientação tem de ser desenvolvido com base num conjunto de características, para poder ter

sucesso. Sendo especialmente criado para utilizadores com necessidades acrescidas, tem de ter também

outras características que os sistemas de orientação comuns não possuem. Em seguida, estas irão ser

apresentadas, com uma breve descrição, assim como a sua importância para o utilizador final.

2.9.4.1. Fiabilidade

A fiabilidade de um sistema deste tipo é uma característica crucial. Dar uma indicação errada a um utilizador

invisual, num ambiente que ele próprio desconhece ou num momento em que este se encontra desorientado,

iria baixar exponencialmente o seu nível de confiança em relação ao sistema. Para além disso, informações

erradas podem colocar a integridade física da pessoa em risco, ao direccioná-la erradamente para os

diversos perigos existentes.

2.9.4.2. Disponibilidade

Disponibilidade é uma medida que indica o tempo que um sistema está operacional. Num sistema de

orientação, pode ser vista como a medida que indica a quantidade de locais em que a aplicação pode

ser usada. Esta característica está depende não só do próprio sistema, mas também da(s) tecnologia(s) de

localização que este suporta.

32

Page 49: Blobby - ULisboa

2.9.4.3. Escalabilidade

Um sistema escalável indica que, após a instalação de mais hardware, a sua performance aumenta proporcionalmente

às suas capacidades. Se existir um aumento dos utilizadores a usar o sistema, este tem de estar preparado

para continuar a funcionar, quer seja através de técnicas de "graceful degradation"ou com adição de mais

componentes de hardware.

2.9.4.4. Precisão

Esta característica indica o maior desvio (erro) possível de existir, ao definir a posição do utilizador. A

capacidade do sistema dar indicações e orientações detalhadas depende muito da sua precisão. Quanto

maior, melhor o sistema poderá direccionar o utilizador.

2.9.4.5. Custo e Hardware

A aceitação de um sistema depende muito do hardware que este utiliza e, consequentemente, do seu custo.

Logo, a aplicação deve fazer uso de hardware comum, de custo reduzido e acessível a todos os utilizadores.

Uma das limitações existentes em alguns sistemas actuais é o facto do hardware usado ser muito específico

e especialmente desenhado para as características de uma parte da população. Isso faz com que o seu

custo seja superior em relação a outros dispositivos que têm a mesma utilidade, mas são produzidos para

um mercado muito maior. Logo, a diferença não deve estar no hardware, mas sim no software que é usado,

visto este ter um impacto muito menor no custo final.

2.9.4.6. Fácil e Rápido de Usar

Um sistema de orientação tem de ser usado de uma forma fluída, sem que os seus procedimentos ocupem

a maior parte do tempo do utilizador. A interacção com o sistema tem de ser simples e fácil de compreender.

O modelo mental que o utilizador tem da aplicação deve ser construído rapidamente e ficar bem definido,

para que a sua utilização possa ser eficaz.

2.9.4.7. Eficiente

O sistema de orientação deve também ser eficiente na forma como guia o utilizador. Esta eficiência pode

nem sempre corresponder a levar o utilizador pelo percurso mais curto, mas sim pelo mais adequado (mais

seguro, mais rápido, menos distractivo, etc.).

2.9.4.8. Claro

O retorno que o sistema dá ao utilizador deve ser preciso e auto explicativo. Todas as descrições que o

sistema possa dar devem ser uma visão da realidade e suficientes para contextualizar o utilizador no espaço

33

Page 50: Blobby - ULisboa

em se encontra. As indicações e direcções do sistema têm de ser precisas e não podem conter ambiguidade,

para que o utilizador saiba exactamente em que direcção se deslocar.

2.9.4.9. Tempo de RespostaTodo o retorno do sistema deve ser dado o mais rapidamente possível ao utilizador. Ou seja, o retorno da

aplicação deve ser dado quando ainda é útil para orientar a pessoa ou descrever um determinado local, tendo

em conta a sua localização. Por exemplo, um possível alerta de que o utilizador irá encontrar escadas rolantes

ou outro tipo de perigo deve ser dado, efectivamente, antes do utilizador se deparar com esta situação. Do

mesmo modo, se o sistema orienta o utilizador numa determinada direcção, mesmo que algum pedido tenha

sido feito anteriormente, deve ter em conta a sua posição actual.

2.9.4.10. Modular e FlexívelO sistema deve ser dividido em vários módulos independentes entre si. Esta característica dá a flexibilidade

de se poder substituir ou alterar apenas um módulo, sem a necessidade de modificar os restantes. Deste

modo, o sistema pode, por exemplo, trabalhar da mesma forma, independentemente da tecnologia de

localização que é usada, bastando para isso substituir o respectivo módulo.

2.9.4.11. ContextoUm deficiente visual, ao entrar num espaço desconhecido, não tem qualquer noção da disposição do local ou

pontos de interesse. Um sistema de orientação para invisuais, para além de conseguir direccionar os seus

utilizadores até um destino, deverá também disponibilizar informações sobre todo o contexto em que estes

estão inseridos.

2.9.5. ConclusõesAo longo deste estado-da-arte foram discutidos e analisados diversos sistemas e abordagens, assim como

as suas tecnologias. Os sistemas de orientação para ambientes exteriores fazem uso, invariavelmente, do

GPS. Isto acontece, principalmente, devido à sua elevada disponibilidade, alcance e precisão, que o faz

destacar de todos os outros sistemas de localização.

A impossibilidade de usar o GPS em ambientes interiores, deu origem a uma "corrida"pela tecnologia que

será mais usada neste tipo de cenários. Apesar do espaço de acção ser muito menor, quando comparado

com ambientes exteriores, o grau de detalhe e precisão de um sistema de orientação interior deveria ser

necessariamente maior.

Ambas as tecnologias, WLAN e Bluetooth, consistem na transmissão de sinais de rádio, que é uma área

activa de investigação para tecnologias de localização. A sua precisão depende muito do número de APs

34

Page 51: Blobby - ULisboa

(Access Points) que são instalados no local, podendo atingir uma precisão de alguns metros. Visto a WLAN

ter um maior alcance que o Bluetooth e a sua disponibilidade ter vindo a aumentar ao longo dos anos,

esta parece ser a escolha óbvia. Além do mais, a instalação da WLAN possibilita a utilização de muitas

outras aplicações, numa rede local ou mesmo na Internet, com velocidades de transmissão de dados muito

superiores ao Bluetooth. No entanto, a utilização de uma tecnologia não exclui a outra. Ambas podem ser

usadas em conjunto para possibilitar uma maior precisão. Os beacons Bluetooth têm a vantagem de ser mais

baratos, mas em contrapartida têm um alcance menor. Se a precisão de uma WLAN for insuficiente para

orientar correctamente um utilizador num ambiente interior, então podem ser espalhados alguns beacons

Bluetooth em pontos estratégicos, sem que o preço do sistema suba consideravelmente. Caso o espaço

interior possa ser coberto com apenas alguns beacons Bluetooth, então a utilização da WLAN apenas traria

a vantagem de ter uma maior velocidade de comunicação e possibilitar o acesso a um servidor ou a redes

exteriores.

Apesar da escolha da WLAN e Bluetooth, como as melhores opções para tecnologia de localização, o sistema

tem de ser suficientemente modular e flexível, para que a sua substituição seja simples. Neste caso é

especialmente importante, visto que a área de investigação de tecnologias de localização, tem vindo a fazer

grandes progressos nos últimos anos.

O sistema de orientação não pode ser visto como um substituto da bengala ou cão-guia, mas sim um

complemento, que pode auxiliar um invisual nas suas capacidades de orientação. Como tal, o hardware

que o utilizador terá de carregar tem de ser de fácil transporte e não pode interferir com a forma como

este se desloca. Alguns dos sistemas vistos anteriormente usam hardware especialmente desenhado para

deficientes visuais, na esperança que uma produção em larga escala faça baixar os seus custos de comercialização,

o que raramente acontece. Por isso, o uso de hardware comum (Off-The-Self ) e acessível à maior parte da

população é a opção mais segura, se queremos garantir que o sistema venha a ser usado. Hoje em dia,

qualquer PDA ou telemóvel tem suporte Bluetooth e cada vez mais com ligação a WLAN’s. O uso deste tipo

de dispositivos faz, na maior parte dos casos, parte do dia a dia de um cidadão, mesmo que seja com outros

propósitos. Logo, as dificuldades de adaptação e utilização do sistema seriam minimizadas.

Grande parte das interfaces de entrada dos sistemas baseiam-se na interacção por voz ou teclado. O uso da

voz como interface de entrada tem a grande desvantagem de ser de difícil utilização em ambientes ruidosos

e pode ser constrangedor para o utilizador. Como os ambiente interiores são por natureza ruidosos, o uso

do teclado é a opção mais viável.

Em relação à interface de saída, a multimodalidade parece ser a melhor solução. Fazendo uso das capacidades

dos dispositivos móveis actuais, a fala, earcon’s, auditory icons e a vibração, podem ser usados para guiar

o utilizador de forma eficaz. No entanto, um aspecto que é invariavelmente deixado de parte e bastante

importante, é o estudo com os utilizadores. O contacto com a população-alvo é uma forma de compreender

as suas necessidades e capacidades, levando à construção de um sistema com maior qualidade.

35

Page 52: Blobby - ULisboa
Page 53: Blobby - ULisboa

3Sistema de

Orientação paraInvisuais

A área de sistemas de orientação tem sido alvo de muita investigação nas últimas duas décadas, como vimos

no Capítulo 2. Esta investigação lida, essencialmente, com a tecnologia de localização usada. Existem já

alguns sistemas de orientação disponíveis no mercado, principalmente para ambientes exteriores, mas todos

fazem uso de dispositivos desenhados para utilizadores invisuais. As características deste tipo de sistemas,

como o custo, portabilidade e usabilidade, tornam a sua aceitação bastante reduzida.

O facto da maior parte destes sistemas ser desenhado para ambientes exteriores, prende-se essencialmente

com a aceitação do GPS. Neste tipo de ambientes, o GPS tornou-se globalmente aceite, devido à sua

alta disponibilidade, precisão e baixo custo. O mesmo não acontece em ambientes interiores, onde ainda

não existe um sistema de localização equivalente. No entanto, a necessidade dos utilizadores invisuais se

deslocarem no interior de edifícios e as dificuldades existentes são reais.

Num sistema de orientação, a forma como o utilizador é guiado e todo o retorno que lhe é dado, torna-se

crucial para o seu desempenho. No entanto, esta é uma tarefa muitas vezes deixada para segundo plano. É

necessário fornecer uma interface que se adeqúe às suas necessidades e capacidades.

A nossa abordagem faz uso de telemóveis comuns e, através do estudo com utilizadores, tenta resolver os

problemas identificados acima. Por telemóvel comum, entenda-se que não se pretende recorrer a adereços

adicionais, tais como teclados ou outros acessórios em Braille. Através de um desenho centrado no utilizador

conseguimos caracterizar a população alvo, as suas necessidades e capacidades, assim como os principais

problemas que estes enfrentam, particularmente, quando se deslocam em locais desconhecidos.

37

Page 54: Blobby - ULisboa

O uso de telemóveis torna-se adequado, devido à elevada disponibilidade, portabilidade, flexibilidade e baixo

custo, no entanto, o seu desenho e dimensões tornam a interacção visualmente exigente. Logo, foi também

necessário estudar e adoptar novas formas de interacção, de modo a tornar o sistema acessível.

O principal objectivo de um sistema de orientação é conseguir guiar o utilizador até um destino, por um

percurso desconhecido. Devido às suas características, o retorno auditivo torna-se o principal canal de

comunicação entre o sistema e o utilizador. Foram estudadas diferentes formas de instruir os utilizadores,

com o objectivo de facultar um retorno auditivo adequado às suas capacidades e expectativas. Uma vez

mais, a maior parte dos sistemas vistos no capítulo 2 não tem em conta este factor e não apresenta formas

de interacção eficazes e adequadas a este tipo de tarefa e utilizador.

3.1. Estudos PreliminaresApesar de termos analisado muitos dos sistemas construídos nesta área e identificado alguns dos seus

problemas, é essencial envolver os utilizadores no processo de desenho. Mesmo que alguns dos requisitos

possam surgir através do senso comum, é necessário um convívio com este tipo de utilizadores, para

conseguir identificar os problemas e limitações que estes enfrentam, assim como as suas práticas. Esta

é também uma forma de assegurar um desenho apropriado e de qualidade, visto que vai ao encontro das

necessidades dos utilizadores [20].

De forma a conseguir caracterizar a população alvo quanto às suas capacidades, necessidades e práticas

correntes, foi feita uma análise de tarefas. Nesta fase, a colaboração com a Fundação Raquel e Martin

Sain foi essencial, tendo todo o estudo sido feito aos seus formandos. Esta instituição tem como principal

finalidade a reabilitação profissional e a integração sócio-profissional de deficientes visuais.

3.1.1. Concepção Centrada no UtilizadorA concepção centrada no utilizador é vista como uma filosofia e processo que coloca a pessoa no centro.

É um processo que se foca nas capacidades cognitivas dos utilizadores e na forma como estas podem

influenciar a interacção com os sistemas. A concepção centrada no utilizador pode melhorar a utilidade

e usabilidade de tudo com que as pessoas interagem, desde artefactos do dia-a-dia [41] a sistemas de

software, processos, etc.

Esta é uma das principais contribuições da dissertação, visto que toda a concepção foi centrada no utilizador,

tentando recolher o máximo de informação possível, para que, através de um processo de desenvolvimento

iterativo, em que o protótipo foi mudado de acordo com os resultados e retorno dos utilizadores, pudéssemos

garantir a sua qualidade. Esta metodologia trouxe vantagens para ambas as partes envolventes, ou seja,

permitiu-nos ganhar uma maior sensibilidade para os problemas que este tipo de utilizadores enfrenta, mas

38

Page 55: Blobby - ULisboa

também gerir as suas expectativas e criar um sistema alinhado com as suas visões e desejos.

Assim, para os estudos apresentados nesta dissertação, foi escolhida uma amostra significativa de utilizadores

com alguma deficiência visual. Todos os elementos da amostra eram formandos da Fundação Raquel e

Martin Sain e, apesar de alguns nos acompanharem durante todo o processo, outros não tiveram essa

possibilidade. Todas as experiências, testes e análises foram feitos, exclusivamente, a utilizadores com

algum grau de cegueira (total ou parcial).

3.1.2. Entrevistas e Questionários

A primeira técnica a ser usada foram as entrevistas, que tiveram como principal objectivo obter um primeiro

contacto com este tipo de utilizadores e identificar as principais dificuldades que enfrentam no seu dia-a-dia.

Estas entrevistas eram semi-estruturadas e a maior parte das perguntas abertas, o que levou a um diálogo

bastante informal e amigável. Foram feitas oito entrevistas, cada uma com cerca de vinte minutos de duração.

Numa segunda fase e após a análise das entrevistas, foi elaborado um questionário (Anexo A1.1) mais

preciso e conciso, de forma a abranger uma maior amostra da população. Os questionários foram feitos

individualmente a dezoito formandos e tiveram uma duração média de dez minutos. Tiveram como principais

objectivos traçar um perfil do utilizador, as suas limitações, práticas correntes, grau de independência e

conhecimentos tecnológicos. Na secção seguinte, serão apresentados os principais resultados.

Perfil do Utilizador

A amostra da população é maioritariamente do sexo masculino e com idades superiores a quarenta e cinco

anos (Tabela 3.1). Os utilizadores têm um baixo grau académico, sendo que apenas quatro terminaram o 12o

ano. Este resultado pode ser relacionado com a faixa etária em causa. Geralmente usam bengala e quando

tal não acontece, é porque andam constantemente acompanhados. Os resultados mostraram, também, que

apesar da maior parte dos utilizadores conseguir ler e escrever Braille, ainda apresenta muitas dificuldades,

principalmente na leitura.

Tabela 3.1: Perfil utilizador.

39

Page 56: Blobby - ULisboa

Uso de Dispositivos Móveis

Em relação ao uso de dispositivos móveis, todos os utilizadores possuem pelo menos um telemóvel e

usam-no diariamente, com excepção de um utilizador (Tabela 3.2). A maior parte dos entrevistados utiliza um

leitor de ecrã e, pela análise de resultados, este permite-lhes usar mais funcionalidades do seu telemóvel.

Mesmo assim, todos os utilizadores conseguem efectuar e receber chamadas. Podemos concluir que a

população alvo tem alguma experiência com dispositivos móveis, mas apenas consegue executar um número

muito limitado de tarefas.

Tabela 3.2: Uso de dispositivos móveis.

Outro resultado importante que surgiu desta análise foram as tecnologias disponíveis nos telemóveis dos

utilizadores. O Bluetooth revelou estar presente na maior parte dos dispositivos móveis.

Grau de Independência

Pela Tabela 3.3, podemos concluir que os utilizadores andam muitas vezes sozinhos, mesmo em locais

desconhecidos. No entanto, quando visitam um edifício público desconhecido, a esmagadora maioria referiu

que não consegue encontrar o balcão pretendido sem a ajuda de terceiros. Podemos concluir que a ajuda,

neste tipo de ambientes, é muitas vezes necessária, fazendo com que os utilizadores invisuais não tenham

o grau de independência e autonomia que desejam.

3.1.3. ObservaçãoOs sistemas de orientação têm como principal tarefa guiar um utilizador por um percurso que este não

conhece. Neste tipo de situação, ou seja, quando o utilizador não conhece o local, a maior parte dos

deficientes visuais recorre à ajuda de terceiros para chegar ao seu destino. Normalmente, esta ajuda consiste

em acompanhar a pessoa até ao local desejado. Um sistema de orientação pretende substituir este guia

40

Page 57: Blobby - ULisboa

Tabela 3.3: Grau de independência.

presencial por um guia virtual.

No entanto, o guia tem de ser capaz de interagir com o utilizador de uma forma compreensível, precisa e o

mais familiar possível. Por isso, decidimos efectuar uma observação dos utilizadores, que teve os seguintes

objectivos: analisar os comportamentos, dificuldades, capacidades, necessidades e técnicas usadas, num

cenário desconhecido; analisar a evolução dos mapas mentais de cada utilizador; identificar as informações

mais relevantes num cenário; estudar a forma como este tipo de utilizadores verbaliza um dado percurso;

estudar formas de comunicação entre utilizadores invisuais;

3.1.3.1. Procedimento

Nesta fase, foram escolhidas três pessoas, cuja principal tarefa seria a de explorar um local interior desconhecido,

com o objectivo de obter um total conhecimento do espaço. Entenda-se por total, o conhecimento suficiente

para, em qualquer ponto do cenário, conseguir inferir a sua localização, ou seja, o conhecimento suficiente

para se manter sempre orientado.

Cada utilizador teve três sessões (três dias consecutivos) de exploração, com a duração de quarenta e cinco

minutos cada. Todas as sessões obedeceram a um guião (Anexo A1.2), para que todos os exploradores

fossem expostos às mesmas situações. Seguindo a mesma metáfora desenvolvida em [55], em todas as

sessões foram recolhidas as histórias que os utilizadores construíram do percurso, dividido por troços e na

sua totalidade, para guiarem um colega invisual.

O local escolhido foi a cave da Fundação Raquel e Martin Sain, por ser um espaço que já não era frequentado.

Foi possível construir um percurso, com dois andares, diversos caminhos e obstáculos, de forma a simular

um cenário o mais real possível. O mapa e o percurso traçados encontram-se representados na Figura 3.1.

41

Page 58: Blobby - ULisboa

(a) Piso superior. (b) Piso inferior.

Figura 3.1: Mapa e percurso do local onde foi efectuada a observação.

3.1.3.2. Os Utilizadores

Nesta fase, voluntariaram-se três utilizadores para participar no estudo, como exploradores do local. Um

dos utilizadores ainda conseguia ver alguma luminosidade e os restantes eram cegos totais. Tinham idades

compreendidas entre os vinte e seis e os cinquenta e cinco anos e eram todos do sexo masculino. Os

participantes tinham a sua deficiência visual há mais de dezassete anos e apenas um deles frequentou um

curso de reabilitação, no qual lhe ensinaram técnicas básicas de mobilidade e orientação.

3.1.3.3. Conclusões

Este estudo permitiu-nos retirar algumas conclusões que serão enunciadas em seguida.

Pontos de Referência vs. Obstáculos: Todos os artefactos que fazem parte da infra-estrutura do local

e permitem ao utilizador inferir a sua localização são pontos de referência. Todos os outros objectos que

podem ser facilmente transportados são obstáculos.

Os olhos são a bengala: Enquanto uma pessoa visualmente capaz consegue ter um conhecimento do

local através das mais variadas pistas visuais, um invisual tem, obrigatoriamente, de se deslocar por todo

o espaço, de modo a conseguir construir um modelo mental apropriado. Este modelo é criado através de

pistas auditivas e hápticas, recorrendo a técnicas base de mobilidade, ou seja, o uso da bengala.

Exploração por tentativa e erro: Num local desconhecido, a única forma que um utilizador invisual tem de

explorar um espaço desconhecido é através de uma abordagem tentativa erro. Ou seja, usando as técnicas

42

Page 59: Blobby - ULisboa

básicas de mobilidade, o utilizador vai andando lentamente, identificando os obstáculos que o rodeiam e

construindo o seu mapa mental. Numa primeira fase, a identificação dos obstáculos é feita através do som

que estes emitem em contacto com a bengala. O tacto só é usado caso o utilizador deseje identificar o

objecto com uma maior exactidão.

Obstáculos dificultam percepção da realidade: Os obstáculos podem dar ao utilizador uma noção incorrecta

da dimensão de um local, transmitindo a falsa sensação de parede ou fim do caminho. Por exemplo, se um

ponto de referência, como um pilar, estiver rodeado de cadeiras (ou outro obstáculo), então o utilizador vai

ter muitas dificuldades em identificá-lo. Devido à própria natureza dos obstáculos e à facilidade com que se

podem mudar, esta é uma situação que pode ocorrer com alguma frequência.

Facilidade em decorar um percurso: Nesta experiência, todos os utilizadores conseguiram terminar o

percurso em menos de dez minutos e recriaram uma história, com base no seu modelo mental do local, que

apesar de ser pouco pormenorizada, correspondia à realidade.

Utilizadores cingem-se a um percurso: Um invisual, depois de ter um mapa mental de um local, já não tem

a necessidade de o explorar à procura de novos caminhos ou pontos de referência, cingindo-se apenas a

percursos que já domina. No entanto, este percurso pode não ser o mais seguro ou eficiente, mas é preferível

a explorar novos espaços desconhecidos.

Modelo mental incompleto: Como consequência do ponto anterior, o utilizador faz um mapa mental do

espaço que é, muitas vezes, incompleto. Isto leva a que, quando identifica algo de novo no seu percurso

e que não corresponde ao seu mapa mental, fique desorientado. Até descobrir novamente um ponto de

referência, o utilizador encontra-se num local totalmente desconhecido, que, em última instância, pode levar

a situações de stress ou pânico.

Em caso de desorientação, volta-se para atrás: Geralmente, quando os utilizadores se sentem perdidos, a

primeira reacção é tentar voltar para trás e identificar um ponto de referência, com o objectivo de se localizar

no espaço e adaptar o desconhecido ao seu modelo mental.

Menos é melhor: Durante esta experiência, mas em especial na última sessão, notou-se uma preocupação

nos participantes em construir uma história o mais simples possível, mas precisa. Os utilizadores referiram

que é preferível uma instrução simples, clara e precisa, em detrimento a muitas descrições.

História completa vs. História por troços: As histórias completas são mais detalhadas e descrevem

o percurso passo a passo, enquanto as histórias por troços são mais simples e objectivas. Visto que as

últimas foram recolhidas durante a execução do percurso, as histórias poderão pressupor que o utilizador

está envolvido num dado contexto, daí as instruções serem menos descritivas.

43

Page 60: Blobby - ULisboa

3.1.4. Reunião de GrupoApós a fase de observação e respectiva análise, esta reunião teve como principais objectivos discutir e

consolidar, com todos os participantes, algumas das conclusões retiradas da fase anterior.

3.1.4.1. ProcedimentoForam reunidos todos os utilizadores da fase anterior, assim como um ex-instrutor de técnicas de mobilidade

e orientação, para uma reunião de grupo. O plano de trabalhos (ver Anexo A1.3) tinha como principais

assuntos: obter uma única (a "melhor") história do percurso; qual o comportamento mais adequado a adoptar

quando um utilizador se perde; quais as informações mais relevantes num espaço interior e a melhor forma

de as transmitir;

Esta reunião durou cerca de duas horas e quinze minutos e todos os elementos participaram na discussão.

3.1.4.2. Os UtilizadoresOs participantes desta reunião foram exactamente os mesmos utilizadores que estiveram presentes na fase

anterior. Contamos também com a participação de um ex-instrutor de técnicas de mobilidade e orientação

para invisuais, que nos forneceu uma visão mais técnica e ajustada ao tipo de formação que estes utilizadores

recebem.

3.1.4.3. ConclusõesO principal resultado desta reunião foi a criação de uma só história, que descreve todo o percurso (Figura

3.1). Em seguida. será apresentada a história final, assim como algumas conclusões que foram retiradas

durante o estudo.

História final: "Entre na porta, siga em frente, desça a rampa do corredor e, no final, vire à direita. Vá em

frente, junto ao lado direito, até ao final e vire à esquerda, até às escadas. Desça dois lances de escadas,

que têm um corrimão do lado esquerdo. Siga em frente, encostado aos armários do lado direito, até ao

obstáculo. Vire à esquerda e vá em frente, até à secretária do telefone. Contorne-a pela direita, siga em

frente, até à porta e irá encontrar uma mesa, que deverá contornar pela direita. Vire à esquerda e suba três

lances de escadas. Em frente, irá encontrar o elevador."

Pontos de referência: Durante todo este estudo e em particular nesta reunião, ficou bem claro que os

pontos de referência são cruciais para um invisual. É a partir destes que o utilizador consegue inferir a

sua localização e orientar-se num dado local. Pelas histórias recolhidas anteriormente, durante a fase de

observação, estas referências correspondem, normalmente, a pontos de decisão onde o utilizador tem de

mudar de direcção. No entanto, nem todos os artefactos do cenário podem ser pontos de referência, apenas

44

Page 61: Blobby - ULisboa

elementos da infra-estrutura (pilares, portas, paredes, escadas, etc.) ou outros elementos que não sejam

facilmente movidos (electrodomésticos, balcões, etc.). Apesar dos utilizadores recorrerem muitas vezes às

propriedades (auditivas ou hápticas) destes elementos, elas não foram inseridas na história final, porque

diferentes pessoas podem identificar o mesmo ponto de referência, de diferentes formas. No entanto, temos

de garantir que um ponto de referência é facilmente identificável.

Nível de detalhe: As principais diferenças nas histórias anteriormente recolhidas diziam respeito ao nível de

detalhe das instruções. A descrição do espaço, o número de escadas ou o lado pelo qual o utilizador se deve

deslocar são alguns exemplos. Nesta reunião, todos os participantes concordaram que o nível de detalhe

deve ser o menor possível. Apenas quando existe perigo (por exemplo, escadas) ou uma necessidade

especial (por exemplo, quando existem sinais) deve ser dado mais detalhe.

Não substitui bengala: Como as histórias não fazem referência (nem devem) a obstáculos, o uso de bengala

é obrigatório. Um sistema de orientação não tenta substituir as técnicas de mobilidade e orientação, apenas

indicar um percurso pelo qual o utilizador deve seguir.

Contexto: Apesar de não ser descrito nas histórias, os utilizadores mostraram um grande interesse em

ter acesso a outras informações, que geralmente lhes está inacessível. Estas informações podem ser

divididas em duas categorias: estrutura do cenário - corresponde às características do local (dimensões,

forma, número de pisos, etc.); pontos de interesse - são todos os locais que podem ser possíveis destinos

(lojas, balcões, casas de banho, etc.).

3.1.5. Guias de DesenhoDepois do contacto com os utilizadores, algumas guias de desenho começaram a surgir. Nesta secção,

iremos especificar cada uma delas e construir um conjunto de princípios que devem ser respeitados no

desenho de uma interface de orientação para invisuais.

G1 - Adaptar-se às capacidades do utilizadorA interface utilizador deverá ter em conta o perfil da população alvo e adaptar-se às suas necessidades e

capacidades. Apesar da maior parte das interfaces actuais ser visualmente exigente, os utilizadores terão de

ser capazes de inserir dados no sistema e receber o seu retorno.

G2 - AceitaçãoUm factor importante de qualquer interface utilizador é a sua aceitação. Um sistema de orientação irá

provavelmente ser usado em público, logo, é importante que seja adequado a este tipo de situações. Intimamente

ligado à aceitação social está a aceitação do utilizador. A estética, o hardware necessário e os métodos de

45

Page 62: Blobby - ULisboa

interacção tornam-se factores cruciais. O estudo centrado no utilizador, ao desenhar este tipo de interface,

poderá garantir o seu sucesso.

G3 - Importância das InstruçõesOs sistemas de orientação tradicionais têm, normalmente, uma interface de saída gráfica e falada. Estas

duas modalidades têm o objectivo de dar ao utilizador instruções precisas e manter uma baixa carga cognitiva.

Neste caso, os diálogos podem ser desambiguados ou até mesmo excluídos, face à existência de uma

representação visual do local onde o utilizador se encontra.

No caso dos utilizadores invisuais, estes não têm acesso a pistas visuais e não conseguem interagir com uma

interface gráfica comum. Assim, o retorno auditivo torna-se essencial para a interacção pessoa-máquina.

Temos de ter em conta as necessidades e dificuldades que este tipo de utilizadores enfrenta e a interface

tem de reflectir as práticas e técnicas de orientação e mobilidade usadas, através de uma comunicação

clara, precisa, consistente e de acordo com as suas capacidades. As instruções devem usar um vocabulário

familiar e não ambíguo, de modo a evitar erros e situações de stress. Para além de se adaptar ao tipo de

utilizador, a interface deve ter em conta o cenário e o contexto em que este está inserido.

G4 - Carga CognitivaApesar de possuírem menos um sentido, a carga cognitiva dos utilizadores invisuais é, por vezes, superior

à dos utilizadores visualmente capazes. No simples processo de se deslocar, um invisual tem de estar a

empregar constantemente técnicas de mobilidade, recorrendo à sua bengala, na eventualidade de existir

algum obstáculo ou perigo, o que requer uma carga cognitiva adicional. A concentração necessária para

executar uma tarefa tão simples é superior à dos utilizadores sem deficiências. Ao usar um sistema de

orientação em que o retorno é dado através da fala, esta deve ser simples e concisa, de modo a minimizar a

atenção necessária para a compreender.

G5 - Fornecer AjudaDevido à complexidade da tarefa de guiar um utilizador invisual, num local desconhecido, a possibilidade

de este se perder ou desviar do percurso é uma realidade. No entanto, devem existir mecanismos que

permitam ajudar o utilizador a retomar a rota pretendida. Estes mecanismos poderão ser activados pelo

próprio utilizador ou inferidos pelo sistema.

G6 - Aumentar a RealidadeUm invisual, ao visitar um edifício desconhecido está dependente da ajuda que outras pessoas lhe possam

fornecer. Esta ajuda consiste em guiar e fornecer indicações, para que possa chegar ao seu destino em

46

Page 63: Blobby - ULisboa

segurança. Como este tipo de utilizadores não tem acesso a pistas visuais, que por vezes são cruciais para

a percepção de todo o ambiente envolvente, são também necessários métodos de contextualização, que

permitam aos utilizadores ter acesso a informações gerais, descrições do espaço ou pontos de interesse

existentes.

3.2. Sistema de Orientação em Dispositivos MóveisNa secção anterior, definimos um conjunto de guias de desenho, que surgiram depois da caracterização dos

utilizadores e das suas práticas. Nesta dissertação, iremos focar a nossa atenção em duas frentes: tornar

acessível um sistema de orientação, a partir de um dispositivo móvel comum; dar ao utilizador um retorno

auditivo apropriado e familiar;

3.2.1. Cenários do ProblemaA abordagem proposta faz uso de telemóveis comuns, para fornecer ao utilizador um discurso adequado às

suas capacidades e substituir a ajuda humana, em descrever e guiar o utilizador num local desconhecido.

Para além disto, o sistema terá de ser capaz de operar sobre diferentes interfaces de entrada, devido à

diversidade de dispositivos existente no mercado.

Loja do Cidadão

A validade do bilhete de identidade do Ruben vai expirar na próxima semana. Então, este decide ir até à

Loja do Cidadão mais próxima. Ao entrar, o Ruben consegue aperceber-se, através do barulho, da confusão

que está naquela sala. Não se deixando intimidar por não conhecer o local e não conseguir ver quaisquer

indicações, acede ao seu telemóvel e inicia o seu sistema de orientação, o Blobby. Por ser a primeira vez

que visita esta loja do cidadão, o Ruben decide pedir ao sistema uma pequena contextualização do local.

Este diz-lhe o tamanho da sala, posições dos balcões de atendimento, senhas e salas de espera. Em

seguida, apresenta-lhe uma lista de serviços disponíveis, tais como tirar/renovar o B.I., carta de condução

ou cartão-jovem. O Ruben escolhe o serviço de renovar o B.I. e, de imediato, a aplicação traça uma rota e

informa-o de todos os passos que terá de efectuar. A partir deste momento, o Ruben será constantemente

acompanhado pelo sistema, que o irá guiar até completar todos os passos para a renovação do seu bilhete

de identidade.

Visita ao Museu

O João, um aluno invisual do 3o ano de arqueologia, vai ao Núcleo Arqueológico da Rua dos Correios

(NARC). Ao entrar no edifício e como é a primeira vez que visita o local, liga o seu sistema de orientação, o

Blobby. A aplicação já tem uma visita pré programada e o João decide fazê-la, seguindo as instruções que

lhe são dadas. Entretanto, durante o decorrer da visita, ao entrar numa nova sala, o Blobby avisa-o que tem

47

Page 64: Blobby - ULisboa

uma nova mensagem e este decide ouvi-la. A aplicação indica que entrou num complexo industrial, banhos

e via, da época romana e permite ao utilizador obter uma descrição mais detalhada de todo o complexo. Ao

terminar a visita e já no período quinhentista, enquanto caminha, o João recebe uma indicação de que, ao

seu lado, se encontra uma parede de azulejos sevilhanos.

3.2.2. Interacção com Dispositivos Móveis

Os dispositivos móveis actuais possuem interfaces pessoa máquina visualmente exigentes, o que dificulta

ou impossibilita os utilizadores invisuais de interagir com o seu dispositivo. O utilizador comum consegue

apenas, através de mecanismos de memorização, efectuar e receber chamadas telefónicas, apesar das

vastas potencialidades e funcionalidades existentes neste tipo de dispositivos.

A crescente evolução dos telemóveis tem vindo a ser acompanhada de um crescente fosso entre estes

dispositivos e os utilizadores invisuais. A constante redução das suas dimensões, a adopção das interfaces

gráficas como paradigma dominante e os mecanismos de interacção existentes (i.e. teclado ou ecrã táctil)

tornam os dispositivos móveis inadequados a este tipo de utilizadores (Figura 3.2).

(a) Teclado (b) Ecrã Táctil

Figura 3.2: Métodos de interacção com dispositivos móveis.

No entanto, apesar de estar acessível apenas um número limitado de funcionalidades, este tipo de dispositivos

faz parte do quotidiano dos utilizadores e possui as tecnologias necessárias para a construção de um sistema

de orientação. O desafio é construir uma interface adequada, que permita aos utilizadores invisuais interagir

com uma aplicação complexa, onde é necessário seleccionarem opções, inserir texto e navegar entre menus.

3.2.3. Retorno Auditivo Familiar

Através de um estudo centrado no utilizador e na forma como estes comunicam entre si, foram identificados

os principais elementos e regras para a construção de uma instrução. Através destas regras, poderá ser

dado um retorno auditivo adequado, consistente e familiar, para guiar um utilizador ao longo de uma rota.

48

Page 65: Blobby - ULisboa

Porquê a fala?

Foi escolhida uma interface de saída falada, por ser uma forma natural de interacção e de grande expressividade.

Como alternativa, poderia ter sido usado o som (não fala) tridimensional, para guiar o utilizador ao longo de

um percurso. No entanto, este tipo de sistema [67] mostra-se muito intrusivo e com uma baixa aceitação,

devido à constante repetição de um som, indicativo do utilizador se encontrar dentro ou fora da rota. A

capacidade auditiva é um dos recursos mais importantes para o bem-estar e autonomia de um invisual. De

modo a receber um retorno auditivo em três dimensões, os utilizadores são obrigados a usar dois auriculares,

que, por sua vez, podem bloquear sons ambientais e tornar-se um incómodo.

Por outro lado, com o desenvolvimento dos sintetizadores de fala, esta é uma técnica que pode ser usada

para guiar um utilizador invisual. No entanto, apresenta uma elevada carga cognitiva. São necessárias novas

abordagens, que permitam ao utilizador uma fácil compreensão e memorização.

Elementos das Instruções

Com a recolha das histórias na fase de observação (Secção 3.1.3)e depois da reunião de grupo (Secção

3.1.4), conseguimos extrair um conjunto de elementos que são usados para guiar um invisual.

Acção: As instruções dadas aos utilizadores, tal como o nome indica, têm de o mandar fazer algo. Logo,

uma acção pode ser: vire, volte, siga, desça, suba, entre, saia.

Direcção: Algumas das acções vistas acima necessitam de uma direcção, para que possam fazer sentido.

Por exemplo, as acções: siga, vire ou volte, precisam de ser complementadas com a correspondente direcção

(esquerda, direita, frente, trás).

Lado: Por vezes, numa dada instrução, é necessário fazer referência ao lado pelo qual o utilizador se deve

deslocar, direita ou esquerda. Isto pode acontecer por várias razões: espaço muito amplo, segurança ou

evitar obstáculos.

Tempo / Distância: Geralmente, um ponto de referência está associado a um ponto de decisão (i.e. mudança

de direcção). A referência a estes pontos é feita através de elementos temporais ou de distância. Por

exemplo, "vire à direita depois de passar uma porta" ou "siga em frente três passos ...".

Objecto: Um objecto consiste em qualquer artefacto que possa existir no local. Portas, escadas, mesas,

cadeiras, armários, paredes ou pilares são alguns exemplos. A utilização de objectos serve, também, para

completar algumas acções: desça, suba, entre ou saia, têm de fazer referência a um objecto, escadas ou

portas, respectivamente.

49

Page 66: Blobby - ULisboa

Estrutura das InstruçõesA estrutura de uma instrução pode variar tendo em conta o cenário e o local onde o utilizador se encontra. A

Tabela 3.3 apresenta as estruturas mais frequentes numa instrução e um exemplo.

Figura 3.3: Estrutura das instruções mais frequentes.

Concluindo, todas as instruções podem ser definidas através da seguinte expressão regular [24]:

Acção Direcção? ([Tempo Lado Distância]* Objecto)?

Pontos de ReferênciaComo foi visto nas secções anteriores, os pontos de referências são essenciais para a construção das

instruções e, consequentemente, para conseguir guiar o utilizador. A dificuldade inerente a esta abordagem

consiste em escolher estes pontos de referência. Para que o utilizador consiga compreender o retorno do

sistema, estes têm de ser facilmente identificáveis, ou seja, têm de ser elementos do cenário que o utilizador

consiga distinguir de todos os outros, tais como: escadas, portas ou balcões. Os pontos de referência devem

ser escolhidos tendo em conta as capacidades e técnicas usadas por este tipo de utilizadores, logo, objectos

que estejam ao alcance da bengala e tenham propriedades sonoras ou hápticas únicas são bons candidatos.

ContextualizaçãoUm sistema de orientação, tal como o nome indica, tem o principal objectivo de aumentar as capacidades

de orientação do utilizador, guiando-o por um percurso até ao seu destino. Um sistema de orientação para

invisuais tem, obrigatoriamente, de ir mais além. Enquanto uma pessoa visualmente capaz consegue, com

facilidade, perceber o contexto em que se encontra inserida, um deficiente visual pode ter muitas dificuldades

na percepção das dimensões, pontos de interesse (casas de banho, recepção, etc.), sinais ou perigos do

local. Logo, este tipo de sistemas tem de ser capaz de contextualizar o utilizador.

Pelos estudos realizados, conseguimos dividir as informações necessárias em duas áreas: estrutura do

cenário - corresponde às características do local (dimensões, forma, número de pisos, etc.); pontos de

interesse - são todos os locais que podem ser possíveis destinos (lojas, balcões, casas de banho, etc.);

Mais uma vez, a utilização da fala como modalidade de saída mostra-se adequada, devido à sua elevada

expressividade.

50

Page 67: Blobby - ULisboa

3.3. Avaliação PreliminarUm invisual tem muitas dificuldades em se conseguir orientar num espaço desconhecido, sem a ajuda de

outrem. A nossa abordagem tira proveito das capacidades deste tipo de utilizadores e fornece um retorno

auditivo que vai ao encontro das suas necessidades.

A maior parte dos trabalhos vistos no Capítulo 2 não tem em conta a forma como o utilizador é guiado. Mesmo

os que tentam resolver este problema, não têm em conta as práticas dos utilizadores invisuais e originam

interfaces inadequadas. Devido a estas diferenças, era crucial proceder a uma validação da abordagem.

As próximas secções apresentam a nossa avaliação preliminar à abordagem apresentada.

3.3.1. ProcedimentoO objectivo desta avaliação era conseguir guiar o utilizador através de um percurso previamente definido.

Decidimos aplicar um teste de Feiticeiro de Oz [20], por este não requerer suporte computacional e permitir a

um humano simular as funcionalidades pretendidas. Neste caso, não existe qualquer componente computacional

e toda a interacção com o utilizador foi simulada (Figura 3.4). No entanto, as instruções existentes foram

previamente definidas (ver Secção 3.1.4). O guião desta avaliação está disponível no Anexo A2

O utilizador foi constantemente "seguido"por uma pessoa visualmente capaz, cujo papel era o de simular

o sistema de orientação e fornecer-lhe um conjunto de instruções. O local e percurso escolhidos foram os

mesmos da fase de observação (ver Secção 3.1.3). As instruções foram dadas em pontos previamente

definidos na reunião de grupo (ver Secção 3.1.4). Durante a realização do percurso, a única operação

acessível ao utilizador era a repetição da última instrução.

Para garantir uma análise fidedigna, toda a avaliação foi gravada (vídeo e som) e foi realizado um questionário

no inicio e final do teste, de modo a caracterizar e obter a satisfação dos utilizadores.

Figura 3.4: Representação da avaliação preliminar.

51

Page 68: Blobby - ULisboa

3.3.2. Os UtilizadoresPara esta avaliação voluntariaram-se nove utilizadores, com idades compreendidas entre os vinte e cinco e

sessenta e cinco anos. Dois dos utilizadores eram cegos parciais e os restantes, cegos totais. A maior parte

da população (cinco utilizadores) era do sexo masculino. Todos os participantes possuem, pelo menos, a

antiga terceira classe e todos frequentaram um curso de reabilitação, no qual lhes ensinaram técnicas de

mobilidade e orientação. É de salientar que nenhum dos utilizadores tinha um conhecimento prévio do local

onde se realizou o teste.

3.3.3. ResultadosEste foi o primeiro teste realizado com o objectivo de guiar um utilizador invisual. O primeiro resultado

relevante tem a ver com o comportamento dos utilizadores. Alguns dos participantes demonstraram um

comportamento de seguir sempre em frente até se sentirem "perdidos"e não esperavam para ouvir toda a

instrução até começarem a executá-la.

Apesar do vocabulário usado ter sido dado por utilizadores invisuais, houve uma instrução que gerou bastante

confusão. A instrução "contorne a mesa pela direita e siga em frente" foi interpretada de diferentes formas

(Figura 3.5): virar à direita ao encontrar mesa; virar à direita depois de encontrar a mesa; contornar a mesa

na totalidade pela direita e seguir em frente; passar a mesa e seguir em frente. A instrução "... desça a

rampa do corredor e, no final, vire à direita.", mostrou também alguma ambiguidade, por os utilizadores não

conseguirem detectar o final da rampa.

(a) Virar ao encontrar o

obstáculo.

(b) Virar depois de passar o

obstáculo.

(c) Contornar a mesa na

totalidade.

(d) Contornar o obstáculo e

seguir em frente.

Figura 3.5: Diferentes formas de contornar um obstáculo

Segundo esta abordagem, a identificação dos pontos de referência que foram dados nas instruções revelou

ser crucial. Caso o participante não detectasse um ponto de referência, então toda a instrução ficava

descontextualizada. Esta identificação foi útil também para o caso em que o utilizador se perdia. Caso

voltasse atrás e identificasse um dos pontos de referência, então podia retomar o seu percurso normal. Ou

seja, todos estes pontos devem ser facilmente identificados.

Um erro consiste num desvio do percurso traçado, que o utilizador pode vir a recuperar sozinho ou através

de ajuda (externa ou do sistema). Neste teste, as ajudas do sistema consistiam em pedir ao utilizador que se

deslocasse até ao último ponto de referência e, a partir daí, continuar a guiá-lo até ao seu destino. O pedido

de uma ajuda externa significa que o sistema (wizard) não conseguiu guiar o utilizador e a intervenção

52

Page 69: Blobby - ULisboa

humana (exterior ao sistema) foi necessária. Pela Figura 3.6, podemos ver que três dos participantes

necessitaram de ajudas externas, que corresponderam exactamente às instruções mais problemáticas. Com

a excepção de dois erros noutras zonas do percurso (que foram resolvidos pelo sistema), todas as ajudas

foram originadas por duas instruções cujo vocabulário era ambíguo (Figura 3.7): "... desça a rampa do

corredor e no final ..."; "contorne a mesa ...".

Figura 3.6: Ajudas por participante da avaliação preliminar.

Figura 3.7: Ajudas por zona (Figura A2.2) da avaliação preliminar.

No entanto, os utilizadores mostraram-se, na generalidade, bastante satisfeitos com a forma como foram

instruídos durante o percurso. Revelaram curiosidade e interesse pelo trabalho, argumentando que poderia

ser uma forma de aumentar a sua autonomia e um incentivo para conhecer locais nunca antes visitados.

Pelos resultados obtidos nesta avaliação, acreditamos que a nossa abordagem é válida e bem aceite pelos

utilizadores. Este teste permitiu-nos, também, responder a algumas perguntas que poderão ser usadas, em

trabalhos futuros, nesta linha de investigação.

A interacção através da fala é uma abordagem viável? Sim. O estudo com a população alvo e as

elações daí retiradas permitiram-nos construir um conjunto de instruções, que tiveram como objectivo guiar

os utilizadores por um percurso desconhecido. Os resultados mostraram que as instruções por fala permitem

uma interacção natural, fácil (sem necessidade de treino) e adequada às suas práticas.

53

Page 70: Blobby - ULisboa

Os pontos de referência escolhidos influenciam o desempenho do utilizador? Sim. A escolha dos

pontos de referência mostrou ser uma tarefa crucial. Pela sua importância, os pontos de referência devem

ser elementos do cenário facilmente identificáveis e pouco prováveis de mudar de localização. Caso estes

pontos não sejam identificados pelo utilizador, este terá uma elevada probabilidade de se perder e necessitar

de ajuda humana.

A informação de cada instrução é suficiente? Sim. Um dos grandes objectivos desta avaliação foi verificar

se as instruções precisavam de alguma contextualização (descrição do espaço) ou referência aos obstáculos

existentes, para guiar o utilizador. Através do uso adequado da bengala, os utilizadores conseguiram evitar

os obstáculos, mesmo sem terem conhecimento prévio da sua existência. Depois desta avaliação, podemos

concluir que as instruções devem ser curtas, simples e precisas, de modo a manter uma baixa carga cognitiva

e minimizar a necessidade de memorização.

Os utilizadores compreendem o vocabulário? Sim. Com excepção da palavra "contornar", que gerou

alguma confusão, todo o vocabulário foi facilmente entendido pelos utilizadores. Todo o discurso foi o reflexo

de um estudo centrado no utilizador, que teve como objectivo mapear o vocabulário (e todas as experiências

inerentes) usado por estes utilizadores.

Os utilizadores conseguem associar as instruções à realidade? Sim. Depois de ouvirem uma instrução,

os utilizadores vão já com a intenção de procurar um determinado ponto de referência e, na esmagadora

maioria dos casos, conseguem fazê-lo, mapeando as informações das instruções com a realidade.

54

Page 71: Blobby - ULisboa

4O Guia Móvel

Através do estudo centrado no utilizador, foi definida uma abordagem para fazer face a alguns dos problemas

actuais nos sistemas de orientação para invisuais. A nossa abordagem está focada nas limitações existentes,

no que diz respeito às interfaces pessoa máquina. O retorno auditivo e a interacção com dispositivos móveis

tradicionais foram os principais focos de trabalho. Para validar a nossa abordagem, foi desenvolvido um

protótipo que será apresentado em detalhe neste capítulo.

4.1. ArquitecturaNo Capítulo 3, definimos uma abordagem baseada num retorno auditivo familiar, através da fala. Para

conseguir validar esta abordagem, foi implementado um protótipo, constituído por diferentes módulos, que

permitem a separação entre a interface utilizador, o sistema de localização, a construção de instruções e o

modelo de domínio da aplicação. A arquitectura do sistema encontra-se representada na Figura 4.1

Figura 4.1: Arquitectura do sistema.

O Módulo de Localização diz respeito à capacidade do sistema inferir a localização do utilizador num dado

espaço. Este módulo está intimamente ligado à tecnologia de localização utilizada. No nosso sistema, foram

55

Page 72: Blobby - ULisboa

usados dois módulos: Bluetooth e WLAN, sendo que este último foi desenvolvido pelo Pedro Sousa [50].

Assim, conseguimos obter um sistema independente da tecnologia de localização, modular e flexível, em que

podem ser facilmente adicionados novos módulos (e.g. processamento de imagem, RFID ou GPS). De modo

a combinar todos estes módulos, a posição do utilizador pode ser encontrada através de uma abordagem de

colaboração, em que os resultados dos vários módulos são combinados, através de um gestor de localização.

A Lógica de Domínio corresponde ao núcleo da nossa aplicação e está relacionado com todas as entidades

e lógica de domínio. Toda a gestão de mapas, rotas, percursos, grafos, objectos e outras entidades de

domínio, são da sua responsabilidade. Um dos aspectos mais importantes deste módulo é a criação dos

mapas e percursos. Os percursos são calculados tendo em conta a posição do utilizador (módulo de

localização) e o destino pretendido, através do algoritmo de Dijkstra [19]. Como se pode ver, este módulo dá

suporte aos restantes componentes da arquitectura, fornecendo um estado do sistema, lógica aplicacional e

um modelo de domínio.

O Módulo de Orientação está directamente relacionado com a posição e percurso do utilizador. Tendo

estes parâmetros, é da sua responsabilidade construir um conjunto de instruções que permitam ao utilizador

chegar ao seu destino. Mais uma vez, a modularidade da aplicação foi um requisito, podendo facilmente

adicionar-se novos módulos de construção de instruções. A componente gramatical é usada como suporte

à construção de frases sintacticamente correctas.

A Interface Utilizador foi dividida em dois módulos distintos: entrada e saída. O módulo de entrada surgiu

da necessidade de criar diferentes mecanismos de interacção, tendo em conta a variedade de dispositivos

móveis actuais. Este módulo é responsável por tratar todos os eventos de entrada. É possível, também,

adicionar novos mecanismos de interacção, para além dos existentes (teclado e ecrã táctil), de forma a

proporcionar ao utilizador uma interface mais adequada. O módulo de saída é composto pelo retorno háptico

(vibratório), som (earcons) e fala (instruções). Obviamente, toda a interface está directamente relacionada

com o estado actual da aplicação.

Nas próximas secções, serão explicados com mais detalhe cada um dos módulos presentes na arquitectura,

com especial foco nos módulos de orientação e interface utilizador.

4.2. Material de TrabalhoPara o desenvolvimento do nosso trabalho, era necessário um dispositivo móvel comum com uma API

(Application Programming Interface) acessível. Por dispositivo móvel comum entenda-se, com um ecrã e

teclado (ou ecrã táctil). Era também necessário que o dispositivo tivesse disponível alguma das tecnologias

de localização analisadas no Capítulo 2. Olhando para o panorama actual, o Bluetooth e WLAN são as mais

comuns. Desta forma, temos a garantia que o nosso protótipo está alinhado com as características da maior

56

Page 73: Blobby - ULisboa

parte dos dispositivos móveis actuais e, consequentemente, com as necessidades dos utilizadores.

O protótipo foi desenvolvido em C# para a plataforma Windows Mobile 5.0. Os dispositivos usados nesta

fase (Figura 4.2) foram o HTC S310 e o HTC TyTn.

(a) HTC S310 (b) HTC TyTn

Figura 4.2: Dispositivos móveis usados.

Foi também usado o sistema de síntese de fala da Loquendo, em português (voz masculina, Eusébio).

4.3. Construção de InstruçõesDar ao utilizador um retorno compreensível e adequado às suas capacidades, através da construção automática

de instruções, foi um dos principais objectivos desta dissertação. A arquitectura do nosso sistema reflecte

esta opção, tendo sido criado um módulo de orientação, que é responsável por construir todo o discurso,

tendo em conta a posição actual do utilizador. O módulo de lógica de domínio fornece todas as informações

necessárias para a construção das instruções. Grande parte desta informação advém do mapa, como iremos

ver em seguida.

4.3.1. MapasComo qualquer sistema de orientação, este tem de ter acesso a um mapa, que representa um espaço e

todos os elementos nele contidos (Figura 4.3).

Um mapa é constituído por divisões, que normalmente correspondem a uma sala e têm uma descrição.

Esta descrição é dada ao utilizador quando este pede uma contextualização. Apesar da construção não ser

automática, de acordo com os estudos preliminares (ver Secção 3.1.4), esta contextualização deve conter

informações sobre a estrutura do cenário e pontos de interesse.

A secção de objectos corresponde à criação e posicionamento dos elementos no mapa. Os objectos

existentes no nosso protótipo são: escadas, porta, elevador, obstáculo e path. O objecto path é um elemento

genérico, que é utilizado apenas para ligar outros objectos e formar um percurso. Os restantes elementos

têm os atributos nome, isReferencePoint e isInterestPoint, que indicam o nome, se é um ponto de referência

57

Page 74: Blobby - ULisboa

(a) Excerto do ficheiro de configuração. (b) Possível representação gráfica.

Figura 4.3: Exemplificação de um mapa.

e se é um ponto de interesse, respectivamente. Cada um dos objectos pode ainda ter atributos próprios,

como é o caso do atributo up, que indica o sentido das escadas (subir ou descer). É de notar que o conjunto

de objectos pode ser facilmente estendido, de acordo com o cenário.

A secção de conexões corresponde à formação dos percursos existentes no mapa. Na realidade, um mapa

não é mais do que um grafo, com um conjunto de nós (objectos) e ligações. Cada ligação tem ainda um peso,

que indica o custo de navegar entre dois nós. Esta característica permite-nos escolher o melhor caminho,

recorrendo ao algoritmo de Dijkstra, de um dado nó de origem até um nó de destino. Neste caso, o custo

de cada ligação é fornecido, mas poderia ser calculado com base numa heurística. Por último, cada ligação

tem um atributo, que indica a existência de uma parede. Esta informação pode ser importante aquando da

construção de uma instrução, visto ser uma referência muito usada por utilizadores invisuais.

4.3.2. AlgoritmoComo foi dito anteriormente, o módulo de orientação é responsável pela criação das instruções, que são

dadas ao utilizador. Após o sistema inferir a sua posição, através do módulo de localização, são construídas

as instruções, tendo em conta o destino pretendido. Os elementos destas instruções e a sua estrutura foram

anteriormente identificados na Secção 3.2.3. O nosso algoritmo consiste, apenas, na implementação de um

conjunto de regras.

Cada um dos objectos que constituem o mapa tem um atributo, que nos indica se o módulo de localização

consegue inferir a sua posição. Logo, tendo em conta a posição actual do utilizador, o algoritmo procura

o próximo ponto no percurso que seja "localizável"e constrói o respectivo conjunto de instruções. Este

funcionamento é repetido até ao final do percurso. Logo, o ponto inicial e final do percurso têm, obrigatoriamente,

58

Page 75: Blobby - ULisboa

de ser localizáveis.

Aquando da construção das instruções entre dois pontos, estas são subdivididas, dependendo dos pontos

de referência existentes e das mudanças de direcção que o utilizador terá de fazer. Assim, poderemos obter

instruções como: "Siga em frente até à porta do elevador. Vire à esquerda e siga em frente até à casa de

banho" - neste caso, o elevador é um ponto de referência; "Siga em frente e vire à esquerda depois de passar

uma porta." - não existe um ponto de referência pré-definido, no entanto, é criada uma referência, tendo em

conta a mudança de direcção que o utilizador terá de realizar;

Uma mudança de direcção é detectada quando o ângulo entre a direcção actual (vector entre a posição

anterior e a posição actual) e a próxima direcção é maior que 45o. Caso o próximo ponto de destino não

seja um ponto de referência, então terá de ser criada uma referência, à semelhança do que acontece no

exemplo anterior. A criação de uma referência é feita de acordo com os objectos pelos quais o utilizador terá

de passar e que podem ser facilmente identificados, como é o caso das portas ou escadas. Uma instrução

pode ainda fazer referência ao lado pelo qual o utilizador deve seguir. Este comportamento pode ser útil,

exactamente para quando se pretende criar uma referência. Caso seja impossível criá-la, então a instrução

terá de ser dada tendo em conta a distância (e.g. "Siga em frente cinco passos e vire à esquerda...").

Nos casos em que o utilizador se desvia do percurso ou pede ajuda ao sistema porque se perdeu, então

ser-lhe-á pedido que volte até ao último ponto de referência, de modo a poder retomar a sua rota. De acordo

com o estudo realizado junto dos utilizadores (ver Secção 3.1.3), este é o comportamento normalmente

adoptado e mais simples de realizar. Caso o utilizador indique explicitamente que não consegue voltar atrás,

então terá de ser traçada uma nova rota, tendo em conta a sua posição actual e o destino pretendido.

De modo a construir frases sintacticamente correctas, existe ainda uma gramática, que é responsável por

identificar o género e número dos objectos. É também possível obter o artigo definido correcto (i.e., ’o’, ’a’,

’os’, ’as’) e as suas formas combinadas (e.g., ’aos’, ’à’, ’do’, ’pelo’) dado um objecto e uma preposição (i.e.,

’a’, ’de’, ’em’, ’por’). Assim, temos uma ferramenta de suporte, que nos permite evitar frases como, "Siga em

frente até ao porta."

4.4. Módulo de LocalizaçãoUm guia móvel ou sistema de orientação tem de conseguir localizar o utilizador, para o guiar correctamente.

Este módulo de localização tem como única responsabilidade, fornecer a posição actual do utilizador, para

que seja usada pelos outros componentes da arquitectura.

Podemos resumir a utilidade de um módulo de localização a duas funcionalidades básicas. Em primeiro lugar,

automatizar o retorno, ou seja, fornecer instruções ao utilizador, à medida que este se desloca. Por outro lado,

59

Page 76: Blobby - ULisboa

caso o utilizador se perca, conseguir reencaminhá-lo. Na verdade, a automatização das instruções podia ser

substituída por uma funcionalidade de navegar nas instruções que iriam ser dadas ao utilizador. Assim, à

medida que o utilizador completasse uma instrução, poderia pedir a próxima e assim sucessivamente, até ao

seu destino. A principal utilidade advém da necessidade de reencaminhar o utilizador, caso este se perca.

Sem um sistema de localização, não existe forma de inferir a sua posição.

Apesar deste ter sido o módulo de menor foco no nosso trabalho, não deixa de ser importante. Para

minimizar a dependência do sistema à tecnologia de localização, foi desenvolvida uma arquitectura, à qual

podemos adicionar novos componentes, que têm a responsabilidade de obter uma posição no mapa. No

caso do Bluetooth, existe uma correspondência entre o beacon e o identificador do objecto no mapa. Assim,

quando o utilizador se aproxima do beacon, o módulo de localização actualiza a posição actual do utilizador.

Foi também adicionada uma componente de localização que recorre à tecnologia WLAN. O algoritmo foi

desenvolvido por Pedro Sousa e Vera Saraiva [50] e faz uso da força do sinal rádio, emitido pelos pontos de

acesso no local.

Este módulo permite ainda a conjugação dos resultados das várias tecnologias de localização. Ou seja, se

as tecnologias Bluetooth e WLAN poderem ser usadas, o sistema irá automaticamente fazer uso delas. Caso

o resultado do módulo WLAN seja diferente do que foi dado pelo módulo Bluetooth, então o resultado terá

de ser desambiguado. Caso a diferença entre a posição dada pelo módulo WLAN e Bluetooth seja inferior

ao alcance dos beacons Bluetooth, então essa será a posição escolhida. Caso contrário, será escolhida a

posição do módulo Bluetooth (Figura 4.4). Apesar de ambos os módulos funcionarem independentemente,

o Bluetooth actua como uma espécie de corrector e complemento ao sistema WLAN.

(a) WLAN tem maior precisão do que o

beacon Bluetooth.

(b) Beacon Bluetooth actua como um

corrector do sistema WLAN.

Figura 4.4: Representação do sistema localização, WLAN e Bluetooth.

4.5. Interface UtilizadorGeralmente associamos as interfaces utilizador a elementos gráficos e, no caso particular dos dispositivos

móveis, a elementos de reduzidas dimensões. Tal como foi visto no Capítulo 3.2.2, este tipo de dispositivos

60

Page 77: Blobby - ULisboa

são adequados para guias móveis, no entanto carecem de interfaces que suportem uma interacção apropriada

por parte dos utilizadores invisuais.

De modo a combater as interfaces visualmente exigentes, são necessários novos mecanismos de interacção,

que façam uso dos canais de comunicação disponíveis. No caso dos utilizadores invisuais, temos como

alternativa à visão, a audição e o tacto. O nosso objectivo foi construir uma interface que pudesse estar

disponível nos dispositivos móveis actuais e de acordo com as necessidades e capacidades destes utilizadores.

Para este fim, recorremos à multimodalidade.

Em relação às interfaces de entrada, apesar de existirem já algumas abordagens para dispositivos móveis

com teclados, a sua constante evolução, aliada à elevada aceitação dos ecrãs tácteis, levou a que estes se

tornassem disponíveis a preços cada vez mais reduzidos e com maior qualidade, abrindo portas a novas

formas de interacção. Mas, mais uma vez, os utilizadores invisuais estão privados de interagir com este tipo

de dispositivos, tornando-se necessária a construção de uma interface apropriada. Esta é uma das principais

contribuições desta dissertação.

4.5.1. Módulo de EntradaOlhando para o panorama actual das interfaces de entrada para dispositivos móveis, conseguimos identificar

dois grupos: teclados e ecrãs tácteis. Devido à crescente adopção deste último, decidimos criar um módulo

de entrada, em que podem ser adicionados novos mecanismos de interacção. No nosso protótipo, existem

dois mecanismos de interacção: teclado e ecrã táctil.

Em seguida, iremos ver, com maior detalhe, duas tarefas presentes na maior parte das aplicações para

dispositivos móveis: navegação em menus e introdução de texto.

Navegação em Menus

O modelo subjacente à navegação em menus é bastante semelhante para ambos os mecanismos de interacção

(i.e. teclado e ecrã táctil) e encontra-se representado na Figura 4.5.

Figura 4.5: Modelo de navegação em menus.

61

Page 78: Blobby - ULisboa

No caso do teclado, a navegação é conseguida através das teclas ’2’, ’8’, ’4’ e ’6’, para navegar para cima,

baixo, trás e seleccionar opção, respectivamente. O utilizador consegue facilmente localizar estas teclas,

construindo um cursor em redor da tecla ’5’.

No caso do ecrã táctil, não existe qualquer retorno háptico, ao contrário dos teclados, logo é necessária

uma abordagem um pouco diferente. O nosso mecanismo baseia-se na utilização de gestos sobre o ecrã,

permitindo ao utilizador interagir com o dispositivo, sem a necessidade de retorno visual ou háptico, ou seja,

com uma baixa carga cognitiva. No entanto, os gestos têm de ser escolhidos com algum cuidado. Estes

devem ser simples, fáceis de memorizar e executar, de modo a permitir ao utilizador uma interacção natural.

Para a navegação em menus foram escolhidos os gestos ’cima’, ’baixo’, ’esquerda’ e ’direita’, para navegar

para cima, baixo, trás e seleccionar opção, respectivamente (Figura 4.6).

(a) Seleccionar opção (b) Menu anterior (c) Opção

anterior

(d) Opção

seguinte

Figura 4.6: Gestos para navegação em menus.

Introdução de TextoO método de introdução de texto em ecrãs tácteis surge da evolução do trabalho NavTap [29]. Este método

permite aos utilizadores navegar no alfabeto, usando o teclado dos telemóveis. O alfabeto é dividido em

cinco linhas, em que o inicio de cada linha corresponde a uma vogal, porque estas são de fácil memorização.

O método de navegação é semelhante à navegação em menus. As teclas ’4’ e ’6’ permitem ao utilizador

navegar na horizontal, enquanto as teclas ’2’ e ’8’ permitem saltar entre vogais, usando-as como atalhos no

alfabeto. Ambas as formas de navegação (horizontal e vertical) são cíclicas (Figura 4.7). A tecla ’5’ insere

um espaço ou outro caracter especial e a tecla ’7’ apaga o último caracter inserido. Este método reduz a

necessidade de memorização, existente no método tradicional e, consequentemente, exige uma menor carga

cognitiva. No pior cenário, o utilizador tem apenas de navegar para a frente, até ouvir a letra desejada. Com

este mecanismo não existem caminhos errados, apenas caminhos mais curtos.

Mais uma vez, a interacção com ecrãs tácteis baseia-se na utilização de gestos. Este método (NavTouch) usa

o mesmo modelo de matriz do NavTap e os gestos vistos na Figura 4.6. Em vez de usar o teclado, o utilizador

pode executar gestos sobre o ecrã, em quatro direcções diferentes. As direcções direita e esquerda permitem

ao utilizador navegar na horizontal, enquanto as direcções cima e baixo permitem saltar entre vogais. Depois

de executar um gesto, se o utilizador continuar a pressionar o ecrã, a navegação continuará automaticamente

na última direcção.

62

Page 79: Blobby - ULisboa

Figura 4.7: Duas abordagens de navegação, até à letra ’t’.

Tendo em conta que os cantos do ecrã são os únicos pontos de referência no dispositivo, para simplificar e

minimizar o número de gestos, ambos os cantos inferiores são usados para mapear elementos da interface,

que se distinguem de todos os outros. É o caso das acções apagar o último caracter e inserir um espaço,

que correspondem aos cantos inferior direito e esquerdo, respectivamente.

No nosso protótipo, a introdução de texto permite ao utilizador efectuar procuras por palavra-chave. Assim,

caso existam demasiados pontos de interesse ou possíveis destinos, o utilizador poderá efectuar uma pesquisa

e tem a possibilidade de adicionar os resultados à sua rota. No entanto, este método de introdução de texto

apresenta ainda algumas limitações, tais como, introdução de caracteres acentuados e numéricos.

4.5.2. Módulo de SaídaNo módulo de saída, existem três modalidades: fala, som (não fala) e vibração. A modalidade de fala é usada

para descrever o estado actual do sistema, através de um sistema de Text-To-Speech (TTS). Na navegação

em menus, é utilizada para descrever o menu em questão, assim como as opções pelas quais o utilizador

vai navegando. Na tarefa de introdução de texto, à semelhança do que acontece na navegação em menus,

é usada para ler a letra seleccionada e as palavras que foram escritas. Em relação ao sistema de orientação

a fala é usada para dar ao utilizador a instrução que este deve executar.

O uso do som (earcons) pode ser visto como um complemento à fala. A utilização de earcons torna-se

apropriada quando queremos dar apenas uma mensagem de confirmação ou erro, através de um retorno

rápido, simples e com uma baixa carga cognitiva. É o caso das acções: seleccionar uma opção, voltar atrás,

erro ou sair da aplicação. Cada uma destas acções tem um som associado, que transmite ao utilizador

informação sobre o estado actual do sistema.

Para fazer uso de todas as capacidades dos dispositivos móveis actuais, decidimos também usar o retorno

vibratório. A vibração é geralmente usada para alertar o utilizador em ambientes ruidosos, como é o caso

de muitos ambientes interiores. No nosso protótipo, o retorno vibratório foi usado para indicar a presença

de uma nova instrução. Esta pode ser uma abordagem alternativa ao uso constante de auriculares, que

63

Page 80: Blobby - ULisboa

pode prejudicar o desempenho e aceitação do sistema por parte do utilizador. Para além disso, a vibração

é menos intrusiva que a fala ou som, permitindo ao utilizador executar outras tarefas (e.g. comunicar com

outras pessoas) e só depois ouvir a instrução.

64

Page 81: Blobby - ULisboa

5Resultados e

Discussão

O estado da arte e os estudos com utilizadores permitiram-nos identificar alguns dos principais problemas

dos sistemas de orientação para invisuais. Para fazer face aos mesmos, definimos um conjunto de guias de

desenho e uma abordagem que tira partido das capacidades e técnicas dos utilizadores. Além do retorno

familiar e compreensível, o nosso guia móvel permite a interacção com dispositivos móveis tradicionais (sem

o uso de acessórios), em particular com ecrãs tácteis.

Para conseguir validar a nossa abordagem e contribuições, foi construído um protótipo funcional (Capítulo

4), ao qual se impõe uma avaliação, em situações reais, com utilizadores invisuais. De modo a alcançar este

fim, o sistema foi avaliado segundo um conjunto de tarefas. Apesar do principal objectivo deste processo ser

a avaliação das instruções, efectuámos também uma avaliação à navegação em menus e introdução de texto.

Apesar do protótipo ter sido construído para uma variedade de dispositivos (teclado e ecrã táctil), toda a

avaliação foi realizada num dispositivo com ecrã táctil. Ao contrário dos teclados, usados anteriormente em

muitos trabalhos, a interacção com ecrãs tácteis tem uma componente bastante inovadora. Logo, optámos

por avaliar todo o protótipo recorrendo apenas a este tipo de dispositivos. Toda a avaliação foi efectuada na

Fundação Raquel e Martin Sain, uma instituição de formação para invisuais.

5.1. Avaliação da Introdução de TextoUma das tarefas mais difíceis de realizar por um invisual, num dispositivo móvel, é a introdução de texto. De

facto, esta é uma tarefa transversal a muitas aplicações, logo, necessária. No entanto, no caso particular dos

dispositivos com ecrãs tácteis, com as interfaces actuais, impossível de realizar. Esta avaliação irá permitir

comparar, avaliar e validar este novo método de interacção, com alguns já existentes para teclados. O anexo

A3 apresenta em detalhe o guião da avaliação.

65

Page 82: Blobby - ULisboa

5.1.1. Os UtilizadoresNesta avaliação, participaram cinco utilizadores (Figura 5.1), invisuais, com idades compreendidas entre os

trinta e seis e os cinquenta e cinco anos. Quatro dos utilizadores eram do sexo masculino, com um grau

de escolaridade inferior ao nono ano. No entanto, todos os utilizadores eram alfabetizados. É de notar que

nenhum dos participantes tinha uma experiência anterior com ecrãs tácteis.

(a) NavTouch. (b) NavTouch em detalhe.

Figura 5.1: Utilizador durante uma sessão de avaliação.

5.1.2. ProcedimentoTendo em vista o objectivo de tornar a avaliação mais rica e interessante, este método de interacção (NavTouch)

foi comparado com outros. Para comparar todas as abordagens e garantir a consistência dos resultados,

todos os procedimentos, assim como as tarefas a realizar, foram iguais. Os restantes métodos de introdução

de texto são o Multitap e NavTap (Secção 4.5.1).

O Multitap corresponde ao método tradicional de introdução de texto em dispositivos móveis. O utilizador

carrega repetidamente numa tecla para percorrer as letras a ela associadas, aceitando a selecção através

de um tempo de espera ou pressionando qualquer outra tecla.

A avaliação foi composta por três sessões, nas quais foi pedido a cada utilizador para introduzir três frases

(todas diferentes). A primeira sessão incluiu ainda um período de treino de vinte minutos. Os testes ao

sistema foram realizados num dispositivo móvel HTC TyTn com Windows Mobile 5.0 e o sistema de síntese

de fala da Loquendo (voz masculina, Eusébio).

5.1.3. ResultadosO primeiro resultado relevante desta avaliação está relacionado com o tempo de treino necessário para os

utilizadores se sentirem prontos para o teste. Apesar de estar definido um período de treino de vinte minutos,

todos os participantes se mostraram preparados pouco tempo depois de serem instruídos (aproximadamente

66

Page 83: Blobby - ULisboa

cinco minutos), enquanto o método tradicional (Multitap) revelou ser mais difícil de aprender.

Nesta avaliação, todos os utilizadores conseguiram levar a cabo as tarefas propostas, incluindo no método

Multitap. No entanto, este aspecto pode ser discutível, como iremos ver pelos resultados obtidos, em

particular pela qualidade final das frases transcritas.

A dificuldade em utilizar o método tradicional (mesmo com leitor de ecrã) está patente na Figura 5.2(a),

onde é apresentada a taxa de erros, relativa a cada método, por sessão. Esta taxa é calculada dividindo o

número de erros efectuados (apagar uma letra) pelo número de caracteres da frase a ser escrita. Com o

método Multitap a taxa de erros aumentou ao longo das sessões (47%, 60%, 71%), enquanto diminuiu com

o NavTap (17%, 6%, 4%) e NavTouch (27%, 17%, 14%).

A taxa de erro da distância mínima entre a frase objectivo e a frase transcrita pelos utilizadores (Minimum

String Distance Error Rate) mede a diferença entre estas duas frases. Durante as três sessões, o método

Multitap situa-se sempre acima dos restantes (Figura 5.2(b)), enquanto o NavTap termina com uma taxa de

10% e o NavTouch abaixo dos 5%. É importante realçar que, apesar dos utilizadores apagarem mais letras

com o NavTouch, o resultado final é melhor que o NavTap. Por outro lado, o número de erros e o resultado

final é sempre pior com o Multitap, mostrando que o utilizador tem muitas dificuldades em associar as letras

a cada tecla e perde a noção da frase que já foi transcrita.

(a) Taxa de erros por sessão. (b) Minimum String Distance Error Rate.

Figura 5.2: Comparação de métodos de introdução de texto.

Em relação ao toques (ou gestos) necessários para cada caracter (TPC), o Multitap apresenta uma grande

vantagem teórica e, apesar dos resultados (Figura 5.3(a)) coincidirem com os esperados na primeira sessão

(Multitap - 4.96 TPC; NavTap - 8.07 TPC; NavTouch - 6.02 GPC), este é ultrapassado pelas restantes

abordagens, à medida que os utilizadores começam a adoptar (aprender) caminhos mais curtos (Multitap

- 5.68 TPC; NavTap - 5.47 TPC; NavTouch - 4.68 GPC). O elevado desempenho do Multitap, na primeira

sessão, pode também ser justificado pelo período de treino (utilizadores esqueceram-se do mapeamento

letra/tecla).

Em relação ao desempenho, as abordagens por navegação revelam um aumento do número de palavras

67

Page 84: Blobby - ULisboa

por minuto, ao longo das sessões (Figura 5.3(b)), enquanto a abordagem tradicional se mostra inconstante

(0.8; 0.88; 0.68) e o resultado, após três sessões é inferior ao obtido após a sessão de treino inicial.

A diferença entre o NavTap e o NavTouch pode ser explicada pela carga associada a encontrar a tecla

direccional pretendida. No método NavTouch, os utilizadores conseguiram navegar mais facilmente nas

quatro direcções, visto que os gestos podem ser executados livremente no ecrã, sem nenhuma carga

adicional.

(a) Toques (ou gestos) por caracter. (b) Palavras por minuto.

Figura 5.3: Comparação de métodos de introdução de texto.

5.2. Avaliação da Navegação em MenusA navegação em menus é uma das formas mais comuns de interacção com dispositivos móveis e essencial

para o uso da maior parte das suas funcionalidades. Tendo sido avaliada a introdução de texto, uma tarefa

também transversal a muitas aplicações, a validação da nossa abordagem para a navegação em menus

impõe-se, de forma a fornecer ao utilizador todos os meios para uma interacção completa. Assim, usando

apenas dispositivos móveis com ecrãs tácteis, teremos um sistema completo e que abrange as tarefas mais

comuns neste tipo de dispositivos.

5.2.1. Os UtilizadoresEsta avaliação foi realizada a seis utilizadores, três do sexo masculino e três do sexo feminino, com idades

compreendidas entre os vinte e seis e os cinquenta e cinco anos. Dois dos participantes possuíam ainda

algum resíduo visual, no entanto, insuficiente para conseguirem identificar objectos ao seu redor. Nenhum

dos utilizadores tinha qualquer experiência com ecrãs tácteis. É de notar também que os utilizadores não

tiveram qualquer treino prévio com o tipo de instruções que lhes iriam ser dadas nem com o local em causa.

5.2.2. ProcedimentoA avaliação da navegação em menus correspondeu à primeira parte da avaliação das instruções do sistema

(Anexo A4), em que o utilizador tinha de seleccionar o mapa e destino, para dar inicio à tarefa de orientação.

68

Page 85: Blobby - ULisboa

Antes de iniciar a tarefa, os utilizadores tiveram um período de cinco minutos de treino e familiarização com

o dispositivo móvel, onde lhes foi explicado o mecanismo de navegação e selecção de menus. Os testes

foram realizados num dispositivo móvel HTC TyTn com Windows Mobile 5.0 e o sistema de síntese de fala

da Loquendo (voz masculina, Eusébio).

5.2.3. ResultadosApesar de todos os utilizadores se mostrarem cépticos em relação à utilização de um dispositivo com ecrã

táctil, após o período de treino, revelaram-se bastante motivados e prontos para iniciar o teste. Alguns

dos utilizadores referiram ainda que a interacção era mais simples do que aquela realizada com os seus

telemóveis.

Nesta avaliação, todos os utilizadores conseguiram terminar a tarefa, sem cometer qualquer erro. Apesar de

ser algo positivo, temos de ter também em conta o número reduzido de selecções que foram efectuadas. No

entanto, é um indicador da simplicidade e facilidade do método.

Os tempos de cada uma das selecções estão ilustrados na Figura 5.4. Apesar da navegação nos menus

ser cíclica, todos os utilizadores optaram pela abordagem mais natural de navegação, usando apenas as

direcções ’baixo’ e ’esquerda’ (para seleccionar). Os tempos desta avaliação são bastante satisfatórios,

apesar do tempo necessário para captar o retorno auditivo de cada uma das opções estar reflectido nos

resultados. Ainda assim e devido ao breve período de treino, alguns dos utilizadores não necessitaram de

ouvir todo o retorno auditivo para iniciarem a navegação e selecção.

Figura 5.4: Tempos na navegação em menus, em segundos.

Durante a tarefa de orientação, apenas um dos utilizadores interagiu com a aplicação, para ouvir a repetição

da instrução. O tempo associado a este comando é significativamente inferior às restantes, porque, nesta

situação a aplicação não faz nenhuma pergunta ao utilizador (e.g. "Seleccione um mapa."). Este apenas tem

de navegar até à opção pretendida e seleccioná-la.

69

Page 86: Blobby - ULisboa

5.3. Avaliação das InstruçõesO principal objectivo do nosso trabalho é guiar utilizadores invisuais, num ambiente interior e desconhecido,

até um destino, recorrendo a dispositivos móveis tradicionais. A nossa abordagem consiste num retorno

auditivo (fala) familiar e compreensível, que permita aos utilizadores deslocarem-se pelo local, fazendo uso

dos seus utensílios e técnicas de M&O (Mobilidade e Orientação).

Na Secção 3.3, foi descrita uma avaliação preliminar, recorrendo a um teste de Feiticeiro de Oz, que nos

permitiu validar a nossa abordagem. No entanto, toda a aplicação e interacção pessoa-máquina foram

simuladas por um humano. Logo, para finalizar a avaliação da nossa abordagem, o nosso protótipo terá

de ser testado num cenário real com os utilizadores alvo. Irá ser posta à prova a qualidade das instruções

geradas, mas também de todos os outros componentes do protótipo (i.e. interface e sistema de localização).

5.3.1. ProcedimentoO local e percurso escolhidos foram os mesmos da avaliação preliminar (ver Secção 3.3), de modo a

podermos comparar alguns resultados. No entanto, foi usado apenas um piso, devido às limitações impostas

pelo sistema de localização. A tecnologia escolhida foi o Bluetooth, pela facilidade de instalação e maior

precisão, quando comparada com a WLAN. Foram colocados alguns telemóveis, em pontos estratégicos do

percurso, com o objectivo de localizar o utilizador. No entanto, como os dispositivos possuíam um alcance

máximo de dez metros (Bluetooth, classe dois), existia uma sobreposição de sinal. Para solucionar este

problema, todos os telemóveis foram envolvidos em papel de alumínio (Figura 5.5), de forma a reduzir a

força do sinal e permitir que o sistema identifique apenas um dispositivo em simultâneo. A utilização de

Bluetooth tem ainda a desvantagem de ser bastante lento no processo de descoberta de outros dispositivos.

Como foi dito anteriormente, usámos apenas um piso, devido ao número limitado de beacons Bluetooth

disponíveis.

Figura 5.5: Telemóvel envolvido em alumínio.

No inicio do teste, os utilizadores tiveram uma pequena sessão de acolhimento, onde lhes foram explicados

70

Page 87: Blobby - ULisboa

todos os procedimentos, objectivos do teste e lido o formulário de consentimento. Os utilizadores foram

também informados das limitações do sistema de localização, ou seja, foi-lhes pedido para que, ao completar

cada instrução, aguardassem até receberem a próxima.

Tal como na avaliação preliminar, a tarefa foi completar um percurso pré determinado e desconhecido de

todos os utilizadores (Figura 5.6). A tarefa terminava apenas quando o utilizador identificasse o destino.

Neste caso, seria a porta de acesso às escadas. Nenhum dos utilizadores teve qualquer treino prévio

com a aplicação, ou seja, não tinham conhecimento da forma como seriam dadas as instruções. Todos

os utilizadores tiveram, durante a tarefa, o primeiro contacto com este tipo de instruções.

Figura 5.6: Percurso da avaliação final.

Caso os utilizadores não se enganassem no caminho, as instruções que ouviam eram as seguintes: "Siga

em frente, junto ao lado direito, até à máquina." e "Vire à esquerda e siga em frente, junto ao lado direito, até

à porta de saída."

Por fim, foi realizado um questionário, que teve como objectivo obter o grau de satisfação e aceitação dos

utilizadores. O Anexo A4 descreve detalhadamente o guião desta avaliação.

5.3.2. ResultadosDos seis participantes, apenas um necessitou de ajuda externa para conseguir completar o percurso. Neste

caso particular, o utilizador mostrou bastantes dificuldades em diferenciar as direcções, direita e esquerda,

daí a necessidade de ajuda.

71

Page 88: Blobby - ULisboa

Todos os restantes participantes conseguiram terminar o percurso sem dificuldades de maior. A Figura 5.7

representa os tempos necessários, por utilizador, para completar a tarefa e a sua relação com o tempo de

espera, associado ao sistema de localização. O tempo de espera representa o processo de identificação

de outros dispositivos Bluetooth. Neste teste, representa em média (aproximadamente) 20% do tempo da

tarefa. Apesar das limitações, os utilizadores conseguiram interpretar as instruções e identificar os pontos

de referência, para esperarem pelas próximas instruções.

Figura 5.7: Tempos da tarefa, em segundos. Relação entre o tempo de deslocação e o tempo de espera pelas

instruções.

Na realidade, o sistema de localização foi usado apenas para conseguirmos validar a nossa abordagem

e era necessário, apenas para automatizar o retorno ao utilizador. De acordo com os estudos realizados

anteriormente, os utilizadores guiam-se através de um conjunto de pontos de referência, logo, as instruções

poderiam ser pedidas à medida que o utilizador atinge o final de cada instrução. O sistema de localização

seria realmente necessário, caso o utilizador se perdesse. Esta situação não sucedeu, nesta avaliação.

Em comparação com a avaliação preliminar, existiram menos erros e, consequentemente, menos ajudas,

por duas razões. Em primeiro lugar, as instruções mais problemáticas, em particular o seu vocabulário,

foram alteradas, de acordo com a opinião dos utilizadores. Em segundo lugar, estes foram informados das

limitações do sistema de localização e, portanto, tiveram de esperar pela instrução, após completarem a

anterior. No caso da avaliação preliminar, os utilizadores tiveram um comportamento de seguir sempre em

frente, até se perderem e, muitas vezes quando a instrução era dada, já não correspondia à realidade. Desta

vez, os utilizadores esperaram até lhes serem dadas as instruções, levando a menos erros e ajudas.

A Figura 5.8 representa o tempo, em média, que os utilizadores estiveram num dado local do percurso.

Como seria de esperar, passaram mais tempo nos locais em que necessitavam de receber novas instruções.

Analisando o mapa, podemos ver que todos os utilizadores tiveram percursos bastante semelhantes e o

desvio foi mínimo. Este resultado sugere que as instruções foram acessíveis e facilmente compreendidas.

72

Page 89: Blobby - ULisboa

No entanto, junto ao destino, os utilizadores tinham de realizar uma ligeira curva para a esquerda, que não

estava indicada na instrução, o que os levou a explorar com mais atenção o local. Outra possível razão, foi o

facto de essa zona não ter parede e transmitir uma falsa sensação de entrada, induzindo alguns utilizadores

em "erro". No entanto, todos conseguiram identificar a porta de saída sem problemas de maior.

Figura 5.8: Mapa termal dos percursos efectuados.

No final de cada sessão, efectuámos um pequeno questionário, de forma a obter o grau de satisfação e

opiniões dos utilizadores. Este questionário era composto por seis perguntas, que podiam ser classificadas

numa escala de cinco pontos [49]. Os resultados estão disponíveis na Figura 5.9

Figura 5.9: Resultados do pós-questionário. Classificação média, por pergunta.

73

Page 90: Blobby - ULisboa

5.4. DiscussãoDepois de descritos os resultados alcançados nas três principais tarefas do sistema, estamos em condições

de analisar e discutir a sua usabilidade. Nesta secção, iremos dividir os resultados em quatro factores

[11, 49]: utilidade, eficácia, aprendizagem e satisfação.

UtilidadeA utilidade está relacionada com a capacidade do sistema permitir ao utilizador atingir os seus objectivos.

Este é o factor mais importante, porque se o utilizador não conseguir atingir os seus objectivos, então o

sistema é inútil e a análise dos restantes factores desnecessária.

Pelos resultados obtidos, a nossa abordagem é útil. Na tarefa de orientação, os utilizadores foram capazes

de compreender e executar as instruções, sem a necessidade de qualquer treino prévio. A interacção com

o dispositivo móvel (tradicional), em particular com o ecrã táctil, mostrou ser bastante simples e acessível.

Ao abordar as principais tarefas: navegação em menus e introdução de texto, conseguimos validar a nossa

abordagem e tornar acessível grande parte dos cenários de interacção com este tipo de dispositivos.

EficáciaApós termos visto que os utilizadores conseguiram atingir os seus objectivos, podemos analisar a eficácia

com que o fizeram. Eficácia ou facilidade de uso quantifica a forma e os meios necessários para completar

uma tarefa. Em primeira análise, com excepção de um, todos os utilizadores conseguiram terminar a tarefa

de orientação. Todos os utilizadores seguiram um percurso semelhante, sem desvios, indicando um alto grau

de eficácia.

Na tarefa de navegação em menus, todos compreenderam e conseguiram completar a tarefa proposta, com

um treino prévio de apenas cinco minutos. Nenhum dos utilizadores cometeu qualquer erro, o que indica

uma abordagem de interacção bastante simples e fácil de executar.

Em relação à introdução de texto, o NavTouch apresenta um aumento do número de palavras por minuto,

em 150% e 300% em relação aos restantes métodos, NavTap e Multitap, respectivamente. O número de

gestos por caracter (4.68) é, em média, inferior ao NavTap e Multitap em 0.8 e 1 toques por caracter,

respectivamente. O número de erros apresenta-se três vezes superior ao NavTap, embora a qualidade

final das frases seja melhor.

AprendizagemA aprendizagem está relacionada com a evolução do desempenho, após um período pré determinado de

treino. É sobre a tarefa de introdução de texto que poderemos retirar as maiores conclusões, visto ter sido

74

Page 91: Blobby - ULisboa

realizada em mais de uma sessão. De acordo com os resultados, ao fim de três sessões, os utilizadores

mostraram uma melhoria de desempenho, diminuindo o número de erros e gestos por caracter e aumentando

o número de palavras por minuto. Em relação aos erros, estes foram reduzidos para aproximadamente

metade. O número de gestos por caracter foi reduzido em mais de 20% e o número de palavras por minuto

passou de 1,60 para 2,08. Todos os resultados indicam que a nossa abordagem promove a aprendizagem e

a melhoria de desempenho.

Tanto a tarefa de orientação como a de navegação de menus foram executadas apenas uma vez por cada

utilizador. No caso da navegação em menus, os resultados sugerem uma rápida aprendizagem e facilidade

de execução, visto que os utilizadores tiveram um treino prévio de apenas cinco minutos. Na tarefa de

orientação, nenhum dos utilizadores conhecia o local e não existiu qualquer treino à forma como iriam ser

dadas as instruções. No entanto, apenas um deles não conseguiu completar com sucesso a tarefa, sendo

que os restantes mostraram um percurso bastante semelhante e de acordo com o esperado.

SatisfaçãoA satisfação, do inglês likability, refere-se à opinião dos utilizadores e ao grau de aceitação do sistema.

Estes resultados foram obtidos através da realização de um questionário após os testes, onde os utilizadores

tiveram de classificar algumas características, numa escala de cinco valores. Em termos gerais, os resultados

foram bastante positivos (Figura 5.9). Todas as classificações foram, em média, superiores a quatro valores,

sendo que a avaliação global obteve uma classificação de quatro valores e meio, o que indica um alto grau

de satisfação.

75

Page 92: Blobby - ULisboa
Page 93: Blobby - ULisboa

6Conclusões

No inicio do nosso trabalho, definimos como principal objectivo, a criação de um sistema de orientação

para invisuais. De acordo com o estado da arte, apesar de existirem algumas soluções, estas carecem

de uma interface adequada para invisuais. Muito do trabalho centra-se na tecnologia de localização ou

numa abordagem que permita localizar o utilizador com maior precisão. Apesar de ser uma componente

importante, não garante, por si só, o sucesso do sistema. Tornam-se necessárias novas abordagens, que

permitam guiar o utilizador de uma forma eficaz e adequada às suas necessidades e capacidades.

6.1. Sumário da DissertaçãoPara atingir os objectivos propostos, a nossa abordagem consistiu num estudo das técnicas de mobilidade

e orientação, assim como as formas de comunicação usadas por este tipo de utilizadores. Em seguida,

identificámos um conjunto de elementos que podem constituir uma instrução (Acção, Direcção, Lado, Tempo,

Distância, Objecto), com o objectivo de formalizar a sua construção e dar aos utilizadores um retorno familiar

e compreensível.

Neste tipo de sistema, a mobilidade é essencial, por isso, a escolha de dispositivos móveis comuns foi óbvia.

No entanto, tendo em conta a população alvo, os processos de interacção tiveram de ser redesenhados.

Em particular, focámos a nossa abordagem no uso de ecrãs tácteis, devido à inexistência de soluções

apropriadas para utilizadores invisuais.

Para avaliar todas as opções tomadas, foi construído um protótipo, que permite guiar um utilizador, por um

percurso desconhecido, com base num conjunto de instruções. A criação das instruções obedece a um

conjunto de regras, retiradas dos estudos com utilizadores, garantindo assim um retorno familiar e facilmente

compreensível.

De forma a cobrir grande parte dos dispositivos móveis actuais, o uso do sistema pode ser efectuado a partir

de um teclado ou ecrã táctil, dependo do dispositivo que o utilizador possui. Não esquecendo a localização,

77

Page 94: Blobby - ULisboa

foi criado um módulo independente, que permite isolar esta componente, minimizando assim a dependência

do sistema a uma dada tecnologia.

A avaliação final mostrou que os utilizadores compreenderam as instruções dadas pelo sistema, sem a

necessidade de qualquer treino prévio. Isto, porque os utilizadores efectuaram um percurso bastante semelhante,

apesar de não conhecerem o local. Em relação à interacção com ecrãs tácteis, conseguimos validar a nossa

abordagem e disponibilizar um conjunto de cenários (i.e. navegação em menus e introdução de texto), que

cobrem a maior parte das interacções com este tipo de dispositivos.

Concluindo, nesta dissertação, apresentámos uma abordagem que permite aos utilizadores invisuais deslocar-se

em locais desconhecidos, recorrendo a um conjunto de instruções familiares. Os resultados obtidos mostram

que estas são acessíveis e facilmente compreendidas. Podemos também concluir que a utilização de

dispositivos móveis comuns é adequada, se os processos de interacção forem redesenhados e as capacidades

e necessidades dos utilizadores forem incluídas no processo de desenho.

6.2. Vantagens

Grande parte dos trabalhos na área não tem qualquer contacto com os utilizadores, durante o processo

de desenho, originando, muitas vezes, sistemas inadequados. A nossa abordagem surgiu de um estudo

centrado no utilizador, onde foram estudadas as suas capacidades e criado um sistema que vai ao encontro

das suas expectativas. Deste estudo, foi retirado um conjunto de conclusões e guias de desenho, que poderá

ser útil para trabalhos futuros na área.

A nossa abordagem dá ao utilizador um retorno familiar e de acordo com as suas capacidades, ao invés

de o forçar a adoptar novas técnicas de mobilidade e orientação. Após uma análise cuidada, foi definido

um conjunto de regras e sugestões, para a construção de instruções. Todos os utilizadores referiram que

o diálogo era adequado e facilmente entendido e mostraram-se bastante interessados na continuação do

nosso trabalho.

As interfaces tácteis começam a ser muito comuns no nosso dia-a-dia, em particular nos dispositivos móveis

mais recentes. O nosso método de interacção oferece, aos utilizadores invisuais, a possibilidade de usar

este tipo de dispositivos, de uma forma simples e eficaz, por vezes, com um desempenho superior ao uso do

teclado. Além do mais, este método pode ser estendido a várias tarefas, tais como a introdução de texto ou

navegação em menus, não só em dispositivos móveis, mas também noutro tipo de superfícies tácteis.

78

Page 95: Blobby - ULisboa

6.3. LimitaçõesApesar de termos criado uma interface que fornece aos utilizadores um conjunto de instruções familiares e

adequadas, existem algumas limitações.

Talvez a maior limitação do nosso trabalho esteja relacionada com o reduzido número de cenários e situações

em que foram realizados os estudos e a avaliação final. Apesar do cenário escolhido ter um número

significativo de obstáculos, perigos e ruído, assemelhando-se a um local público, o contexto não pode ser

igualado. Além do mais, a análise de um maior número de ambientes, situações e locais só iria contribuir

para o enriquecimento do nosso trabalho.

Outra das limitações é o sistema de localização. Apesar de termos desenvolvido uma arquitectura suficientemente

modular, para que possam ser adicionados novos mecanismos de localização, este não foi o principal foco do

trabalho. Ainda assim, conseguimos validar a nossa abordagem e obter um alto grau de satisfação junto dos

utilizadores. No entanto, o sistema de localização, em particular a sua precisão e desempenho, revelaram

ser factores bastante importantes para qualquer guia móvel.

6.4. Trabalho FuturoNo decorrer do nosso trabalho de investigação, surgiram várias ideias que podem ser vistas como futuros

projectos. Estes trabalhos têm como base a área de acessibilidade móvel, mais concretamente, sistemas de

orientação e interacção com dispositivos móveis, para utilizadores invisuais.

Mais cenáriosO nosso trabalho consistiu na construção de um sistema de orientação e no estudo de instruções para

ambientes interiores. No entanto, o número de cenários estudados foi bastante limitado. De forma a construir

um sistema robusto, torna-se necessária a utilização de uma maior diversidade de cenários. Esta expansão

poderia ser efectuada em ambientes interiores (e.g. edifícios públicos), mas também exteriores. Durante

o estudo com os utilizadores, tornar o sistema disponível em ambientes exteriores foi uma ideia sempre

presente e que poderia ser bastante útil num cenário urbano.

Guia PessoalTendo como ponto de partida o trabalho desenvolvido nesta dissertação, a forma de comunicação e em

particular, as instruções dadas aos utilizadores poderiam depender de um conjunto de características pessoais.

A criação de um guia, com um alto grau de personalização, poderia influenciar o comportamento da aplicação,

para que esta se pudesse adaptar a cada utilizador. O tipo de cegueira, a existência de outras deficiências

79

Page 96: Blobby - ULisboa

(e.g. motoras ou auditivas), o grau de escolaridade, a idade, a carga cognitiva ou interesses são apenas

alguns exemplos do tipo de personalização que se pretende. Todas estas características poderiam influenciar

a forma como a informação é apresentada ao utilizador.

FamiliarizaçãoDurante o desenvolvimento da nossa abordagem, um dos nossos objectivos era fornecer aos utilizadores um

retorno familiar. Como complemento à tarefa de navegação, seria interessante desenvolver uma solução que

permitisse ao utilizador familiarizar-se com o local em causa, mesmo antes de o visitar. Existem já algumas

soluções com vista a este objectivo, que permitem simular um espaço, mas todas necessitam de dispositivos

especializados e com elevado custo. O principal objectivo seria estudar de que forma um dispositivo comum

(e.g. computador ou telemóvel) poderia servir para este efeito.

Interacção com Ecrãs TácteisUma das contribuições do nosso trabalho é um novo método de interacção com ecrãs tácteis. Apesar da

nossa abordagem ter sido validada em dois cenários distintos - introdução de texto e navegação em menus -,

os dispositivos móveis possuem muitas outras funcionalidades. Com a crescente inclusão dos ecrãs tácteis

neste tipo de dispositivos, mais uma vez, os utilizadores invisuais ficam impossibilitados de usufruir das suas

potencialidades. Acreditamos que o nosso trabalho poderá servir de ponto de partida para a construção

de um sistema, baseado exclusivamente numa interacção com ecrãs tácteis, que permita aos utilizadores

invisuais aceder a grande parte das funcionalidades dos seus dispositivos móveis.

80

Page 97: Blobby - ULisboa

Bibliografia

[1] Infrared data association. Em http://www.crisp.nus.edu.sg/ research/tutorial/em.htm, última visita

24/07/2008.

[2] L. Aalto, N. Gothlin, J. Korhonen, and T. Ojala. Bluetooth and WAP push based location-aware mobile

advertising system. In Proceeding of the 2nd international conference on Mobile systems, applications

and services, pages 49–58, 2004.

[3] Direct Mobile Accessories. Nokia hands free kit. Em http://www.directmobileaccessories.co.uk/default.php?

cPath=137_3589, última visita 24/07/2008.

[4] G. Anastasi, R. Bandelloni, M. Conti, F. Delmastro, E. Gregory, and G. Mainetto. Experimenting na indoor

bluetooth-based positioning service. In Proceeding of the 23rd International Conference on Distributed

Computing Systems Workshops, pages 480–483, 2003.

[5] H. Auernhammer. Precision Farming - The environment challenge. In In Computers and Electronics in

Agriculture, pages 31–43, 2001.

[6] Axistive. Trekker. Em http://www.axistive.com/trekker.html, última visita 24/07/2008.

[7] P. Bahl and V. Padmanabhan. RADAR: An In-Building RF-based User Location and Tracking System. In

In Proceedings of the Nineteenth Annual Joint Conference of the IEEE Computer and Communications

Societies, pages 775–784, New York, 2000. IEEE.

[8] M.M. Blattner, D.A. Sumikawa, and R.M. Greenberg. Earcons and Icons: Their Structure and Common

Design Principles. Human-Computer Interaction, 4(1):11–44, 1989.

[9] Bluetooth.com. Wii controller. Em http://www.bluetooth.com/Bluetooth/Connect/Products/Product_Details.htm?

ProductID=2951, última visita 24/07/2008.

[10] S. Bohonos, A. Lee, A. Malik, C. Thai, and R. Manduchi. Universal Real-Time Navigational

Assistance (URNA): An Urban Bluetooth Beacon for the Blind. In Proceedings of the 1st ACM

SIGMOBILE international workshop on Systems and networking support for healthcare and assistive

living environments, pages 83–88, New York, 2007. ACM Press.

[11] P.A. Booth. An Introduction to Human-Computer Interaction. Psychology Press (UK), 1989.

[12] Sensing Centre for Remote Imaging and Processing. Electromagnetic waves. Em

http://www.crisp.nus.edu.sg/ research/tutorial/em.htm, última visita 24/07/2008.

81

Page 98: Blobby - ULisboa

[13] L.W. Ching and MKH Leung. SINVI: smart indoor navigation for the visually impaired. Control,

Automation, Robotics and Vision Conference, 2004. ICARCV 2004 8th, 2, 2004.

[14] V. Coroama. The Chatty Environment - A World Explorer for the Visually Impaired. In In Adjunct

Proceedings of Ubicomp, 2003.

[15] American Technologies Network Corporation. How night vision works. Em

http://www.atncorp.com/HowNightVisionWorks, última visita 24/07/2008.

[16] J. Coughlan and R. Manduchi. Functional Assessment of a Camera Phone-Based Wayfinding System

Operated by Blind Users. In In International IEEE Symposium on Research on Assistive Technology,

Washington DC, 2007. IEEE.

[17] W. Crandall, B. Bentzen, and L. Myers. Transit accessibility improvement through talking signs remote

infrared signage: A demonstration and evaluation. final report to us department of transportation, federal

transit administration and project action of the national easter seal society, 1995.

[18] Digisensory. Face detection. Em http://www.digisensory.com/facedetection.html, última visita

24/07/2008.

[19] EW Dijkstra. A note on two problems in connexion with graphs. Numerische Mathematik, 1(1):269–271,

1959.

[20] A.J. Dix, A. Dix, J. Finlay, and G.D. Abowd. Human-Computer Interaction. Prentice Hall, 2004.

[21] Ekahau. Ekahau positioning engine. Em http://www.ekahau.com/?id=4500, última visita 24/07/2008.

[22] Sound for Sight. The ultra cane. Em http://www.soundforesight.co.uk/product.htm, última visita

24/07/2008.

[23] United for Sight. Portugal statistics, 2001. Em http://www.uniteforsight.org/eye_stats.php, última visita

24/07/2008.

[24] J. Friedl. Mastering Regular Expressions. O’Reilly Media, Inc., 2006.

[25] Google. Wi-fi in mountain view. Em http://googleblog.blogspot.com/2005/11/wi-fi-in-mountain-view.html,

última visita 24/07/2008.

[26] D. Grantham and B. Moore. Handbook of Perception and Cognition: Hearing, pages 297–345. Academic

Press, New York, second edition, 1995.

[27] T. Green. Feds approve human rfid implants. The Register, 2004. Em

http://www.theregister.co.uk/2004/10/14/human_rfid_implants, última visita 24/07/2008.

[28] Sendero Group. Sendero gps. Em http://www.senderogroup.com/gpspromo.htm, última visita

24/07/2008.

82

Page 99: Blobby - ULisboa

[29] Tiago Guerreiro, Paulo Lagoá, Pedro Santana, Daniel Gonçalves, and Joaquim Jorge. Navtap and

brailletap: Non-visual input interfaces. In Proceedings of the Rehabilitation Engineering and Assistive

Technology Society of North America Conference, Washington DC, 2008.

[30] S. Helal, S. Moore, and B. Ramachandran. Drishti: An Integrated Navigation System for Visually Impaired

and Disabled. In In Proceedings of the Fifth International Symposium on Wearable Computers, pages

149–156, Washington DC, 2001. IEEE Computer Society.

[31] E. Hjelmas and B. Low. Face Detection: A Survey. In In Computer Vision and Image Understanding,

pages 236–274, 2001.

[32] A. Hub, J. Diepstraten, and T. Ertl. Design and Development of an Indoor Navigation and Object

Identification System for the Blind. In In Design for Accessibility, pages 147–152, New York, 2004.

ACM Press.

[33] A. Hub, T. Hartter, and T. Ertl. Interactive Tracking of Movable Objects for the Blind on the Basis of

Environment Models and Perception-Oriented Object Recognition Methods. In Proceedings of the 8th

international ACM SIGACCESS conference on Computers and accessibility, pages 111–118, New York,

2006. ACM Press.

[34] RFID Journal. Nokia unveils rfid phone reader, 2004. Em

http://www.rfidjournal.com/article/articleview/834/1/13/, última visita 24/07/2008.

[35] Y. Kawai and F. Tomita. A Visual Support System for Visually Impaired Persons Using Acoustic Interface.

IAPR Workshop on Machine Vision Applications, pp, pages 379–382, 2000.

[36] J. Loomis, R. Golledge, and R. Klatzky. Navigation System for the Blind: Auditory Display Modes and

Guidance. In Presence: Teleoperators and Virtual Environments, pages 193–203, Cambridge, 1998.

MIT Press.

[37] J.M. Loomis, Marston, J.R., Golledge, R.G., and R.L. Klatzky. Personal Guidance System for People with

Visual Impairment: A Comparison of Spatial Displays for Route Guidance. Journal of Visual Impairment

and Blindness, 98(3):135–147, 2004.

[38] H. Luo, Z. Jiang, B. Kim, N. Shankaranarayanan, and P. Henry. Integrating Wireless LAN and Cellular

Data for the Enterprise. In In IEEE Internet Computing, pages 25–33, Piscataway, 2003. IEEE

Educational Activities Department.

[39] A. Marsh, M. May, and M. Saarelainen. Pharos: Coupling GSM & GPS-TALK technologies to

provide orientation, navigation and location-based services for the blind. In In IEE EMBS International

Conference on Information Technology Applications in Biomedicine, pages 38–43, Washington DC,

2000. IEEE Computer Society.

[40] J.R. Marston, Loomis, J.M., Klatzky, R.L., and R.G. Golledge. Nonvisual Route Following with Guidance

from a Simple Haptic or Auditory Display. JOURNAL OF VISUAL IMPAIRMENT AND BLINDNESS,

101(4):203, 2007.

83

Page 100: Blobby - ULisboa

[41] D.A. Norman. The design of everyday things. New York: Doubleday, 1990.

[42] A. Patil, D. Kim, and L. Ni. A study of frequency interference and indoor location sensing with 802.11b

and Bluetooth Technologies. In International Journal of Mobile Communications, pages 621–644, 2006.

[43] J. Rajamaki, P. Viinikainen, J. Tuomisto, T. Sederholm, and M. Saamanen. LaureaPOP Indoor Navigation

Service for the Visually Impaired in a WLAN Environment. In In Proceedings of the 6th WSEAS Int. Conf.

on Electronics, Hardware, Finland, 2007. Laurea University of Applied Sciences.

[44] S. Ram and J. Sharf. The People Sensor: A Mobility Aid for the Visually Impaired. In In Proceedings of

the 2nd IEE International Symposium on Wearable Computers, pages 166–167, Washington DC, 1998.

IEEE.

[45] L. Ran, S. Helal, and S. Moore. Drishti: An Integrated Indoor/Outdoor Blind Navigation System and

Service. In In Proceedings of the Second IEEE Annual Conference on Pervasive Computing and

Communications, pages 23–30, Washington DC, 2004. IEEE Computer Society.

[46] S. Resnikoff, D. Pascolini, D. Etya’ale, I. Kocur, R. Pararajasegaram, G. Pokharel, and S. Mariotti. Global

data on visual impairment in the year of 2002. In Bulletion of the World Health Organization, 2002.

[47] D. Ross and B. Blasch. Wearable Interfaces for Orientation and Wayfinding. In In Proceedings of the

fourth international ACM conference on Assistive Technologies, pages 193–200, New York, 2000. ACM

Press.

[48] D. Ross and A. Lightman. Talking Braille: A Wireless Ubiquitous Computing Network for Orientation and

Wayfinding. In In Proceedings of the 7th international ACM SIGACCESS conference on Computers and

accessibility, pages 98–105, New York, 2005. ACM Press.

[49] J. Rubin and T. Hudson. Handbook of Usability Testing: How to Plan, Design, and Conduct Effective

Tests. John Wiley & Sons, Inc. New York, NY, USA, 1994.

[50] Pedro Sousa and Vera Saraiva. People finder, 2004. Universidade Técnica de Lisboa, Instituto Superior

Técnico, Departamento de Engenharia Informática, Trabalho final de curso.

[51] T. Starner, D. Kirsch, and S. Assefa. The Locust Swarm: And environmentally-powered, networkless

location and messaging system. In In First International Symposium on Wearable Computers, pages

169–170, Washington DC, 1997. IEEE.

[52] T. Strothotte, S. Fritz, R. Michel, A. Raab, H. Petrie, and V. Johnson. Development of Dialogue Systems

for a Mobility Aid for Blind People: Initial Design and Usability Testing. In In Proceedings of the second

annual ACM conference on Assistive technologies, pages 139–144, New York, 1996. ACM.

[53] N. Swami and S. Ahamed. Error Modeling in RF-based Location Detection (EMLD) for Pervasive

Computing Environments. In The Second International Conference on Availability, Reliability and

Security, pages 783–790, 2007.

84

Page 101: Blobby - ULisboa

[54] S. Takeda, I. Morioka, K. Miyashita, A. Okumura, Y. Yoshida, and K. Matsumoto. Age variation in upper

limit of hearing. European Journal of Applied Physiology, pages 403–408, 2004.

[55] Paulo Tavares and Rui Mendes. Homero - storytelling for wayfinding, 2004. Universidade Técnica de

Lisboa, Instituto Superior Técnico, Departamento de Engenharia Informática, Trabalho final de curso.

[56] F. Tomita, T. Yoshimi, T. Ueshiba, Y. Kawai, Y. Sumi, T. Matsushita, N. Ichimura, K. Sugimoto, and

Y. Ishiyama. R&D of versatile 3D vision system VVV. Systems, Man, and Cybernetics, 1998. 1998

IEEE International Conference on, 5, 1998.

[57] M. Turunen, J. Hakulinen, A. Kainulainen, A. Melto, and T. Hurtig. Design of a Rich Multimodal Interface

for Mobile Spoken Route Guidance. Proceedings of Interspeech, pages 2193–2196, 2007.

[58] M. Turunen, T. Hurtig, J. Hakulinen, A. Virtanen, and S. Koskinen. Mobile Speech-based and Multimodal

Public Transport Information Services. Proceedings of MobileHCI 2006 Workshop on Speech in Mobile

and Pervasive Environments, 2006.

[59] J.B.F. Van Erp, H.A.H.C. Van Veen, C. Jansen, and T. Dobbins. Waypoint navigation with a vibrotactile

waist belt. ACM Transactions on Applied Perception (TAP), 2(2):106–117, 2005.

[60] Vídeo-Surveillance-Guide. How does thermal imaging work? Em

http://www.video-surveillance-guide.com/how-does-thermal-imaging-work.htm, última visita 24/07/2008.

[61] A. Virtanen and S. Koskinen. NOPPA: Navigation and guidance system for the blind. In Proceedings of

the 11th World Congress and Exhibition on ITS, 2004.

[62] Paul Vittelo. A ring tone meant to fall on deaf ears. The New York Times, 2006.

[63] Y. Wang, X. Jia, and H. Lee. An indoors wireless positioning system based on wireless local area network

infrastructure. In In The 6th International Symposium on Satellite Navigation Technology Including Mobile

Positioning & Location Services, 2003.

[64] R.L. Welsh, B.B. Blasch, and W.R. Wiener. Foundations of Orientation e Mobility, pages 9–38. AFB

Press, second edition, 1997.

[65] David H. Williams. The strategic implications of wal-mart’s rfid mandate, 2004. Em

http://www.directionsmag.com/, última visita 24/07/2008.

[66] S. Willis and S. Helal. RFID Information Grid for Blind Navigation and Wayfinding. In In Proceedings of

the ninth International Symposium on Wearable Computers, pages 34–37, Washington DC, 2005. IEEE

Computer Spociety.

[67] J. Wilson, B.N. Walker, J. Lindsay, C. Cambias, F. Dellaert, and B.I.T. Center. SWAN: System for

Wearable Audio Navigation. Wearable Computers, 2007 11th IEEE International Symposium on, pages

1–8, 2007.

[68] I. Young, J. Gerbrands, and L. Vliet. Fundamentals of Image Processing. Delft University of Technology,

1995.

85

Page 102: Blobby - ULisboa
Page 103: Blobby - ULisboa

A1Análise Preliminar

A1.1. Questionário e Resultados

Tabela A1.1: Questionário e respectivos resultados, parte um.

87

Page 104: Blobby - ULisboa

Tabela A1.2: Questionário e respectivos resultados, parte dois.

88

Page 105: Blobby - ULisboa

A1.2. Plano de ObservaçãoEste anexo apresenta o plano de observação da análise preliminar.

A1.2.1. MotivaçãoEsta observação está focada no estudo das técnicas de mobilidade e orientação e nas formas de comunicação

entre utilizadores invisuais. Um dos principais desafios das interfaces de sistemas de orientação é dar

ao utilizador um retorno auditivo adequado. No final desta observação, esperamos ter retirado algumas

conclusões sobre a forma como os utilizadores exploram um espaço desconhecido, como constroem o seu

modelo mental, quais as informações mais relevantes, principais dificuldades e como transmitem toda essa

informação a colegas invisuais.

A1.2.2. Avaliação Preliminar dos Utilizadores

Tabela A1.3: Resultados dos pré-questionários da fase de observação.

A1.2.3. ProcedimentosSerá proposto ao participante um conjunto de tarefas de exploração de um local interior, desconhecido

e recolhidos dados sobre as técnicas utilizadas, opiniões, comentários e descrições do espaço. Serão

efectuadas três sessões a cada participante (individualmente), com a duração de quarenta e cinco minutos

cada. O objectivo será permitir ao utilizador explorar todo o espaço, de modo a obter um conhecimento total

do local, para que, no final, consiga guiar um colega invisual por um percurso.

Preparação: Em primeiro lugar, terá de ser escolhido um local desconhecido a todos os participantes. No

entanto, este deve proporcionar um ambiente controlado, para que as tarefas possam ser executadas sem

interrupções. Escolhido o local, será necessário escolher um ponto de origem, destino e o percurso. Visto

que o objectivo é estudar a forma como os participantes exploram o local e como comunicam entre si, temos

de garantir que todos têm um conhecimento total do espaço, para que consigam guiar outra pessoa. Logo,

será necessário elaborar um conjunto de tarefas, de modo a garantir que, no final, todos os utilizadores se

conseguem orientar no local. Devem ainda ser impressos os pré-questionários, formulários de consentimento

89

Page 106: Blobby - ULisboa

e guião do monitor.

Recebimento, consentimento e pré-questionário: No primeiro contacto com o participante, o monitor

deverá dar uma breve introdução do trabalho que está a ser efectuado e criar um ambiente confortável.

O monitor deverá deixar bem claro que o participante não estará de forma alguma a ser avaliado, apenas

a colaborar na investigação e mostrar gratidão por isso. Depois do primeiro contacto, será efectuado o

pré-questionário e lido o formulário de consentimento na presença de um terceiro elemento.

Orientação: Serão propostas aos participantes um conjunto de tarefas. Nesta fase, será explicado ao

utilizador o propósito de cada uma delas. Mais uma vez, é importante frisar que o participante não irá ser

avaliado. É também importante que este se sinta à vontade e preparado para executar cada tarefa. Apesar de

existir um conjunto de tarefas bem definidas, de modo a garantir alguma consistência entre os participantes,

estes não devem ser privados de explorar o local. Ou seja, devemos deixar o participante à vontade para

tomar iniciativa.

Execução das tarefas: Cada tarefa deverá ser lida ao participante e, caso seja necessário, esclarecer

alguma dúvida. Durante a execução da tarefa, apesar do monitor andar sempre por perto do participante,

para garantir alguma segurança, não deverá intervir, a não ser que seja absolutamente necessário. No

entanto, os participantes são encorajados a partilhar as suas opiniões e pensamentos, durante a execução

da tarefa. O monitor será responsável por tomar anotações, principalmente em relação aos comportamentos

adoptados, opiniões e comentários do participante.

Debriefing: Depois de terminada cada sessão, os participantes serão entrevistados, de modo a recolher

opiniões e comentários. Apesar de existirem linhas gerais para as entrevistas, estas poderão divergir, de

acordo com os comentários e comportamentos de cada participante. No final desta fase será agradecida a

sua participação.

A1.2.4. Lista de Tarefas:As tarefas de exploração propostas permitirão ao participante obter um conhecimento total do local e construir

um mapa mental adequado. No final de cada sessão o monitor terá de garantir que os objectivos de

exploração são cumpridos.

• Primeira sessão

– Explorar livremente o local, com o objectivo de chegar ao final do percurso

– Contar a história do percurso na totalidade

• Segunda sessão

– Encontrar a porta da dispensa da cave

– Descobrir quantos pilares existem no piso inferior

– Descrever os caminhos que existem, desde as escadas até à dispensa do piso inferior

90

Page 107: Blobby - ULisboa

– Descrever o que rodeia o participante: em frente às escadas do piso inferior; junto à mesa do

telefone; junto à porta de saída do piso inferior; junto à dispensa;

– Contar a história do percurso na totalidade

• Terceira sessão

– Contar a história do percurso na totalidade

– Contar a história, caso a pessoa se engane no percurso e esteja junto à dispensa

– Identificar os quatro pilares do piso inferior e em cada um deles apontar para os seguintes locais:

escadas; telefone; secretária; dispensa;

– Identificar os pontos mais importantes no percurso

• Em todas as sessões

– Contar a história divida por troços

A1.3. Plano da Reunião de GrupoEste anexo apresenta o plano da reunião de grupo da análise preliminar.

A1.3.1. MotivaçãoDe modo a solidificar alguns dos resultados e conclusões retiradas anteriormente no estudo com utilizador,

torna-se necessária uma reunião de grupo, onde possam ser debatidos estes pontos. Em particular, esta

reunião irá servir para construir um conjunto de instruções, de acordo com o percurso previamente traçado,

na fase de observação, reunindo a opinião de todos os participantes.

A1.3.2. Os ParticipantesOs participantes terão de conhecer o local e o percurso onde foi feita a observação, de modo a podermos

cumprir os objectivos da reunião. Iremos contar também com um ex-instrutor de técnicas de mobilidade e

orientação, que nos poderá dar uma opinião mais técnica e de acordo com o que este tipo de utilizadores

aprende em cursos de reabilitação.

A1.3.3. ProcedimentoIrão ser reunidos os participantes da fase de observação, assim como um ex-instrutor em técnicas de

mobilidade e orientação para invisuais. Durante a reunião, irão ser debatidos um conjunto de temas, com

especial foco nas histórias recolhidas anteriormente e na possibilidade de construir uma só história (a

"melhor"), tendo em conta a opinião de todos os participantes.

Preparação: Em primeiro lugar, terá de ser construído um plano de trabalhos para a reunião e comunicá-lo

aos participantes, para que estes possam ter algum tempo, caso seja necessário, para se preparar. É

91

Page 108: Blobby - ULisboa

necessário, também, imprimir o guião do monitor e obter um gravador de voz devidamente carregado.

Recebimento, consentimento: No início da reunião, o monitor deverá apresentar os objectivos, as principais

conclusões da fase anterior e explicitar detalhadamente o plano de trabalhos. Deverá, também, deixar bem

claro que os participantes não estarão a ser avaliados, apenas a colaborar no trabalho de investigação e

mostrar a sua gratidão. Em seguida, poderá ler o formulário de consentimento.

Plano de trabalhos: O monitor da reunião deverá assumir um papel de moderador e proporcionar um

ambiente de discussão e debate. O plano de trabalhos para esta reunião é o seguinte:

• Construção de uma só história

• Construção das histórias, caso o participante se engane no percurso

• Quais as informações mais relevantes para concluir um percurso

• Que outras informações, para além do percurso, também são desejáveis

• Qual a melhor forma de transmitir todas estas informações

A1.4. Resposta às 11 Perguntas1. Quem vai utilizar o sistema?

Qualquer pessoa poderá usar o sistema, no entanto, a interface terá características que o tornam ideal

para pessoas com deficiências visuais.

2. Que tarefas executam actualmente?

Utilizam um número muito limitado de funcionalidades no seu telemóvel, nomeadamente, receber e

efectuar chamadas. Em relação às capacidades de orientação e mobilidade, este tipo de utilizadores

consegue deslocar-se bastante bem em locais conhecidos. Caso o edifício seja desconhecido, então

dependem bastante da ajuda de terceiros.

3. Que tarefas são desejáveis?

O sistema de orientação deve conseguir: guiar o utilizador até um destino, previamente especificado;

contextualizar o utilizador, tendo em conta a sua localização; alertar o utilizador para a existência de

perigos ou sinais.

4. Como se aprendem as tarefas?

Actualmente, as técnicas de mobilidade e orientação são aprendidas num curso de reabilitação, realizado

pela maioria dos utilizadores deficientes visuais. Existe ainda a possibilidade de aprenderem estas

técnicas através da sua experiência pessoal ou convívio.

5. Como são desempenhadas as tarefas?

Actualmente, o utilizador tem de explorar o local ou pedir ajuda a terceiros, para construir um modelo

mental que lhe possibilite deslocar-se pelo espaço. Este processo torna-se bastante moroso e, por

vezes, perigoso para utilizadores invisuais.

92

Page 109: Blobby - ULisboa

6. Quais as relações entre utilizador e informação?

Não é relevante.

7. Que outros instrumentos tem o utilizador?

Os utilizadores invisuais andam sempre com uma bengala, numa das mãos, para conseguir evitar

obstáculos ou outros perigos iminentes (escadas, buracos, etc.)

8. Como comunicam os utilizadores entre si?

Os utilizadores comunicam pessoalmente, em particular no local de trabalho, centros de reabilitação,

edifícios públicos, etc.

9. Qual a frequência de desempenho das tarefas?

Este tipo de utilizadores faz uso das suas capacidades de orientação e mobilidade diariamente. Não

têm por hábito andar acompanhados, mas necessitam muitas vezes de ajuda, especialmente se o local

for desconhecido.

10. Quais as restrições de tempo impostas?

Tendo em conta que o utilizador se está a movimentar, ao fornecer qualquer tipo de ajuda, esta tem de

fazer sentido no espaço/tempo em que este se encontra.

11. Que acontece se algo correr mal?

Caso o utilizador se perca, tem como opções: pedir ajuda; tentar localizar-se no espaço;

A1.5. RequisitosO levantamento de requisitos é uma etapa importante no desenvolvimento de qualquer projecto. Cada

requisito identifica uma parte do que irá ser o sistema final, logo, o correcto levantamento de todos os

requisitos é crucial para o sucesso do sistema. Com base no estudo feito com os utilizadores irão ser

identificados os principais requisitos, divididos por: funcionais, de dados, ambientais, de utilizador e de

usabilidade.

Tabela A1.4: Requisitos do sistema.

93

Page 110: Blobby - ULisboa
Page 111: Blobby - ULisboa

A2Avaliação Preliminar

A2.1. Pré-Questionário e Resultados

Tabela A2.1: Resultados dos pré-questionários da avaliação preliminar.

A2.2. Plano de Avaliação PreliminarEste anexo apresenta o plano de observação da avaliação preliminar.

A2.2.1. IntroduçãoEste documento descreve o guião da avaliação preliminar, onde o principal objectivo é validar a nossa

abordagem e a forma como o utilizador é guiado por um percurso e local desconhecidos.

A2.2.2. MotivaçãoEsta avaliação preliminar tem como principal foco o retorno auditivo. Um dos principais desafios das interfaces

de sistemas de orientação é dar ao utilizador um retorno auditivo adequado. As instruções que irão ser dadas

são o reflexo de um estudo centrado no utilizador, em particular das técnicas de mobilidade e orientação e

formas de comunicação usadas. Assim, pretendemos validar a informação que é dada ao utilizador através

do seu desempenho e resultados qualitativos (comentários e opiniões).

95

Page 112: Blobby - ULisboa

Para garantir a validade das nossas conclusões, iremos efectuar um teste de Feiticeiro de Oz, onde o

Feiticeiro substitui o comportamento do dispositivo móvel e do nosso sistema.

A2.2.3. Questões de InvestigaçãoEsta avaliação tenta responder às seguintes questões:

1. A interacção através do diálogo é uma abordagem viável?

2. Os pontos de referência escolhidos influenciam o desempenho do utilizador?

3. A informação de cada instrução é suficiente?

4. Os utilizadores compreendem o vocabulário?

5. Os utilizadores conseguem associar as instruções à realidade?

A2.2.4. Perfil de UtilizadorEsta avaliação irá contar com um total de nove participantes. O único requisito necessário para efectuar esta

avaliação é não ter um conhecimento prévio do local.

A2.2.5. Metodologia de AvaliaçãoEsta avaliação consiste numa simulação Feiticeiro de Oz [20], que permitirá validar as instruções recolhidas

na fase de observação e na reunião de grupo. A sessão de avaliação é composta por seis secções:

Preparação: Devem ser impressos os pré-questionários, formulários de consentimento e guião do Feiticeiro

de Oz. É necessário obter equipamento de filmagem e testá-lo. Por último, verificar se o percurso construído

na fase de observação continua intacto.

Recebimento, consentimento e pré-questionário: No primeiro contacto com o participante, o monitor

deverá dar uma breve introdução do trabalho que está a ser efectuado e criar um ambiente confortável. O

monitor deverá deixar bem claro que o participante não estará, de forma alguma, a ser avaliado, apenas a

colaborar na investigação e mostrar gratidão por isso. Em seguida, deverá ler o formulário de consentimento,

na presença de uma testemunha e efectuar o pré-questionário.

Configuração do equipamento: O único equipamento necessário para esta avaliação é a câmara de filmar,

logo o monitor deverá certificar-se que estará operacional durante toda a sessão.

Orientação: Será proposto aos participantes que sigam um conjunto de instruções, desde um ponto de

partida até um destino, previamente definidos. Mais uma vez, é importante frisar que o utilizador não estará

a ser avaliado. É também importante que o mesmo se sinta à vontade e preparado para executar a tarefa.

96

Page 113: Blobby - ULisboa

Execução do teste: Cada tarefa deverá ser lida ao participante e esclarecidas as dúvidas, caso seja

necessário. Durante a execução da tarefa, apesar do monitor (Feiticeiro de Oz) andar sempre por perto,

para garantir alguma segurança, não deverá intervir, a não ser que seja absolutamente necessário. Caso

tenha de fazê-lo, devido a alguma situação não prevista, então será contabilizado como uma ajuda externa

ao sistema.

Debriefing: Depois de terminada cada sessão, os participantes serão entrevistados, de modo a recolher

opiniões e comentários. Apesar de existirem linhas gerais para as entrevistas, estas poderão divergir,

de acordo com os comentários e teste de cada participante. No final desta fase, será agradecida a sua

participação.

A2.2.6. Lista de Tarefas

Esta avaliação será composta por apenas uma tarefa:

• Seguir um conjunto de instruções ao longo de um percurso (Figura A2.1), previamente definido.

A2.2.7. Ambiente de Avaliação

A avaliação preliminar será realizada no mesmo local da observação, na cave da Fundação Raquel e Martin

Sain. Este espaço não é utilizado pelos formandos desta instituição e foi-nos possível simular um cenário

real, com diversos percursos e obstáculos.

(a) Primeiro piso. (b) Segundo piso.

Figura A2.1: Mapa e percurso do local onde foi efectuada a avaliação preliminar. As marcas a azul indicam os pontos

onde serão dadas as instruções.

97

Page 114: Blobby - ULisboa

A2.2.8. Monitor da AvaliaçãoNeste caso, o monitor da avaliação corresponde ao Feiticeiro de Oz, que tem como responsabilidade simular

o sistema e dar ao utilizador as instruções, de acordo com a sua posição no espaço. É esperado que o

monitor não ajude os participantes, a não ser que estes a peçam ou a sua integridade esteja em risco.

A2.2.9. Dados da AvaliaçãoDurante a avaliação preliminar foram recolhidas as seguintes informações:

• Pensamentos, comentários e opiniões dos participantes

• Captura de vídeo e áudio do teste

• Avaliação subjectiva do monitor

A2.2.10. Relatório da AvaliaçãoO relatório final deverá incluir o procedimento, objectivos, resultados e discussão.

A2.3. Resultados da Avaliação PreliminarNeste anexo irão ser apresentados os resultados do teste e da entrevista posterior.

A2.3.1. Resultados do TestePara a análise de alguns dos resultados o mapa foi dividido por zonas (Figura A2.2)

(a) Piso superior. (b) Piso inferior.

Figura A2.2: Mapa do local, dividido por áreas.

98

Page 115: Blobby - ULisboa

Tabela A2.2: Resultados da avaliação preliminar.

A2.3.2. Entrevista Posterior e ResultadosA escala usada para classificar algumas das perguntas é limitada entre um e quatro, onde um corresponde

à pior classificação e o quatro à melhor classificação.

Tabela A2.3: Resultados da entrevista posterior.

99

Page 116: Blobby - ULisboa
Page 117: Blobby - ULisboa

A3Avaliação da

Introdução de Texto

A3.1. Pré-Questionário e Resultados

Tabela A3.1: Resultados dos pré-questionários da avaliação da introdução de texto.

A3.2. Plano de AvaliaçãoEste anexo apresenta o plano da avaliação da introdução de texto. O principal objectivo é validar a nossa

abordagem de introdução de texto em dispositivos móveis com ecrãs tácteis.

A3.2.1. MotivaçãoApesar de não ser o principal foco do nosso trabalho, a introdução de texto mostra-se como uma das

principais e mais complexas tarefas de interacção com dispositivos móveis. Para além disso, caso a nossa

abordagem seja válida, irá permitir a este tipo de utilizadores efectuar procuras por pontos de interesse,

através da introdução de uma palavra-chave.

101

Page 118: Blobby - ULisboa

A3.2.2. Metodologia de AvaliaçãoA sessão de avaliação é composta por cinco secções:

Preparação: Devem ser impressos os pré-questionários, formulários de consentimento e guião da sessão. O

monitor deverá, também, certificar-se que todo o equipamento de filmagem e telemóveis estão devidamente

carregados. A aplicação deverá estar instalada nos dispositivos móveis.

Recebimento, consentimento e pré-questionário: No primeiro contacto com o participante, o monitor

deverá dar uma breve introdução do trabalho que está a ser efectuado e criar um ambiente confortável. O

monitor deverá deixar bem claro que o participante não estará, de forma alguma, a ser avaliado, apenas a

colaborar na investigação e mostrar gratidão por isso. Em seguida, deverá ler o formulário de consentimento,

na presença de uma testemunha e efectuar o pré-questionário.

Configuração do equipamento: O equipamento de filmagem deverá ser montado, para que sejam capturadas

todas as interacções utilizador / dispositivo. O monitor deverá, também, certificar-se que a aplicação foi

iniciada e está a funcionar correctamente.

Orientação: Serão propostas aos utilizadores um conjunto de tarefas. Em cada sessão, cada utilizador terá

de transcrever três frases. Cada uma delas será comunicada verbalmente, após a conclusão da anterior.

Na primeira sessão, haverá um período de treino de vinte minutos. Este treino irá consistir na explicação do

método ao utilizador e numa fase de experimentação da aplicação.

Execução do teste: Cada tarefa deverá ser lida ao participante e esclarecidas as dúvidas, caso seja

necessário. Durante a execução da tarefa, o monitor não deverá intervir, a não ser que o utilizador lhe

peça a descrição da tarefa.

A3.2.3. Lista de TarefasEsta avaliação será composta por três tarefas por sessão. Cada tarefa corresponde à transcrição de uma

frase.

• Primeira sessão: "acabei de chegar"; "ja comprei o jornal de hoje"; "amanha nao vou poder ir";

• Segunda sessão: "hoje vou jantar fora"; "ainda vou apanhar o comboio"; "ontem consegui acabar o

trabalho todo";

• Terceira sessão: "obrigado pela prenda"; "ja estou quase a acabar"; "este foi o ultimo teste";

102

Page 119: Blobby - ULisboa

A3.2.4. Ambiente de AvaliaçãoA avaliação será efectuada na Fundação Raquel e Martin Sain, num ambiente controlado. O dispositivo

móvel que irá ser usado é o HTC TyTn, com Windows Mobile 5.0.

A3.2.5. Dados da AvaliaçãoIremos recolher os seguintes dados:

• Tempo de cada tarefa e caracter

• Número de erros (apagar caracter)

• Número de gestos por caracter

• Frase transcrita

• Avaliação subjectiva

A3.3. Resultados da AvaliaçãoNeste anexo irão ser apresentados os resultados da avaliação da introdução de texto.

(a) Erros por sessão. (b) Minimum String Distance Error Rate.

(c) Toques (ou gestos) por caracter. (d) Palavras por minuto.

Figura A3.1: Resultados da avaliação da introdução de texto.

103

Page 120: Blobby - ULisboa
Page 121: Blobby - ULisboa

A4Avaliação das

Instruções

A4.1. Pré-Questionário e Resultados

Tabela A4.1: Resultados dos pré-questionários da avaliação final.

105

Page 122: Blobby - ULisboa

A4.2. Plano da Avaliação das InstruçõesEste anexo apresenta o plano da avaliação das instruções. O principal objectivo é validar a nossa abordagem

de construção automática de instruções, assim como a interacção com dispositivos móveis com ecrã táctil.

A4.2.1. MotivaçãoDepois de construído o protótipo, torna-se necessário efectuar uma avaliação com utilizadores, de modo

a validar o sistema. Em particular nesta avaliação, irão ser avaliadas as instruções e interacções com o

dispositivo móvel. Depois de uma avaliação preliminar, em que todo o sistema foi simulado por um humano,

nesta altura, exige-se uma avaliação ao protótipo em tempo real. Por fim, serão recolhidos os resultados

qualitativos, que permitem validar a aceitação e satisfação dos utilizadores.

A4.2.2. Metodologia de AvaliaçãoA sessão de avaliação é composta por seis secções:

Preparação: Devem ser impressos os questionários, formulários de consentimento e guião da sessão. O

monitor deverá, também, certificar-se que todo o equipamento de filmagem e telemóveis estão devidamente

carregados. A aplicação deverá estar instalada no dispositivo móvel.

Recebimento, consentimento e pré-questionário: No primeiro contacto com o participante, o monitor

deverá dar uma breve introdução do trabalho que está a ser efectuado e criar um ambiente confortável. O

monitor deverá deixar bem claro que o participante não estará, de forma alguma, a ser avaliado, apenas a

colaborar na investigação e mostrar gratidão por isso. Em seguida, deverá ler o formulário de consentimento,

na presença de uma testemunha e efectuar o pré-questionário.

Configuração do equipamento: O monitor da sessão deverá escolher um local apropriado de filmagem,

para que seja possível filmar todo o percurso, sem intervir na tarefa. Deverá, também, configurar e instalar

todo o equipamento de localização no local e certificar-se do seu correcto funcionamento. Por fim, iniciar a

aplicação.

Orientação: No inicio da sessão, o utilizador terá um período de treino, em que lhe será explicado o método

de navegação em menus com ecrã táctil, seguido de uma fase de experimentação, não superior a cinco

minutos. Em seguida, o utilizador será guiado até ao ponto inicial do percurso e estará apto para iniciar a

tarefa de orientação.

Execução do teste: A tarefa será lida ao participante e esclarecidas as dúvidas, caso seja necessário.

Durante a execução da tarefa, o monitor não deverá intervir, excepto se o utilizador pedir explicitamente

106

Page 123: Blobby - ULisboa

ajuda ou a sua integridade esteja em risco. Caso aconteça, será contabilizado como uma ajuda externa ao

sistema. Durante a tarefa, o utilizador irá receber instruções provenientes do dispositivo móvel, à medida que

se desloca pelo local.

Debriefing: Depois de terminada cada sessão, os participantes serão entrevistados, de modo a recolher

opiniões e comentários. Apesar de existirem linhas gerais para as entrevistas, estas poderão divergir, de

acordo com os seus comentários. No final desta fase, será agradecida a participação dos utilizadores.

A4.2.3. Lista de TarefasEsta avaliação será composta por uma tarefa:

• Escolher o mapa "Fundação", o destino "Porta de saída"e executar as instruções.

A4.2.4. Ambiente de AvaliaçãoA avaliação final será efectuada na cave da Fundação Raquel e Martin Sain. Este é um espaço que não

é usado pelos formandos desta instituição, logo ideal para a avaliação do sistema, visto que os utilizadores

desconhecem o local.

A4.2.5. Dados da AvaliaçãoOs dados que iremos recolher são:

• Tempo necessário para seleccionar cada opção dos menus

• Número e direcção dos gestos efectuados sobre o ecrã

• Número de erros de navegação em menus

• Tempo de recuperação dos erros de navegação em menus

• Tempo de deslocação e espera (pelo sistema de localização) de cada participante

• Número de erros efectuados durante a tarefa de orientação

• Ajudas externas e do sistema

• Percurso efectuado por cada participante

• Avaliação subjectiva do monitor

A4.3. Resultados da AvaliaçãoNeste anexo, irão ser apresentados os resultados da avaliação e respectiva entrevista.

107

Page 124: Blobby - ULisboa

A4.3.1. Resultados do Teste

Tabela A4.2: Resultados da navegação em menus.

Tabela A4.3: Resultados da tarefa de orientação.

Figura A4.1: Mapa termal dos percursos efectuados.

A4.3.2. Entrevista Posterior e ResultadosA escala usada para classificar as perguntas é limitada entre um e cinco, em que o um e o cinco correspondem

à pior e melhor classificação, respectivamente.

108

Page 125: Blobby - ULisboa

Tabela A4.4: Resultados da entrevista posterior.

109