Download pdf - A Importância da Prosódia na Avaliação de … diferenças entre as avaliações. Esse projeto foi aprovado pelo Comitê de Ética em Pesquisa sob o no. 44465314.0.0000.5482. Descritores:

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO

Layla Penha

A Importância da Prosódia na Avaliação de Qualidade e

na Compreensão e Compreensibilidade da Fala

Interpretada Simultaneamente

Mestrado em Linguística Aplicada e Estudos da Linguagem

São Paulo

2015

Layla Penha

A Importância da Prosódia na Avaliação de Qualidade e

na Compreensão e Compreensibilidade da Fala

Interpretada Simultaneamente

Dissertação apresentada à banca

examinadora da Pontifícia

Universidade Católica de São

Paulo, como exigência parcial para

obtenção do título de Mestre em

Linguística Aplicada e Estudos da

Linguagem, sob orientação da

Prof.ª. Drª. Sandra Madureira.

São Paulo

2015

AUTORIZO A REPRODUÇÃO E DIVULGAÇÃO TOTAL OU PARCIAL DESTE

TRABALHO, POR QUALQUER MEIO CONVENCIONAL OU ELETRÔNICO,

PARA FINS DE ESTUDO E PESQUISA, DESDE QUE CITADA A FONTE.

FICHA CATALOGRÁFICA

Penha, Layla.

A Importância da Prosódia na Avaliação de Qualidade e na Compreensão e

Compreensibilidade da Fala Interpretada Simultaneamente, 2015.

150 páginas

Dissertação de Mestrado apresentada à banca examinadora da Pontifícia

Universidade Católica de São Paulo, como exigência parcial para obtenção do

título de Mestre. Área de Concentração: Linguística Aplicada e Estudos da

Linguagem.

Orientador: Madureira, Sandra.

1. Intérprete de Conferências, 2. Interpretação Simultânea, 3. Prosódia, 4.

Qualidade na Interpretação, 5. Compreensão e Compreensibilidade na

Interpretação.

Layla Penha

A Importância da Prosódia na Avaliação de Qualidade e na Compreensão e

Compreensibilidade da Fala Interpretada Simultaneamente

Dissertação apresentada à banca

examinadora da Pontifícia

Universidade Católica de São

Paulo, como exigência parcial para

obtenção do título de Mestre em

Linguística Aplicada e Estudos da

Linguagem, sob orientação da

Prof.ª. Drª. Sandra Madureira.

Aprovada em: ___/___ /___

Banca Examinadora

Prof. Dr.:________________________________________

Instituição:_____________________ Assinatura:__________

Prof. Dr.:________________________________________


Prof. Dr.:________________________________________


AGRADECIMENTOS

Primeiramente, gostaria de agradecer a minha orientadora, Prof. Sandra

Madureira, por ter me acolhido no programa e por me apresentar ao mundo

acadêmico de forma tão generosa e ao mesmo tempo, tão profissional, sem

dúvida marca indelével pelo resto de minha vida. Também à Prof. Zuleica

Camargo, por sua competência e conhecimento, certamente um exemplo a ser

seguido, ao Prof. Mário Fontes, pela inestimável contribuição na análise

estatística deste trabalho, e à Prof. Lúcia Helena França, por suas sugestões,

correções e observações preciosas na leitura desta dissertação.

Aos incríveis colegas que participaram desta pesquisa, como sujeitos

avaliados e avaliadores, os quais não posso nomear, por razões de

confidencialidade, mas cuja disposição e coragem foram fundamentais para a

realização deste estudo.

Aos colegas do curso de pós-graduação em Linguística Aplicada da

PUC São Paulo, Amaury Guitar, Cris Magacho, Daniel Leão, Gabriela Daneluci,

Hosana Alves, Lilian Kuhn, Malu Waldow, Nathalia Reis, Renata Vieira e

Robinson Melo, por terem sido grandes parceiros de jornada, ombros amigos

nas lágrimas e companheiros das risadas, e em particular à Andrea Baldi, por

sua amizade, carinho e inestimável ajuda na revisão deste trabalho.

Aos colegas do Departamento de Inglês que atuam no Curso Sequencial

de Interpretação Glória Sampaio, Leila Darin, Luciana Carvalho, Reynaldo

Pagura e Vicky Weischtordt, por terem me dado a oportunidade de participar de

um programa tão importante na formação de intérpretes no Brasil.

Às minhas parceiras de trabalho e de vida, sócias do Grupo Coletivo de

Intérpretes, que acompanharam cada passo de meu caminho profissional e

educacional, Andrea Negreda, Carla Gazola, Cecilia Tsukamoto, Daniele

Fonseca, Emily Ruiz, Flávia Romano, Patrizia Copola e Suzana Gontijo.

Aos meus alunos, por sua receptividade, abertura, vontade de aprender

e experimentar, e ainda por me permitirem aplicar em aula muitas das lições

aprendidas durante este programa de mestrado.

Aos colegas intérpretes dedicados à formação de intérpretes, pesquisa e

aprimoramento da profissão, Branca Vianna, Carmen Nigro, Carla Nejm,

Christiano Sanches, Daniele Fonseca, David Coles, Denise Vasconcelos,

Jayme Pinto, Marcelle Castro, Paulo Silveira, Raffaella Quental e Raquel

Schaitza, aos quais admiro muito e que me serviram como exemplo neste

caminho.

E, finalmente, à minha incrível família, meu amado Beto Tibiriçá,

companheiro e parceiro de tantos anos, Isabella e Nuno, filhos tão queridos,

Edna e Lino Penha, pais sempre tão presentes – mesmo na ausência de um –

e ainda aos meus irmãos, cunhados e cunhadas, sogros, sobrinhos mais que

fantásticos e imprescindíveis agregados.

Sem todos e cada um de vocês, nada disso seria possível.

Layla

RESUMO

Penha, L. A Importância da Prosódia na Avaliação de Qualidade e na

Compreensão e Compreensibilidade da Fala Interpretada

Simultaneamente. [Dissertação]. São Paulo: Pontifícia Universidade Católica

de São Paulo, 2015.

Esta dissertação contempla a interpretação simultânea, modalidade inserida

dentro da área de Interpretação de Conferências. O objetivo deste estudo é

verificar as características prosódicas da fala semi-espontânea e da fala

interpretada de um grupo de intérpretes e analisar como as características da

fala interpretada podem influenciar a avaliação de qualidade e compreensão da

mensagem produzida pelo intérprete. Participam como sujeitos da pesquisa

doze intérpretes de conferência, do sexo feminino. As intérpretes foram

audiogravadas em uma fala semi-espontânea e durante a interpretação

simultânea de uma palestra. Três segmentos amostrais representativos do

discurso (nas posições inicial, medial e final da palestra) foram selecionados.

Foram realizados três tipos de estudo: um de natureza acústica, um de

natureza perceptiva da qualidade e compreensibilidade da produção oral dos

intérpretes e outro da qualidade da interpretação em relação ao discurso

interpretado em termos de conteúdo semântico-discursivo. Com a utilização do

software Praat, foram analisadas acusticamente as características prosódicas

da fala semi-espontânea das intérpretes e dos extratos selecionados,

comparando-os em termos de número e distribuição de grupos entoacionais e

pausas, taxa de elocução e frequência fundamental média, mínima e máxima.

Por meio de um questionário com base na escala de Likert aplicado a 90

juízes, foram avaliados os efeitos impressivos da produção oral dos intérpretes

e através de um protocolo de avaliação aplicado a 3 profissionais da área de

formação em interpretação foram comparadas as transcrições do discurso

produzido pelas intérpretes em relação ao discurso interpretado para

verificação da manutenção do sentido original (S), presença de erros (E) e de

omissões (O). Os resultados foram discutidos para verificação de similaridades

e diferenças entre as avaliações. Esse projeto foi aprovado pelo Comitê de

Ética em Pesquisa sob o no. 44465314.0.0000.5482.

Descritores: Intérprete de Conferências, Interpretação Simultânea, Prosódia,

Qualidade na Interpretação, Compreensão e Compreensibildade na

Interpretação

ABSTRACT

This paper addresses the area of simultaneous interpretation, interpreting mode

inserted in the field of Conference Interpreting. The purpose of this study is to

verify the prosodic features of semi-spontaneous and interpreted speeches of a

group of interpreters and analyze how such features may interfere in the

assessment of quality and comprehension of the message delivered in

interpretation. The subjects of this study were twelve female conference

interpreters. The interpreters were recorded when producing a semi-

spontaneous speech and during the simultaneous interpretation of a lecture.

Three sampling segments representing the speech (extracted from the start,

middle and end positions of the lecture) were selected. We conducted three

types of assessment: an acoustic analysis of the selected speech samples, a

perceptive assessment on the quality and comprehensibility of interpreters’ oral

production, and an assessment on the quality of the content of the interpretation

compared to the original lecture. Using the software Praat, we analyzed the

prosodic features of interpreters’ semi-spontaneous and interpreted speeches

acoustically, comparing them in terms of number and distribution of intonation

groups and pauses; speech rate; and average, minimum and maximum

fundamental frequency rates. By means of a questionnaire based on the Likert

Scale applied to 90 judges, we assessed the impressive effects of interpreters’

oral production. Three interpreter trainers followed an assessment protocol to

compare the speech produced by interpreters and the original lecture and verify

completeness of original sense (S), errors (E) and omissions (O). Results were

then compared for similarities and differences. This project was approved by the

Brazilian Research Ethics Committee under no. 44465314.0.0000.5482.

Key words: Conference Interpreter, Simultaneous Interpreting, Prosody,

Comprehension and Comprehensibility in Interpretation, Quality in

Interpretation.

Lista de Tabelas

Tabela 1. Comparação da classificação dos critérios de qualidade de acordo

com Chiaro e Nocella (2004) e Bühler (1986) (Pochhacker, 2013)...................39

Tabela 2. Intérpretes sujeitos da pesquisa, com respectivas idades e tempo de

exercício da profissão........................................................................................57

Tabela 3. Juízes Avaliadores, com respectivas idades, anos de exercício da

profissão e anos de experiência na formação de intérpretes............................63

Tabela 4. Taxa de Elocução média em palavras por minuto verificada em

diferentes modos de fala para o Inglês Britânico.......................................…….68

Tabela 5. Número de palavras por minuto produzidas por cada um dos Sujeitos

e Palestrante, contemplando: Fala Original (O), nas posições Inicial (I), medial

(M) e Final (F); Fala Semi-espontânea (SE); e Segmentos Interpretados de

cada intérprete nas posições Inicial (I), Medial (M) e Final (F)..........................69

Tabela 6. Resultados obtidos com o levantamento de ocorrências e medições

de parâmetros acústicos. Da esquerda para a direita: tipos de segmentos de

fala analisados, sua duração total, número de palavras por segundo e por

minuto, número de grupos entoacionais, número de pausas total, número de

pausas por segundo, número de alongamentos vocálicos percebidos e valores

de frequência fundamental (média, valor mínimo e valor máximo)...................70

Tabela 7. Perfil dos juízes em cada versão da avaliação perceptiva, V1, V2 e

V3, mostrando números percentuais e absolutos de participantes em cursos de

Tradução ou de Interpretação e se foram concluídos ou estão em

andamento.................................................................................................…….73

Tabela 8. Resultados médios ponderados da avaliação dos segmentos

adicionais em cada Versão (V1, V2 e V3).........................................................74

Tabela 9. Resultados médios ponderados finais da avaliação de cada

intérprete nos extratos interpretados, por segmento Inicial (I), Medial (M) e Final

(F)......................................................................................................................75

Tabela 10. Média ponderada final de cada quesito por sujeito (compilação dos

segmentos inicial, medial e final).......................................................................77

Tabela 11. Classificação final de cada sujeito por avaliador (compilação dos

segmentos inicial, medial e final).......................................................................78

Tabela 12. Nota final atribuída a cada sujeito por avaliador, média dos três

avaliadores e classificação dos sujeitos............................................................79

Tabela 13. Comparação das médias finais ponderadas das avaliações das

transcrições e dos arquivos sonoros.................................................................80

Tabela 14. Compreensibilidade atribuida a cada sujeito por extrato (Inicial,

Medial e Final), totalizando as porcentagens de compreensibilidade alta (muito

e extremamente), media (nem muito nem pouco) e baixa (pouco e nada).......82

Tabela 15. Resultados do Sujeito 11 por extrato (Inicial, Medial e Final),

mostrando o número de Grupos Entoacionais (GE), Número de Pausas (P) e

Número de Alongamentos Vocálicos (AV).........................................................84

Tabela 16. Valores de LG em relação a cada grupo de variáveis: Gc1

(acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição)......88

Tabela 17. Valores de RV em relação a cada grupo de variáveis: Gc1

(acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição)......88

Tabela 18. Representatividade dos grupos nas 5 Dimensões (Dim 1,2,3,4 e 5)

Gc1 (acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da

transcrição)........................................................................................................88

Tabela 19. Variáveis da Dimensão 1 (Dim, 1)...................................................92

Tabela 20. Variáveis da Dimensão 2 (Dim, 2)...................................................92

Lista de Figuras

Figura 1. Avaliação dos critérios de qualidade para a interpretação simultânea

de acordo com intérpretes e participantes de conferência................................35

Figura 2. Padrões perceptivos de pitch, loudness e duração da fala e seus

correlatos acústico e fisiológico.........................................................................48

Figura 3. Forma da onda, espectrograma de banda larga de emissão da

palavra “fogo” com camada de segmentação dos segmentos consonantais e

vocálicos............................................................................................................49

Figura 4. Extrato de segmento analisado, contendo, de cima para baixo, as

camadas de: forma de onda com as demarcações dos pulsos glotais em azul,

espectrograma de banda larga com traçados de frequência fundamental (em

azul) e intensidade (em amarelo) superpostos, camada com identificação dos

Grupos Entoacionais, da Pausa e dos Alongamentos Vocálicos

percebidos..................................................................................................…....61

Figura 5. Forma de onda do corpus de gravação completo, incluindo no

primeiro bloco (à esquerda) a fala semi-espontânea das intérpretes e, no

segundo bloco (à direita), sua fala interpretada................................................65

Figura 6. Forma de onda, espectrograma de banda larga com superposição do

traçado de frequência fundamental, camada de divisão dos grupos

entoacionais (GE), camada com as delimitações das pausas silenciosas e

camada com as delimitações dos alongamentos vocálicos (AV) na fala semi-

espontânea do S2..............................................................................................67

Figura 7. Dendograma com a distribuição dos sujeitos em clusters.........…….85

Figura 8. Distribuição dos sujeitos de acordo com as Dimensões 1 e 2 (Dim 1 e

Dim 2) do espaço vetorial..................................................................................86

Figura 9. Distribuição dos sujeitos de acordo com o estilo de fala interpretada

(I) e de fala semi-espontânea (E)......................................................................87

Figura 10. Relevância dos grupos de vriaáveis de maior para menor: Gc1

(acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da

transcrição)........................................................................................................89

Figura 11. Distribuição das variáveis nas Dimensões 1 e 2 (Dim1 e

Dim2)..........................................................................................................….90

Figura 12. Distribuição de todas as variáveis dos três grupos: Gc1 (acústico),

Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição) nas Dimensões

1 e 2 (Dim,1 e Dim,2).........................................................................................91

Sumário Introdução ................................................................................................................................... 15

Capítulo 1 - Perspectiva Histórica da Interpretação ................................................................... 22

1.1 A Interpretação Consecutiva ......................................................................................... 23

1.2 A Interpretação Simultânea .......................................................................................... 25

1.3 A Interpretação no Futuro ............................................................................................. 30

Capitulo 2 - Avaliação de Qualidade na Interpretação ............................................................... 32

Capítulo 3 - Fundamentação Teórica .......................................................................................... 44

3.1 O Modelo dos Esforços e a Fala do Intérprete .............................................................. 45

3.2 Prosódia ......................................................................................................................... 47

3.3 Pausa ............................................................................................................................. 51

3.4 Entoaçâo ........................................................................................................................ 53

3.5 Pitch Accent ................................................................................................................... 55

Capítulo 4 - Metodologia............................................................................................................. 57

4.1 Participantes Sujeitos da Pesquisa ................................................................................ 57

4.2 Procedimentos metodológicos ..................................................................................... 58

Capítulo 5 - Resultados ................................................................................................................ 65

Capítulo 6 - Conclusão ................................................................................................................. 94

Referências Blibliográficas .......................................................................................................... 99

ANEXO 1 - Transcrição da Palestra Original .............................................................................. 104

ANEXO 2 - Extratos Segmentos Inicial, Medial, Final e Adicional ............................................. 108

ANEXO 3 – Distribuição dos extratos de fala em cada versão de avaliação ............................. 117

ANEXO 4 - Instruções para Avaliação dos Extratos de Fala ....................................................... 118

ANEXO 5 – Instruções para Avaliação das Transcrições............................................................ 121

ANEXO 6 – Forma de Onda do Corpus de Gravação Completo – Fala Semi-espontânea + Fala

Interpretada de Cada Intérprete ............................................................................................... 122

ANEXO 7 – Resultados Ponderados Médios Finais da Análise Perceptiva por Extrato – Versões

1, 2 e 3 ....................................................................................................................................... 125

ANEXO 8 – Resultados Avaliação Conteúdo Semântico-Discursivo por Avaliador ................... 149

15

Introdução

No trabalho de interpretação simultânea, o intérprete produz uma fala

em que utiliza palavras de sua escolha, mas que ao mesmo tempo está

pautada pelo discurso do outro. Esta fala singular não é, portanto, nem

completamente espontânea, nem completamente guiada ou laboratorial, e suas

características merecem ser estudadas em maior profundidade, pois há

escassez de trabalhos nessa área (SCHLESINGER, 1994; COLLADOS AÍS,

1998; HOLUB, 2010; RENNERT, 2010; LENGLET. 2015). Apesar de escolher

suas palavras, o intérprete precisa esperar o discurso original para

compreender seu significado, lógica e registro. Só a partir de então poderá

construir sua fala – que compreenderá vocabulário, estrutura gramatical,

entoação, posicionamento de adjetivos e advérbios, registro de formalidade,

etc. – e que poderá ser parecida ou completamente diferente da estrutura que

usaria fora da cabine de interpretação.

Tradicionalmente, embora se considere desejável que o intérprete

produza uma fala expressiva, as questões prosódicas assumem um papel

secundário na definição e avaliação da qualidade do trabalho do intérprete.

Estudos realizados entre intérpretes e ouvintes usuários da interpretação

mostram que os aspectos prosódicos são considerados menos relevantes na

avaliação dos itens que contribuem para a qualidade da interpretação e

aparecem em uma lista de importância atrás dos critérios linguísticos, mais

atrelados à consistência de sentido, coesão lógica e outros (BÜHLER, 1986;

KURZ, 1989, MOSER 1996; CHIARO E NOCELLA, 2004; PÖCHHACKER e

ZWISCHENBERGER, 2010). No entanto, quando os mesmos avaliadores têm

como tarefa analisar a produção oral dos intérpretes, estes tendem a atribuir

maior qualidade e mais alto nível de compreensibilidade àquelas versões que

são superiores nas mesmas características prosódicas consideradas menores

na avaliação da qualidade do trabalho do intérprete, como voz agradável,

vivacidade e fluência, sugerindo que talvez os elementos prosódicos sejam

igualmente importantes na avaliação de qualidade e compreensibilidade da

interpretação.

16

O objetivo deste estudo é verificar as características prosódicas da fala

da fala interpretada de um grupo de intérpretes, tendo como contraponto a sua

fala semi-espontânea e analisar como tais características podem influenciar a

avaliação de qualidade e compreensão da mensagem produzida pelo

intérprete. A interpretação é uma atividade completamente baseada na fala,

tanto como fonte quanto como resultado final. A abordagem tradicional nas

pesquisas sobre a qualidade da produção do intérprete tenta dissociar os

elementos prosódicos de outros elementos linguísticos de uma produção que é

exclusivamente verbal/vocal. Tentar traçar uma linha entre sentido e produção

vocal sem levar em consideração as características prosódicas da fala é

ignorar que a produção vocal carrega também sentido em si, e que esse

sentido contribui para a avaliação de qualidade atribuída unicamente aos

quesitos linguísticos encontrados em tais pesquisas.

Este trabalho é pioneiro ao enfocar a prosódia da fala de um grupo de

intérpretes trabalhando para o português brasileiro (PB) e poderá contribuir

para uma maior reflexão sobre o trabalho de interpretação. Como mencionado

no caput desta introdução, a fala do intérprete é singular em suas

características prosódicas e merece uma descrição na literatura. Conhecer as

características prosódicas e como estas podem afetar positiva ou

negativamente a avaliação do trabalho de interpretação pode nos ajudar a

melhorar a formação do intérprete, e trabalhar com as características da fala de

forma mais proativa em nossos cursos.

Também importante aqui é situar a profissão e formação do intérprete de

conferências e a avaliação de qualidade desta profissão dentro de uma

perspectiva histórica e espacial. À medida que nos aproximamos do centenário

da atividade de interpretação de conferência, a reflexão crítica sobre o passado

pode orientar a proposição de metas e contribuir para o futuro da profissão.

Esta dissertação compreende 6 capítulos. Os próximos parágrafos

trazem um breve relato de cada um deles e a explicação do porquê de sua

escolha.

17

No capítulo 1, abordaremos a interpretação de conferências de uma

perspectiva histórica.

A história da interpretação perpassa a história da humanidade. A figura

do intérprete sempre esteve presente desde que o homem passa a se

comunicar por meio da linguagem, e diferentes povos desenvolvem línguas

diferentes. Com efeito, a referência mais antiga à profissão vem do Egito

Antigo, em um baixo-relevo no túmulo de um príncipe de Elefantina datado

3000 anos AC.

Ao longo dos tempos, os intérpretes estiveram a serviço de missionários

e comerciantes, generais e revolucionários, imperadores e conquistadores,

embora os diplomatas, até a 1ª guerra mundial, basicamente utilizassem o

francês. A partir da mudança conjuntural do mundo pós primeira guerra – e da

reorganização política que se sucede – a profissão de intérprete de

conferência, como conhecemos hoje, é introduzida.

Neste capítulo visitaremos um pouco a história da interpretação de

conferências e da formação deste novo intérprete, e como a introdução da

tecnologia influenciou modificações nesta prática. Também analisaremos as

diferentes modalidades da interpretação de conferências formadas ao longo do

tempo, na tentativa de traçar um panorama global da profissão – de seus

primórdios até os dias de hoje. O objetivo aqui, obviamente, não é esgotar o

tema em apenas um capítulo, o que não seria de qualquer forma possível, mas

trata-se de uma perspectiva importante para melhor situar os leitores sobre

esse trabalho tão específico e ainda tão pouco estudado, suas principais

características e desafios.

No capítulo 2, abordaremos as pesquisas de avaliação de qualidade na

interpretação. A tarefa de se avaliar a qualidade de uma interpretação não é

fácil e levanta muitas questões. A primeira delas diz respeito a quem deve

caber a avaliação de qualidade. O ouvinte da interpretação, àquele para qual a

interpretação está sendo feita, só pode, na verdade, avaliar a produção final da

18

interpretação, sem ter meios de compará-la com o discurso original e

consequentemente, não pode julgar se ela transmite plenamente a mensagem

original – razão pela qual, supostamente, ela está acontecendo.

Por outro lado, de acordo com KAHANE (2000), a tarefa de

comunicação da mensagem interpretada está sujeita ao cenário em que está

inserida e deve ser parte de um contexto. Diferentes contextos trazem

diferentes exigências e, portanto, a avaliação da qualidade da interpretação vai

necessariamente depender de seu contexto. Não há, portanto, possibilidade de

uma avaliação absolutamente objetiva:

“Uma definição simplista da tarefa ou função da interpretação é a

de mediação para facilitar a comunicação entre falante e ouvinte.

Igualmente simples seria adicionar que a interpretação simultânea (IS)

que melhor alcance este objetivo seria, por definição, da melhor

qualidade. Talvez este possa ser o modelo ideal, mas na verdade

sabemos que o assunto é mais complexo. A função de mediação do

intérprete não é clara: será mediação ou interferência? Não nem mesmo

temos ideia clara da relação falante-ouvinte. É melhor para o intérprete

se integrar nesta relação ou ser parte fora dela? Como é essa relação?

Como pode variar? Qual é o propósito da situação onde a comunicação

acontece? É uma grande conferência ou uma pequena reunião de

pessoas que já se conhecem? Quais são as intenções e expectativas

mútuas dos participantes? Onde está e quem é o ouvinte, e quais suas

qualidades e expectativas, etc?1 KAHANE (2000, p. 1)

1 “One simplistic definition of the interpreter's task or function is that of

mediation to facilitate communication between speaker and listeners. It would be

equally simple to add that the simultaneous interpretation (SI) that best achieves that

goal would by definition be of the best quality. That may be the ideal model, but in

actuality we know things are more complex. The interpreter's mediating function is not

clear: is it mediation or interference? We do not even have a clear idea of the speaker-

listener relationship. Is it better for the interpreter to integrate into that relationship or

to stay outside it? What are speaker-listener relationships like? How do they vary?

What is the purpose of the situation wherein communication is taking place? Is it a

multitudinous conference or a small meeting of people already well acquainted with

each other? What are the mutual intentions and expectations of the participants? Where

is or who supposedly is the listener, and what qualities and expectations does he have,

19

A despeito de todas essas dificuldades, tentativas de pesquisa de

qualidade em interpretação continuam a ser produzidas desde o trabalho de

Bühler (1986), marco fundamental na pesquisa da área, até os dias de hoje.

Apesar de pequenos, importantes avanços foram atingidos e assimilados

desde então. O propósito deste capítulo é revistar as mais importantes

pesquisas realizadas na área desde 1986, criando assim a base para caminhos

para estudos futuros.

No capítulo 3, abordaremos as questões concernentes às características

prosódicas da fala. O objetivo deste capítulo é abordar a prosódia, descrever

suas características e funções, e o significado e as implicações de cada um

dos elementos prosódicos encontrados na fala do intérprete, a partir da

descrição desenvolvida por Miriam Schlesinger em 1994.

O intérprete comunica sua mensagem através da voz, seguindo tanto

um código linguístico como um código não verbal. Os sinais produzidos por

ambos os códigos podem estar separados, unidos, ou em contraposição um ao

outro (COLLADOS AÍS, 1998). Entender primeiramente o código não verbal do

intérprete através de sua produção prosódica e, a posteriori, entender o que

essa produção pode transmitir em termos de sentido parece condição sine qua

non para se possa investigar a avaliação de qualidade e compreensão da fala

do intérprete.

No capítulo 4, descrevemos a metodologia da pesquisa realizada para

esta dissertação, mostrando o passo a passo das diferentes avaliações e

análises conduzidas.

O grande desafio deste estudo foi desenvolver uma pesquisa que fosse

abrangente o suficiente para atender todos os objetivos aqui propostos, ou

etc?” Exceto quando de outra forma apontado, todas as traduções inseridas no texto

foram realizadas pela autora deste estudo.

20

seja, tanto a análise, caracterização da fala interpretada em relação à semi-

espontânea do intérprete quanto à verificação da interferência de diferentes

padrões melódicos e rítmicos na avaliação de qualidade e compreensão da

mensagem produzida na interpretação. Para tanto, diferentes tipos de análise

foram realizados a partir de um mesmo corpus – a fala semi-espontânea e a

interpretação de um discurso produzidas por doze intérpretes diferentes.

As intérpretes foram audiogravadas em uma fala semi-espontânea e

durante a interpretação simultânea de uma palestra. Três segmentos amostrais

representativos do discurso (nas posições inicial, medial e final da

palestra) foram selecionados. Foram realizados três tipos de estudo: um de

natureza acústica, um de natureza perceptiva da qualidade e

compreensibilidade da produção oral dos intérpretes e outro da qualidade da

interpretação em relação ao discurso interpretado em termos de conteúdo

semântico-discursivo.

Com a utilização do software Praat, foram analisadas acusticamente as

características prosódicas da fala semi-espontânea das intérpretes e dos

extratos selecionados, comparando-os em termos de formação de grupos

entoacionais, número e distribuição de pausas, taxa de elocução e frequência

fundamental média, mínima e máxima. Por meio de um questionário com base

na escala de Likert aplicado a 90 juízes, foram avaliados os efeitos impressivos

da produção oral dos intérpretes e através de um protocolo de avaliação

aplicado a 3 profissionais da área de formação em interpretação foram

comparadas as transcrições do discurso produzido pelas intérpretes em

relação ao discurso interpretado para verificação da manutenção do sentido

original (S), presença de erros (E) e de omissões (O). Os resultados foram

discutidos para verificação de similaridades e diferenças entre as avaliações.

No capítulo 5, abordamos os resultados da pesquisa, seguindo os

mesmos passos descritos na metodologia. Assim, iniciamos o capítulo com os

resultados da avaliação acústica da fala de cada intérprete, tanto no modo de

fala interpretada quanto na semi-espontânea, trazendo uma comparação entre

as duas modalidades. A seguir, descrevemos os resultados da análise

21

perceptiva da fala do intérprete e do protocolo de análise do conteúdo das

interpretações. Na etapa final do capítulo, comparamos os resultados das

diferentes análises, tentando identificar as similaridades e diferenças

encontradas.

O capítulo 6 conclui esta dissertação e aponta algumas direções para

futuros estudos na área. Este trabalho prova-se importante por pela primeira

vez caracterizar a fala do intérprete trabalhando para o Português Brasileiro e

compará-la aos achados da literatura para falas interpretadas em outros

idiomas. Também traça relações interessantes entre os resultados obtidos

pelos intérpretes nas diferentes fases de avaliação, tentando estabelecer elos

entre o conteúdo semântico da fala interpretada, sua produção acústica e as

percepções de qualidade e compreensibilidade que derivam dela.

Certamente outros trabalhos serão necessários para entendermos mais

completamente a fala interpretada e suas características prosódicas, quais os

elementos que mais afetam positiva ou adversamente a mensagem proferida

pelo intérprete e como poderemos abordar estas questões na formação de

novos intérpretes.

Os resultados obtidos neste estudo, no entanto, serão um bom ponto de

partida para investigações vindouras.

22

Capítulo 1 - Perspectiva Histórica da Interpretação

Como vimos na introdução deste trabalho, a interpretação como

transferência oral de uma mensagem entre dois falantes que não podem – ou

não querem – comunicar-se na mesma língua, já existe há milhares de anos.

Neste capítulo, vamos visitar um pouco desta história.

Na Grécia e na Roma Antiga, os serviços de interpretação eram

corriqueiros, uma vez que poucos Romanos e Gregos se davam ao trabalho de

aprender as línguas dos povos conquistados – algo que acreditavam ser

abaixo de sua dignidade. Assim, a utilização de intérpretes também tinha uma

dimensão política, pois era preciso que estivessem presentes mesmo quando

não necessários a fim de demonstrar a superioridade greco-romana. O serviço

era geralmente prestado por escravos ou representantes dos povos dominados

que não tinham nenhum status social.

A partir da Idade Média, a profissão começa a ser mais valorizada, com

intérpretes desempenhando um papel importante nas negociações

internacionais em tempos de guerra e paz, nas expedições comerciais, na

disseminação do Cristianismo durante as Cruzadas e também nos

monastérios, tanto facilitando a comunicação entre monges de diferentes

nacionalidades e origens, quanto acompanhando missionários em suas

viagens ao estrangeiro.

Conhecidos na Europa desde o século 13, os dragomanos ou turgimões

eram os intérpretes formados pelo Império Otomano para atuar na

comunicação com os países europeus.

A era das grandes descobertas é outro marco para a interpretação,

quando os navegadores começam a lançar mão dos serviços de nativos

capturados ou de conquistadores que são feitos prisioneiros e depois libertados

e que aprendem a língua de seus algozes durante o período de cativeiro.

23

Exemplos de ambos os casos são encontrados em várias partes do mundo,

como os “intérpretes residentes” no Canadá, nativos de francês que se

estabelecem entre os Huronianos e Iroqueses; os “meninos língua” de

Portugal, meninos de rua recolhidos por padres jesuítas e enviados ao Brasil

para aprender o idioma nativo e ajudar na comunicação entre portugueses e

índios; e a índia Malinche, no México, que ajuda os espanhóis a se comunicar

com os nativos. Relatos similares aparecem nas histórias da exploração da

África e Ásia.

Na Europa, a soberania política da França torna aos poucos o francês a

língua franca da diplomacia, movimento esse rejeitado por muitos países. O

imperador da Áustria, Leopoldo I, prefere o italiano como língua da corte.

Também os otomanos recusam o francês – e o latim – no contato com os

países europeus. Assim, cada corte formava seus próprios intérpretes, com

escolas em Constantinopla, Viena e Veneza.

É só ao final da primeira guerra mundial, no entanto, que a profissão de

intérprete de conferência começa a tomar sua forma atual, primeiramente na

modalidade hoje conhecida como Interpretação Consecutiva. É então que os

primeiros intérpretes são formados nessa ‘nova’ modalidade.

1.1 A Interpretação Consecutiva

Como mencionado na seção anterior, o francês era considerado o

idioma oficial da diplomacia, posição ocupada até a primeira guerra mundial.

No pós-guerra, as reuniões entre os países vitoriosos se intensificam,

culminando na Conferência de Paz de Paris, em 1919, que por sua vez leva à

assinatura do Tratado de Versalhes, finalmente selando a paz entre os aliados

e a Alemanha. Setenta delegados representando a coligação dos 27 países

vitoriosos participam da Conferência. Presenças essenciais do encontro, o

Presidente americano Woodrow Wilson e o Premier britânico Lloyd George,

ambos não falantes de francês, conseguem com que o inglês se torne um dos

idiomas oficiais da conferência.

24

É exatamente para a ocasião que temos os primeiros registros da

descrição da modalidade ‘Interpretação Consecutiva de Conferência’ e

formação do intérprete, ainda que de forma muito rudimentar. A interpretação

consecutiva seria produzida pelo intérprete após terminada a intervenção do

orador. Sem contar com nenhum tipo de suporte eletrônico, o intérprete deveria

se posicionar próximo ao orador, ouvir e tomar notas do que fosse dito por

alguns minutos, e depois produzir sua fala.

Como a profissão de intérprete de conferências a rigor não existia na

época, não havia disponibilidade de intérpretes profissionais. Era, portanto,

preciso recrutar pessoas que tivessem um bom conhecimento de ambos os

idiomas e uma certa cultura geral para atuarem como intérpretes. Era este o

caso de Paul Mantoux (intérprete chefe da conferência), Jean Herbert e

Gustave Camerlynck, e tantos outros que atuaram na conferência. Todos

tinham algum tipo de experiência em interpretação, embora não na modalidade

de conferência. Camerlynck já havia servido como intérprete para a Artilharia

Britânica na Primeira Guerra, assim como Mantoux, intérprete oficial dos

generais britânicos alocados em Flandres, e Jean Herbert havia interpretado

para autoridades francesas na residência de Lloyd George em Londres, em

1917. Entretanto, como bem coloca Baigorri-Jalón (1999, p. 01):

“Ninguém – incluindo os próprios intérpretes – tinha uma ideia clara do

que a tarefa exigia. Foi preciso improvisar e aprender no fazer2”.

Ou ainda nas palavras do próprio Jean Herbert:

“Ainda bem que minhas interpretações não foram gravadas, porque se

as ouvisse agora certamente ficaria ruborizado. No entanto, foi o melhor

que podia ser feito à época e, por incrível que pareça, foi apreciado3

(HERBERT:1978, p. 6 em BAIGORRI JALÓN, 1999).

2 ‘No one — including the interpreters themselves — had a clear idea of the tasks entailed. They had

to improvise and learn on the job.’ 3 ‘I am grateful that my interpretations were not recorded, because if I heard them now I should

25

Apesar das dificuldades, a interpretação consecutiva foi considerada um

sucesso e muitos dos intérpretes originais acabaram tornando-se formadores

das próximas gerações de intérpretes, uma vez que o modelo foi

imediatamente replicado nas instituições formadas a partir dessa conferência,

ou seja, a Liga das Nações, a OIT, Organização Internacional do Trabalho, e o

Tribunal Permanente de Justiça Internacional, todas elas instituindo o francês e

o inglês como línguas oficiais e lançando mão da interpretação consecutiva em

suas reuniões de trabalho.

No entanto, embora a modalidade fosse considerada bastante eficiente

e os intérpretes admirados por seus serviços, o processo tornava as reuniões

excessivamente longas e logo foram empenhados esforços para o

desenvolvimento de um novo método de interpretação que demandasse menos

tempo e fosse mais vantajoso para os participantes. Vem dessa necessidade o

investimento na criação de uma tecnologia que possibilitasse que o discurso

original e o discurso interpretado fossem proferidos de forma simultânea.

Investimentos em uma nova tecnologia mudaram o rumo da

interpretação de conferências, dando surgimento a uma nova modalidade até

então inexistente – a interpretação simultânea com equipamento.

1.2 A Interpretação Simultânea

É preciso deixar claro que sempre houve, na história da interpretação,

um modo simultâneo de se traduzir a mensagem. Na modalidade de

interpretação hoje conhecida por chuchotage ou whispering, o intérprete

traduzia simultaneamente um discurso ao ouvido do interlocutor, sem a

utilização de equipamento. Apesar de pequenos ajustes em termos de controle

do volume de voz, não há diferença entre o trabalho de interpretação

simultânea em cabine e a chuchotage. No entanto, a interpretação simultânea

com equipamento é uma invenção do século XX e é sobre ela que

certainly blush. However, that was the best that could be done at the time and, strange as it may

sound, it was appreciated.’

26

discorreremos a seguir.

Existem muitas referências à utilização da interpretação simultânea

antes dos Julgamentos de Nuremberg, certamente o grande marco do

“nascimento” da modalidade. As informações, no entanto, são bastante

contraditórias e incompletas.

Na versão ocidental, o primeiro equipamento de interpretação

simultânea foi inventado por um engenheiro inglês chamado Gordon Finlay. A

ideia original veio do empresário americano Edward Filene, ao participar da

reunião da Liga das Nações em 2 de abril de 1925 e verificar os problemas

derivados da interpretação consecutiva. Em uma carta ao Secretário Geral da

Liga das Nações na época, Sir Eric Drummond, Edward Filene explica como

funcionaria o equipamento. Deve-se observar que a ideia de Filene descrevia

uma modalidade de interpretação simultânea diferente do que temos hoje,

quando o intérprete traduz diretamente do áudio original. No esquema proposto

por ele, o intérprete faria a interpretação com base em textos que lhes eram

disponibilizados com bastante antecedência. Os intérpretes traduziriam os

textos antes da sessão e depois leriam os textos pré-traduzidos

simultaneamente ao discurso original.

Finlay foi chamado para colocar a ideia em prática. Para montar o

sistema, utilizou equipamentos de telefonia já existentes no mercado, o que

deu à nova modalidade de interpretação o nome de “interpretação telefônica”.

Em 27 de novembro de 1926, é anunciado um curso preparatório de 4 a 6

semanas em “interpretação telefônica”. Ao final, 24 alunos seriam escolhidos

por exame para receber treinamento adicional até abril de 1927. Como na

época o padrão de qualidade em intepretação era a interpretação consecutiva,

vem daí a alcunha pouco elogiosa de “telefonistas” que os intérpretes mais

tradicionais atribuíram aos primeiros intérpretes simultâneos. Por envolver uma

parafernália de cabos, microfones e fones de ouvido, o processo a princípio

não foi muito popular entre os intérpretes, que temiam ser condenados a uma

tarefa menor, repetindo palavra por palavra o que ouviam sem tempo de refletir

sobre o discurso e reformulá-lo de forma elegante.

27

A invenção é primeiramente oferecida à AT&T, mas é a IBM que aceita

participar no desenvolvimento do equipamento de interpretação simultânea,

patenteado em 1926 e utilizado pela primeira vez, de acordo com autores

ocidentais, na reunião da Conferência Internacional do Trabalho, em junho de

1927. Um relatório escrito por A. Gordon-Finlay na época observa: “A

experiência nos mostra que este é um trabalho de natureza difícil e exata, que

demanda qualidades especiais dos intérpretes e particularmente fatigante

devido ao grau de concentração envolvido”.

O boletim da Liga das Nações de agosto de 1927 menciona a utilização

do novo "Intérprete Elétrico", desejando que a nova modalidade de

interpretação ajudasse a comunicação daqueles que estavam aprisionados em

sua própria língua, dando assim o impulso necessário para sua disseminação.

Os russos, no entanto, discordam desta versão. Para eles, o primeiro

registro de utilização de tecnologia para a interpretação simultânea na então

União Soviética monta de 1928. Na "História da Interpretação Simultânea",

Flerov (2013), afirma que a interpretação simultânea foi utilizada na União

Soviética pela primeira vez no VI Congresso Mundial da Internacional

Comunista em 1928. A revista Krasnaya Niva daquele ano mostra uma foto dos

intérpretes sentados em poltronas em frente ao pódio. À volta de seus

pescoços, podemos ver um equipamento ligado a um microfone. Não há fone

de ouvido, o som vem diretamente do pódio.

Alguns anos mais tarde, na XIII Sessão do Comitê Executivo da

Internacional de 1933, os intérpretes já se posicionavam em cabines, captando

o áudio original a partir de fones de ouvido.

Em 1935, o XV Congresso de Fisiologia Internacional, em Leningrado, é

aberto com o discurso de Ivan Pavlov, interpretado simultaneamente do Russo

para o Francês, Inglês e Alemão. Os participantes do congresso recebem

instruções em como utilizar o equipamento de intepretação simultânea. Mais

uma vez, há relatos de que os intérpretes recebem o discurso de Pavlov por

28

escrito com antecedência e apenas leem a tradução simultaneamente.

Até então utilizado apenas esporadicamente antes da segunda guerra

mundial, é em 1945 que o sistema de interpretação simultânea tem sua prova

de fogo. O responsável por sua utilização nos Julgamentos de Nuremberg é o

Coronel Léon Dostert, intérprete pessoal do General Eisenhower, que é

chamado a Nuremberg para achar uma solução prática que possa driblar o

problema da barreira linguística entre acusados, promotoria e defesa.

São quatro línguas oficiais dos Julgamentos de Nuremberg - Inglês,

Francês, Russo e Alemão. O uso da interpretação consecutiva é afastado,

porque isso faria com que os julgamentos se alongassem por demais. Leon

Dostert fica encarregado de organizar a interpretação simultânea dos

julgamentos, o que significa recrutar e treinar equipes de intérpretes, muitos

dos quais não tinham nenhuma experiência de trabalho, muito menos com a

interpretação simultânea. A exemplo do que acontecera na Conferência de

Paris, parte do treinamento acontece durante a execução do trabalho em si,

como contam dois intérpretes da época:

“Os monitores acompanhavam constantemente nosso desempenho,

corrigindo erros e sugerindo maneiras para melhorarmos. Pediram que eu

abaixasse meu tom de voz, o que fiz4”. Patricia Vander Elst (2000)

“Não tínhamos nenhuma experiência em que nos apoiar e tivemos que

desenvolver as habilidades necessárias por nossa conta. Os intérpretes

precisavam ter capacidade linguística e mental para lidar com o desafio...5”

Siegfried Ramler (2008, pg. 50)

Apesar das dificuldades, o novo método de interpretação se prova

indispensável no julgamento de Nuremberg, não só atendendo plenamente a

necessidade de diminuição de tempo de interpretação, mas também se

4 ‘The monitors would keep a close watch on our performance and would tell us where we went wrong and how to improve our delivery. I was told to pitch my voice lower, which I did’. 5 ‘We had no body of experience to draw on, and had to develop the necessary skills on our own. It required interpreters who were lingusitically and mentally able to rise to that challenge...’

29

mostrando satisfatório em termos de qualidade e exatidão das informações

fornecidas. Os bons resultados são o marco inicial da ascensão da

interpretação simultânea e queda da consecutiva.

Em 1947, as Nações Unidas adotam a Resolução 152 tornando a

interpretação simultânea um serviço permanente. Em 1948, a interpretação

simultânea é introduzida oficialmente no parlamento suíço. Em 58, no

parlamento canadense. Gradualmente, a interpretação simultânea começa a

ter papel de maior destaque entre as modalidades de interpretação.

Atualmente, a interpretação simultânea responde por 98% do trabalho

dos intérpretes membros da AIIC – Associação Internacional de Intérpretes de

Conferência (WEBER, 1989). Embora em proporção infinitamente menor, a

interpretação consecutiva é ainda utilizada, principalmente em uma sub

modalidade conhecida como ´Consecutiva Intermitente’, que é uma

interpretação consecutiva iniciada a partir de cada frase proferida pelo orador,

sem necessariamente utilizar a tomada de notas.

Em um mundo em que as distâncias estão cada vez menores e as

relações entre os países mais estreitas, a relevância da interpretação toma

forma e força. Somente a União Europeia, de longe o maior empregador de

intérpretes de conferência no contexto atual, dispõe de interpretação nas 23

línguas oficiais dos 27 Estados-Membros, com mais de uma centena de

combinações linguísticas possíveis. As Nações Unidas oferecem interpretação

simultânea para e do inglês, francês, espanhol, chinês, russo e árabe.

Em seu website, a Comissão Europeia define interpretação de

conferência como uma comunicação exclusivamente oral: “é a transposição de

uma mensagem de uma língua para outra, com naturalidade e fluência,

adotando a linguagem, o tom e as convicções do orador e falando na primeira

pessoa”. Nas conferências internacionais participam pessoas oriundas de

meios e culturas diferentes, que falam línguas diferentes. Cabe ao intérprete

permitir-lhes comunicar entre si, não pela tradução palavra a palavra, mas pela

veiculação do conteúdo da mensagem.

30

1.3 A Interpretação no Futuro

Os avanços na comunicação e na tecnologia trazem para o futuro novos

desafios à profissão. A crescente necessidade de precisão e prontidão estimula

o desenvolvimento de diferentes modalidades de interpretação, como é o caso

da Consecutânea. Embora ainda não amplamente aceito, o termo se refere a

interpretação consecutiva feita a partir de uma de gravação. O intérprete

posiciona-se próximo ao orador, grava o que é dito, e depois reproduz o

discurso original podendo utilizar como recurso a gravação realizada,

produzindo uma modalidade de interpretação que é parte consecutiva e

simultânea. A gravação pode ser feita através de uma caneta digital (tecnologia

Livescribe). Estudos mostram resultados ainda incipientes, embora crescentes

em termos de satisfação de público, na aprovação desta modalidade

(FERRARI, 2007), e ela continua como uma das apostas para o futuro.

Também as tecnologias de comunicação à distância modificam as

necessidades de interpretação, com áudio e vídeo conferências trazendo

dificuldades adicionais ao intérprete. A interpretação remota já é uma realidade

no cenário atual e tudo indica que tende a crescer, trazendo com isso novos

desafios à profissão. Os intérpretes no futuro provavelmente trabalharão fora

do ambiente onde a produção do discurso está sendo feita e terão que lidar

com desafios tais como a falta de sincronia entre imagem e áudio, a escolha de

apenas uma imagem que possam ver como representativa do cenário real

como um todo, ou ainda a dependência exclusiva do meio áudio para sua

produção.

Além disso, outras questões em relação ao mercado certamente se

farão importantes – em um mundo virtual, a interpretação poderá ser feita por

qualquer intérprete, em qualquer lugar do mundo, o que traz implicações até na

maneira como as associações são organizadas hoje, de forma regional.

Também exigências de mercado impulsionam novas áreas de interpretação

que não a interpretação de conferências, como a interpretação comunitária

31

(hoje já muito forte nos Estados Unidos, principalmente nos campos do Direito

e da Medicina), a interpretação no campo da pesquisa (grupos focais e

entrevistas em profundidade) e a interpretação em zonas de conflito.

Uma coisa é certa, no entanto. A história mostra que enquanto houver

comunicação entre diferentes povos, entre diferentes línguas, haverá

necessidade de interpretação. As formas e meios de comunicação através dos

quais a comunicação acontece são mutáveis; assim como as necessidades das

partes que se comunicam. Os intérpretes e as escolas de formação mais uma

vez terão que se adaptar aos novos tempos. É este seu desafio para o futuro.

Neste capítulo discorremos sobre a história da interpretação e traçamos

alguns dos desafios da profissão para o futuro. No próximo capítulo,

analisaremos a produção de pesquisas sobre a avaliação da qualidade na

interpretação e discutiremos os principais resultados obtidos até hoje.

32

Capitulo 2 - Avaliação de Qualidade na Interpretação

“Uma das características essenciais da Interpretação Simultânea é a

necessidade de interpretar um discurso proferido por um palestrante

sem limitações em nenhum dos códigos empregados (verbal e não

verbal), com um código verbal fortemente restringido, desaparecendo as

possibilidades corporais e faciais, e ficando unicamente a voz do

intérprete, limitada, por sua vez, por condicionantes socioculturais. Para

tal, a voz do intérprete de IS deve concentrar toda a responsabilidade de

uma interpretação integral”.6 (COLLADOS AÍS, 1998, p. 4)

Neste capítulo discutiremos as principais pesquisas na área da

avaliação de qualidade na interpretação e traçaremos uma comparação entre

os achados mais importantes.

Como podemos observar a partir do enunciado acima, a tarefa de

comunicação na interpretação simultânea depende só e unicamente da fala do

intérprete. No entanto, como veremos a seguir, pesquisas sobre qualidade em

interpretação desenvolvidas a partir de 1986 mostram que embora uma fala

expressiva seja característica desejável na produção do intérprete, as questões

prosódicas assumem papel secundário na avaliação de qualidade que

intérpretes e ouvintes têm do trabalho de interpretação.

Sabemos que a avaliação de qualidade de uma interpretação é afetada

por muitos fatores subjetivos, incluindo a expectativa, formação e papel de

cada agente em uma situação de interpretação (palestrantes, público,

organizadores e intérpretes) (HARTLEY, 2003). Ademais, precisamos levar em

6 “Una de las características esenciales de la IS es la necesidad de interpretar un discurso presentado por un ponente sin limitaciones en ninguno de los códigos empleados (verbal y no verbal) con el código no verbal fuertemente restringido, desapareciendo las posibilidades corporales y faciales, quedando únicamente la voz del intérprete, limitada a su vez, por condicionantes socioculturales. Por tanto, en la voz del intérprete de IS la que debe concentrar toda la responsabilidad de una interpretación integral.’

33

conta a situação onde acontece a interpretação. Variáveis como o tamanho do

evento, nível de formalidade e/ou técnico e nível de integração entre os

participantes, entre outros, também podem afetar a avaliação de qualidade da

interpretação (KAHANE, 2000). Pouquíssimos estudos sobre a avaliação de

qualidade na interpretação simultânea abordam tais variáveis, motivo pelo qual

seus resultados não podem ser considerados absolutos. Isso, no entanto, não

diminui a importância de conhecermos as pesquisas desenvolvidas na área até

hoje e sua evolução ao longo do tempo.

O primeiro estudo sobre qualidade na interpretação foi conduzido por

Hildegund Bühler (1986). Baseou-se em um questionário de avaliação a ser

respondido pelos membros da Associação Internacional de Intérpretes de

Conferência (AIIC) que objetivava levantar os critérios utilizados por estes para

avaliar a qualidade de uma interpretação. Foram incluídos 17 parâmetros, que

deveriam ser classificados em ordem de importância em uma escala de 1 a 4

(irrelevante/muito importante) – sotaque nativo; voz agradável; fluência de

discurso; coesão lógica do enunciado; consistência de sentido com a

mensagem original; transmissão completa da mensagem original da

interpretação; correção gramatical; utilização de terminologia correta; utilização

de estilo apropriada; preparação meticulosa do material da conferência;

resiliência na interpretação; postura; aparência agradável; confiabilidade;

capacidade de trabalhar em equipe; retorno positivo dos participantes da

conferência; outros. É interessante observar que os nove primeiros critérios se

referem à qualidade da interpretação em si, enquanto os seis restantes fazem

mais referência ao trabalho de preparação do intérprete ou, como coloca

Collados (1998, p.37) “ao processo de como alcançar qualidade7”.

Pouco se conhece a respeito do perfil dos intérpretes que responderam

ao questionário, distribuído em uma reunião de membros da AIIC, à exceção

do número total de respondentes, quarenta e sete, incluindo aí sete membros

da CACL – Comissão de Admissão e Classificação Linguística, em teoria,

7 “...al processo de como alcanzar la calidad”.

34

intérpretes mais experientes no processo de avaliação de qualidade de

interpretação. No entanto, o trabalho de Bühler é seminal. Além de ter sido o

primeiro, muitos de seus parâmetros, nomeadamente aqueles mais voltados à

avaliação de qualidade da produção do intérprete em si, foram reproduzidos

em estudos posteriores, o que nos permite comparar a importância atribuída a

cada item ao longo do tempo e por públicos diferentes. Isso nos parece

fundamental porque, como afirma Seleskovitch (2009, p.236) a interpretação

deve sempre ser avaliada da perspectiva do ouvinte alvo e nunca como um fim

em si mesmo, afinal, “a cadeia da comunicação não termina na cabine”.

A primeira oportunidade para tal aconteceu em 1989, com a pesquisa de

Ingrid Kurz, que utilizou oito dos critérios de Bühler e os aplicou em um

questionário a ser respondido, desta vez, por 47 usuários dos serviços de

interpretação, no caso, participantes de um congresso médico, com achados

bastante consistentes com a pesquisa original. Para ainda verificar se

diferentes públicos reagiriam de forma diferente aos mesmos critérios ou se

mudariam sua ordem de importância, Kurz voltou a aplicar a mesma pesquisa

em 1993, primeiro a um grupo de 29 participantes de um congresso sobre

Controle de Qualidade e posteriormente a 48 participantes de uma reunião do

Conselho da Europa.

A Figura 1 mostra os resultados acumulados das três pesquisas de Kurz

em comparação aos achados de Bühler, listados em ordem de importância.

Dois pontos chamam imediatamente nossa atenção nos resultados. O primeiro

é que os intérpretes sistematicamente atribuem maior pontuação (e

consequentemente, maior importância) a cada critério questionado, levando a

crer que os intérpretes têm um nível de exigência em relação ao processo de

interpretação superior às expectativas de seu próprio público alvo. O segundo

é que, independentemente dos tipos de respondente da pesquisa – sejam eles

de diferentes públicos ou intérpretes – a ordem de importância dos critérios é

exatamente a mesma, com a consistência de sentido com a mensagem original

sendo o parâmetro mais valorizado, seguido por coesão lógica (muito

importantes). Aspectos mais ligados à fala em si, como sotaque nativo e voz

agradável, aparecem em último lugar em ambas as listas.

35

Figura 1 – Avaliação dos critérios de qualidade para a interpretação simultânea de acordo com intérpretes e participantes de conferência.

Na mesma época em que Kurz desenvolvia sua pesquisa entre

diferentes públicos, temos o questionário de qualidade de Daniel Gile, aplicado

em 1990 em um congresso de Oftalmologia, com interpretação para o inglês e

o francês. Também trabalhando com a percepção de usuários, desta feita em

um ambiente real de conferência, Gile elenca seis critérios a serem pontuados

pelos usuários do serviço de interpretação em uma escala de 1 a 5 (muito ruim

a muito bom): qualidade global da interpretação, qualidade linguística,

qualidade terminológica, fidelidade e voz, ritmo e entoação. Dois outros pontos

são adicionados, principais defeitos da interpretação e outros comentários, que

devem ser preenchidos de forma eletiva pelos participantes. Vinte e três

participantes respondem ao questionário, dezoito ouvintes do inglês para o

francês e cinco do francês para o inglês.

Os resultados da pesquisa de Gile foram bastante homogêneos, com os

ouvintes da interpretação para o inglês atribuindo pontuações maiores aos

intérpretes em todos os quesitos. Entre os que ouviram a interpretação para o

francês, as menores notas como um todo foram atribuídas à voz, ritmo e

entoação, incluindo três comentários eletivos de interpretação ‘monotônica’.

Apesar disso, a impressão geral da qualidade da interpretação não foi afetada

adversamente por este parâmetro (GILE, 1990). A hipótese de Gile para este

resultado é que, para um público mais técnico-científico, as questões de voz

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5

Consistência de sentido

Coesão lógica

Terminologia

Transmissão completa da mensagem

Fluência

Correção gramatical

Voz

Sotaque

Qualidade na Interpretação - Kurz X Bühler

Kurz – Participantes N = 124 Bühler – Intérpretes N = 47

36

assumam menor importância, “é possível formular a hipótese de que o público

mais científico (e técnico) é menos sensível à qualidade de voz, ritmo e

entoação da interpretação que outros públicos, que lhe podem atribuir maior

importância8” (GILE, 1990, p.68). Embora aceita como hipótese possível à

época, a postulação de Gile nos parece incompleta, na medida que não leva

em consideração as expectivas a priori dos ouvintes em relação à

interpretação, sua compreensão do que deveria ser aceitável em termos de

produção ou seu nível de atenção/concentração na fala do intérprete. Também

é importante lembrarmos que as características prosódicas da fala não podem

ser consideradas meramente uma questão pessoal de maior ou menor

sensibilidade, pois sabemos que elas interferem no processamento da fala.

Entre 1993 e 1994, a pedido do Comitê de Pesquisa da AIIC, Jennifer

Mackintosh lidera um estudo para entender as expectativas de qualidade de

diferentes usuários (MOSER, 1995). Uma equipe de 94 intérpretes entrevistou

mais de 200 participantes em 84 conferências diferentes realizadas no mundo

todo. Praticamente metade dos entrevistados participava apenas como ouvinte

das mencionadas conferências (50,5%), enquanto a outra metade participava

como ouvinte e palestrante (49,5%). Apenas 9% utilizavam os serviços de

interpretação pela primeira vez, com 60% tendo participação frequente em

conferências multilíngues com interpretação. Novamente, os resultados

seguem a mesma tendência de estudos anteriores, com maior importância

sendo atribuída aos critérios relacionados ao conteúdo do que à forma,

independentemente do tipo de conferência. O critério fidelidade da

interpretação ao sentido original foi o parâmetro mencionado mais vezes

espontaneamente pelos participantes, com 45% o julgando o mais importante.

No entanto, questões tais como fala vivaz e não monótona, pronúncia clara e

‘uma voz que soa natural’ foram mencionadas por 66 dos participantes como

algo que um bom intérprete deve produzir. Em contrapartida, oito participantes

criticaram a entoação exagerada e fala histriônica dos intérpretes. De fato, o

8 “Il est possible tout de même de formuler l’hypothèse selon laeulle les scientifiques (et techniciens) seraient moins sensibles à la qualité de la voix, du rythme et de l’entonation de l’interprétation que l’autres publics, pour qui ele a peut-être une plus grande importance”.

37

desejo de ouvir uma fala mais neutra em relação à mensagem sendo

interpretada é verbalizado por 21 participantes.

Outro fator relacionado às questões da fala criticado adversamente por

30 participantes é o mau uso do microfone aberto, com vazamento de barulhos

da cabine, incluindo tosse, cochichos entre intérpretes, risadas, papéis sendo

folheados, batuque de caneta ou lápis na mesa ou microfone entre outros.

Finalmente, quando submetida aos participantes uma lista de possíveis fontes

de irritação, as longas pausas silenciosas ou pausas preenchidas e atraso na

fala do intérprete em relação ao discurso original (falta de sincronia) aparecem

em primeiro lugar, com mais de 70% dos participantes classificando-os como

irritantes ou muito irritantes.

Em 1995, Kurz e Pöchhacker repetem os mesmos 8 critérios baseados

em Bühler para investigar um novo público ouvinte – desta vez um grupo de

representantes de TV da Alemanha e Áustria – e verificar se os critérios em

relação à forma e expressão do discurso do intérprete teriam o mesmo peso e

grau de importância que os públicos anteriores (COLLADOS, 1998). Embora

mais uma vez a consistência de sentido com a mensagem original e coesão

lógica fossem os parâmetros mais valorizados, os resultados mostraram que

esse público era particularmente sensível a critérios relacionados à voz, ao

sotaque e à fluência.

Em 1998, Collados decide explorar mais a fundo as questões da fala do

intérprete, conduzindo um estudo laboratorial controlado comparando

interpretações monotônicas com versão mais ‘vivazes’ do mesmo discurso.

Foram elaboradas três versões a serem avaliadas: versão monotônica sem

falhas de conteúdo, versão vivaz com falhas de conteúdo, versão vivaz sem

falhas de conteúdo (COLLADOS, 1998). Sistematicamente, as interpretações

com uma fala mais vivaz, independentemente da presença de alguns erros,

foram consideradas superiores em comparação àquela mais monotônica,

38

mesmo que essa apresentasse uma transmissão completa da mensagem

original da interpretação, sem falhas de conteúdo. As versões foram testadas

em estudos e públicos diferentes, com resultados bastante consistentes, o que

nos leva a crer que, apesar de atribuírem, em teoria, maior importância a

aspectos mais relacionados ao conteúdo da interpretação, quando os usuários

têm a chance de ouvir versões orais de uma interpretação com conteúdo

melódico mais ou menos monótono, estes tendem a atribuir maior qualidade

àquelas versões menos monótonas, sugerindo que talvez alguns elementos

prosódicos sejam importantes na avaliação de qualidade da interpretação.

A partir do ano 2000, uma nova leva de estudos é produzida a fim de

definir qualidade na interpretação. Um dos primeiros a ter destaque no novo

milênio é o estudo de Chiaro e Nocella, de 2004. Similarmente a outros

estudos aqui descritos, Chiaro e Nocella conduzem um estudo empírico da

avaliação de qualidade na interpretação com base nos critérios de Bühler,

trabalhando aqui com o mesmo público alvo do referido estudo, ou seja,

intérpretes profissionais de conferência. Com uma amostra de 286

respondentes de um universo de 1000 questionários enviados, o estudo

conseguiu atrair participantes de todo o mundo (embora com grande

concentração na Europa e Américas, 44% e 46%, respectivamente) e foi

completamente conduzido online.

Com base em uma escala multidimencional, os pesquisadores

conseguiram produzir um mapa perceptivo com base nos resultados de como

os intérpretes classificavam uma lista de critérios linguísticos e não linguísticos

de acordo com sua percepção de importância. Mostra-se aqui a maior

diferença entre este e o estudo de Bülher. A tarefa dos intérpretes desta feita

era a de simplesmente classificar os critérios listados em uma ordem do mais

ao menos importante, em vez de simplesmente classificá-los como importantes

ou não como havia sido feito no estudo conduzido por Bühler.

39

Apesar de diferenças em alguns quesitos, os resultados são bastantes

simétricos no geral, ressaltando as questões linguísticas ligadas à precisão

terminológica. A Tabela 1 compara os resultados de Chiaro e Nocella com

aqueles de Bühler com bases nas porcentagens de “muito importante” e

“importante” do estudo original.

Tabela 1: Comparação da classificação dos critérios de qualidade de acordo com Chiaro e Nocella (2004) e Bühler (1986) (Pochhacker, 2013).

Chiaro e Nocella 2004 Bühler 1986

1. Consistência de sentido 1. Consistência de sentido

2. Transmissão completa da informação 2. Coesão lógica

3. Coesão lógica 3. Terminologia

4. Fluência 4. Fluência

5. Correção gramatical 5. Correção gramatical

6. Terminologia 6. Transmissão completa da mensagem

7. Estilo apropriado 7. Voz agradável

8. Voz agradável 8. Sotaque

9. Sotaque 9. Estilo apropriado

Ainda seguindo os critérios de escala de classificação de importância de

Bühler, Zwischenberger & Pöchhacker (PÖCHHACKER e

ZWISCHENBERGER, 2010) conduzem um novo estudo online com intérpretes

membros da AAIC. Os critérios linguísticos, ligados a fatores sintático-

semânticos, são mantidos como no estudo original, mas alguns critérios

prosódicos são adicionados já levando em consideração os resultados obtidos

por Moser (1996) e Collados (1998)

“Observando as pesquisas sobre as expectativas de qualidade

publicadas ao longo dos anos, aumentamos a lista de critérios originais

para incluir “entoação vivaz”, como particularmente estudado por Ángela

40

Collados Aís na Universidade de Granada, e “sincronia”, que aparece

como uma característica esperada na interpretação simultânea pelos

respondentes participantes da pesquisa de expectativas dos usuários

patrocinada pela AIIC e realizada por Moser9. (POCHHACKER, 2013)

Desta feita, participam da pesquisa 704 intérpretes membros da AIIC em

todo o mundo. Os resultados são muito próximos aos de Bühler, com

consistência de sentido em primeiro lugar, seguido de coesão lógica.

Deparamo-nos novamente com os critérios voz agradável e sotaque avaliados

como menos importantes. Além disso, apesar de considerados importantes em

estudos anteriores, os critérios adicionados ao estudo, entoação e

sincronicidade, ficam muito próximos a ambos, recebendo nível baixo de

importância.

Ainda em 2010, dois estudos da Universidade de Viena são publicados

com foco na investigação da avaliação de qualidade da interpretação e

compreensão da fala do intérprete aliada à sua produção vocal. O primeiro

(HOLUB, 2010), traz a comparação de uma fala interpretada e esta mesma fala

manipulada no software Praat para se tornar monotônica. Apresentada em uma

configuração que mimetizava uma conferência, o estudo contava com um vídeo

sendo apresentado a 63 ouvintes alunos de marketing da instituição que eram

randomizados em dois grupos, cada um ouvindo uma das versões e com a

tarefa de completar um questionário de compreensão e avaliação do

desempenho de interpretes. Embora não estatisticamente diferente, os

resultados mostraram que a interpretação monotônica dificultou a

compreensão. A análise mostrou correlação entre vivacidade da interpretação

e a avaliação do desempenho do intérprete como um todo. Os dados dessa

pesquisa sugerem que a fala dita monotônica tem impacto negativo na

9 “Taking note of research on quality expectations published over the years, we extended the original list of criteria to include “lively intonation”, as studied in particular by Ángela Collados Aís (1998) at the University of Granada, and “synchronicity”, which had emerged as a feature expected of simultaneous interpreting by respondents in the AIIC-sponsored user expectation survey carried out by Moser (1996).”

41

avaliação de qualidade da interpretação e pode ter impacto negativo para a

compreensão do ouvinte.

No segundo, conduzido por RENNERT (2010), um intérprete profissional

produz várias versões de interpretação de discurso do inglês para o alemão,

com diferentes níveis de fluência. A versão mais fluente é escolhida como base

para análise no software Praat e identificação de suas características.

Novamente, consoante aos achados de Schlensinger, a produção da

interpretação traz uma maior quantidade de pausas, alongamento de vogais e

consonantes, respiração audível e outras características consideradas como

“disfluências” pela autora. A partir dessa análise, duas novas versões foram

produzidas pela pesquisadora no Praat – uma eliminando completamente

quaisquer disfluências e outra dando maior relevância a elas. As versões mais

e menos fluentes foram testadas em questionários de compreensão e análise

subjetiva, incluindo questões sobre idade, sexo, avaliação da familiaridade dos

intérpretes com o tópico e outros.

Os resultados do estudo de RENNERT (2010) demonstraram que uma

maior fluência está atrelada a uma maior percepção de correção na

interpretação e consequentemente associada a melhor compreensão. A

conclusão de Rennert é a de que fluência não é só uma questão de estilo e

pode impactar a opinião do ouvinte na qualidade da interpretação em termos

de desempenho do intérprete e qualidade da interpretação.

Ainda mais recentemente, LENGLET (2015) investiga se a entoação

típica dos intérpretes pode reduzir a compreensão e qualidade percebida da

fala interpretada.

Em um estudo piloto, são submetidas à avaliação perceptiva duas

versões de uma interpretação simultânea para o francês. Ambas as versões

trazem o mesmo conteúdo, mas uma é a interpretação real do discurso e a

42

outra apenas um shadowing da primeira, ou seja, uma versão no mesmo

idioma, com o intérprete repetindo exatamente as mesmas palavras e ordem

da primeira versão. Setenta e nove juízes, sendo 49 estudantes de economia e

30 estudantes de tradução ouvem ambas as versões e respondem um teste de

compreensibilidade e um questionário de avaliação de qualidade. A versão em

shadowing é percebida como significativamente mais fluente do que a versão

interpretada, mas não há diferença significativa entre a interpretação e o

shadowing em relação à compreensibilidade da mensagem.

Embora um avanço importante na pesquisa sobre a qualidade na

interpretação, os estudos mais recentes estão focados na comparação da fala

do intérprete com falas manipuladas, quer através da substração/adição de

fluência/entoação, comparação da fala interpretada com leitura ou comparação

fala interpretada com shadowing. Ainda não temos estudos que se concentrem

unicamente na fala do intérprete para investigar a influência dos fatores

prosódicos na avaliação de qualidade e compreensão da fala interpretada. A

base da interpretação é a fala do intérprete. A fala não transmite apenas o

conteúdo informativo das sentenças, mas também veicula outras informações,

tais como a expressão de atitudes e emoções do falante. A expressividade da

fala de um intérprete pode influenciar a maneira com que esse é avaliado por

seu público em termos de agradabilidade, credibilidade, assertividade ou nível

de conhecimento. Passar a mensagem com elementos prosódicos adequados,

incluindo tom de voz, entoação e acento, é crucial para o sucesso da

interpretação e da compreensão do que se fala. É, portanto, fundamental

investigarmos essa fala a fundo, incluindo parâmetros como taxa de elocução,

pausas, padrões entoacionais e outros para podermos entender e conscientizar

os intérpretes em questões como percepção de qualidade e compreensão de

seu trabalho. Talvez aí possamos discutir as bases para futuras pesquisas na

área.

Neste capítulo discutimos as principais pesquisas na área da avaliação

de qualidade na interpretação e traçamos uma comparação entre os achados

43

mais importantes. No próximo capítulo, usaremos a fundamentação teórica

para discutir e analisar a importância desses parâmetros.

44

Capítulo 3 - Fundamentação Teórica

‘Toda fala é expressiva, no sentido de que alguma forma de atitude, emoção,

crença, estado físico ou condição social é veiculada por meio da fonação e da

articulação dos sons... Essa potencialidade da fala para expressar sentidos a

torna um meio eficaz para a comunicação. Por meio da fala veiculamos

informações, mas também expressamos nossas atitudes, emoções e crenças e

sinalizamos nossas posições em relação ao discurso...O falante é capaz de

materializar em som suas ideias, atitudes e sentimentos para comunicar ao

ouvinte a impressão que intenta”

MADUREIRA (2004)

Neste capítulo, investigaremos a fala do intérprete e suas características

mais marcantes, como a formação de grupos entoacionais, o número e

distribuição de pausas, e pitch intensidade médios e taxa de elocução, e

traçaremos uma comparação entre essas características na interpretação e na

fala espontânea. Para tal, nos apoiaremos na literatura para descrição das

características muito particulares da fala do intérprete, nomeadamente

utilizando o trabalho de descrição da fala do intérprete desenvolvido por

Schlesinger em 1994. A seguir, levantaremos na literatura a definição de cada

um destes elementos prosódicos e sua importância na construção de sentido

na fala.

Diferente da tradução, a interpretação é um processo exclusivamente

oral, desde sua origem (fala original) até seu produto final (fala do intérprete). A

interpretação simultânea com equipamento, objeto de nosso estudo, difere

ainda mais da tradução na medida em que está comprimida em um espaço de

tempo. Poderíamos dizer que a interpretação simultânea é uma resposta oral

única e imediata a um estímulo oral também único e imediato. Além disso, de

acordo com Seleskovitch (1978) durante uma jornada de trabalho normal,

dependendo da taxa de elocução da fala original, o intérprete de conferência

45

processa e articula aproximadamente 20000 (vinte mil) palavras, enquanto os

tradutores traduzem entre 2000 e 3000 (vinte a trinta mil) palavras ao dia

(produção média diária da União Europeia e Nações Unidas). Isto significa que

em um dia um intérprete processa dez vezes mais palavras que um tradutor. É

exatamente este volume fenomenal de informação a ser processada em um

espaço tão pequeno de tempo, e não simplesmente o fato de o intérprete ouvir

uma língua e produzir outra, que faz com que a interpretação simultânea (IS)

traga desafios que podem vir a afetar a fala do intérprete. Na IS, os aspectos

da fala adquirem um papel vital, não só pela sua característica intrínseca de

oralidade, mas porque o intérprete, pressionado por uma sobrecarga na sua

capacidade de processamento e uma limitação de tempo, acaba por produzir

uma fala que é muito específica e característica e que não pode nem ser

chamada de espontânea (porque depende da fala do outro) nem de laboratorial

(porque o intérprete opta, dentre um leque de escolhas, pela maneira como irá

verbalizar o sentido).

3.1 O Modelo dos Esforços e a Fala do Intérprete

“Para interpretar, o intérprete deve primeiro entender” (Seleskowitch

1978, p. 11). Como iremos verificar, a interpretação não é um processo

mecânico, mas sim “uma operação cognitiva altamente complexa” (Kurz 2008:

180) em que os intérpretes, primeiro devem entender a mensagem que

recebem para depois verbalizá-la no idioma alvo. Essa complexidade de

processamento mental é muito bem descrita no modelo teórico de Daniel Gile

(1995), que explica como o trabalho do intérprete simultâneo deve equilibrar

diferentes esforços – de Audição e Análise (Listening and Analysis), de

Memória (Memory), de Produção (Production) e de Coordenação destes

esforços (Coordenation) (GILE, 1995)– de forma a chegar a um resultado final

satisfatório, uma tarefa que Gile compara àquela de um malabarista em sua

“Hipótese da Corda Bamba” (Tightrope Hypothesis):

“A Hipótese da Corda Bamba preconiza que na maior parte do tempo os

intérpretes trabalham próximo ao ponto de saturação, seja em termos de

46

requisitos de capacidade de processamento mental como um todo, seja

em relação a Esforços individuais, devido à alta exigência de um esforço

em particular e/ou uma alocação subotimizada dos recursos a cada um

dos esforços”.

(GILE, 1995)

Como podemos perceber, a fala do intérprete está comprimida entre

todos os outros esforços necessários para a execução da atividade como um

todo, e obviamente não passa incólume por tal compressão. Ela não pode ser

chamada de espontânea nem tampouco guiada ou laboratorial, o que a torna

absolutamente singular. Apesar de escolher suas palavras, o intérprete precisa

esperar o discurso original para compreender seu significado, lógica e registro.

Só a partir de então poderá construir sua fala – que compreenderá vocabulário,

estrutura gramatical, entoação, posicionamento de adjetivos e advérbios,

registro de formalidade, etc. – e que poderá ser parecida, ou completamente

diferente, da estrutura que usaria fora da cabine de interpretação.

Embora tão notavelmente específica, ainda há poucos estudos que

investigam a fala do intérprete. Já existe evidência, no entanto, de que essa

pressão de processamento mental interfere na produção verbal do intérprete,

afetando sua produção prosódica (SCHLESINGER:1994, COLLADOS: 1998,

2001, HOLUB: 2010, RENNERT: 2010). O primeiro estudo com dados sobre as

características específicas da fala do intérprete foi desenvolvido por Miriam

Schlesinger (1994). Para investigar o papel da entoação na produção e

percepção da interpretação simultânea, Schlesinger analisou a produção

simultânea de oito intérpretes de conferência trabalhando do inglês para

hebreu e do hebreu para o inglês, isolando dez extratos de aproximadamente

90 segundos, escolhidos aleatoriamente (6 extratos do inglês para hebreu) e (4

extratos do hebreu para o inglês).

Os resultados da análise de Schlesinger mostram um conjunto de

características na fala do intérprete que trazem diferenças marcantes da fala

espontânea. A primeira delas é a utilização de pausas e consequente

distribuição do enunciado em unidades de informação (grupos entoacionais).

47

Os dados parecem indicar que pausas no meio de estruturas gramaticais são

um dos aspectos mais salientes da interpretação, ou seja, os intérpretes

tendem a introduzir um número desproporcional de pausas em posições

consideradas não “naturais”, quebrando as unidades de sentido dentro de um

mesmo grupo entoacional. Também há um uso característico das

proeminências, com sílabas “inesperadas” carregando o pitch accent, ou valor

de pitch máximo, em cada grupo entoacional. Outro aspecto de destaque é a

marcação do pitch final de fronteira, com uma tendência de os intérpretes

terminarem suas frases com um pitch elevado, não concludente. O último

aspecto investigado por Schlesinger foram as questões de duração e taxa de

elocução, com a produção dos intérpretes sendo geralmente sem ritmo regular,

com alterações fora do padrão tanto em duração quanto em taxa de elocução.

Esses resultados são importantes porque nos apontam as principais

direções para investigação da prosódia na fala do intérprete, fatores os quais

podem vir a atrapalhar a avaliação de qualidade e compreensibilidade desta

fala e porquê. Para tanto, precisamos nos embasar na literatura para entender

qual o papel de cada um destes aspectos prosódicos na produção da fala.

3.2 Prosódia

O termo prosódia apresenta definições diversas na literatura fonética.

Em nosso trabalho, definiremos a prosódia como um termo geral que

compreende elementos como a entoação, a acentuação, a qualidade de voz, o

ritmo, a taxa de elocução e a pausa. Esses elementos implicam em correlatos

acústicos, perceptivos e fisiológicos. Na figura a seguir, mostramos os padrões

perceptivos de pitch, loudness e duração da fala. Cada um desses padrões

está associado a um correlato acústico e a um correlato fisiológico, como

retirado de (GRICE, BAUMAN, 2007). As correlações existentes entre os

planos da percepção, da acústica e da produção podem ser observadas

abaixo:

48

Figura 2 - Padrões perceptivos de pitch, loudness e duração da fala e seus correlatos acústico e fisiológico.

A entoação, ou melodia da fala, envolve a ocorrência de padrões de

pitch em palavras ou grupo de palavras. O principal correlato acústico da

entoação é a frequência fundamental (f0), que está relacionada em nível de

produção à taxa de vibração das pregas vocais e em nível de percepção ao

pitch. A f0 pode ser medida em Hz e corresponde a grosso modo, em nível

fisiológico, ao número de vibrações das pregas vocais por segundo. No nível

auditivo, a f0 corresponde à sensação de altura do tom de voz (tom grave

(baixo) ou tom agudo (alto)).

O acento refere-se à proeminência. O acento pode ser frasal (acento da

frase) ou lexical (acento da palavra). No português, o principal correlato do

acento lexical é a duração (MIGLIORINI e MASSINI-CAGLIARI, 2010;

BARBOSA, 2010).

A vogal tônica apresenta maior duração e a pós-tônica menor duração e

intensidade. A duração dos segmentos fônicos pode ser medida em um

software de análise de fala no espectrograma de banda larga. O

espectrograma de banda larga, gerado a partir de filtros acústicos mais largos

49

(acima de 150Hz) do que os de banda estreita, é um gráfico que apresenta a

frequência na ordenada, o tempo na abscissa e a intensidade no contraste de

cor (quando o espectrograma é apresentado em preto e branco, quanto mais

escura a região de frequência, maior a intensidade).

Pelo espectrograma de banda larga, podemos identificar os formantes

(manchas escuras) que correspondem às ressonâncias do trato e permitem a

partir de sua leitura inferir o posicionamento dos órgãos articuladores. A seguir,

a Figura 3 em que a vogal tônica da palavra “fogo” pode ser contrastada com a

vogal pós-tônica em termos de duração.

Figura 3 – Forma da onda, espectrograma de banda larga de emissão da palavra “fogo” e camada com a segmentação dos segmentos consonantais e vocálicos.

O acento frasal realiza-se por um movimento mais amplo de f0 e recai

sobre a sílaba da palavra que na frase veicula a informação mais importante.

O ritmo refere-se às regularidades percebidas nas unidades

proeminentes da fala (entre sílabas acentuadas e não acentuadas ou entre

sílabas breves e longas), o que lhe confere uma certa estruturação. O

parâmetro acústico principal do ritmo de línguas de ritmo silábico ou misto,

como o Português Brasileiro, é a duração, como postulado por BARBOSA

(2000; p.374): “Nessas línguas, a duração é o principal ou um dos parâmetros

50

acústicos principais para assinalar o acento, desviando, portanto, a sílaba

acentuada da suposta constância de duração em relação às outras sílabas”.

A taxa de elocução refere-se à percepção de a fala de uma pessoa ser

rápida, lenta ou normal. Pode ser medida em número de sílabas ou palavras

por tempo de elocução. As variações na taxa de elocução afetam tanto a

duração quanto a qualidade dos segmentos.

O termo pausa é utilizado tanto para se referir à pausa silenciosa

(silêncio utilizado pelo falante para respirar ou planejar o discurso), quanto à

pausa preenchida (uso de expressões como né, tá, ahn,) ou à sensação de

interrupção no fluxo da fala causada por alterações de pitch, duração e

loudness que estão correlacionadas, respectivamente, à elevação ou

diminuição de F0, maior ou menor duração de sílabas e à maior ou menor

intensidade.

.

A qualidade de voz refere-se aos ajustes fonatórios e articulatórios e de

tensão que acompanham dois ou mais segmentos de fala, enunciados ou a

fala de um indivíduo como um todo. De acordo com LAVER (1980), esses

ajustes podem estar relacionados à configuração fisioanatômica do aparelho

fonador, mas também a ajustes ou parâmetros musculares de curto prazo

usadas pelo falante com uma finalidade lingüística e paralinguística específica.

Complementarmente, na definição de CHUN (2002, p. 3) “prosódia é um

contínuo de funções e efeitos, que abrangem características não linguísticas e

extralinguísticas por um lado, até características paralinguísticas e mesmo

essencialmente linguísticas10”. Os elementos extralinguísticos e

paralinguísticos de um determinado estilo de fala podem ser evidenciados tanto

pela fisiologia ou anatomia do falante quanto causados por “...um esforço

consciente e deliberado (e consequentemente comunicativo) deste para

transmitir uma certa personalidade, emoção ou atitude11” (CHUN, 2002, p.3).

10 (Prosody) “is a continuum of functions and effects, ranging from the nonlinguistic or extralinguistic at one end, through the paralinguistic, to the essentially linguistic.” 11 “...a conscious and deliberate (and therefore communicative) effort by the speaker to convey

51

Assim, um mesmo elemento prosódico pode sinalizar uma função

linguística, paralinguística ou extralinguística. A qualidade de voz, por exemplo,

pode ser utilizada para expressar funções linguísticas (delimitação de

enunciados), paralinguísticas (expressão de emoções) e extralinguísticas

(gênero e grupo social) do falante.

Seja através de elementos mais ou menos concretos, a importância da

prosódia na fala é fundamental para muitos autores estudados. Para Gumperz

(1982, p. 107) “A prosódia permite com que os interlocutores dividam o fluxo da

fala em unidades de mensagem básicas que tanto possibilitam a interpretação

da mensagem quanto controlam as estratégias de mudança de interlocutor que

são essenciais para a manutenção de um envolvimento conversacional12”.

Como atividade comunicadora, a interpretação se utiliza de

elementos prosódicos da fala, mas de uma maneira diferente da fala

espontânea. Se, de acordo com Rilliard et al (2012), as modificações

prosódicas (no discurso) afetam o registro médio, pitch range e ritmo do

discurso, então movimentos prosódicos ‘não convencionais’ na fala do

intérprete podem afetar a compreensibilidade ou percepção da mensagem por

parte dos ouvintes.

Analisemos então cada um destes elementos em separado em

comparação com sua descrição na literatura.

3.3 Pausa

A pausa, identificada por Schlesinger (1994) como a caraterística mais

marcante da fala do intérprete. O intérprete tende a produzir um número maior

a certain personality, affect, or attitude” 12 “Prosody enables conversationalists to chunk the stream of talk into basic message units which both underlie interpretation and control the turn taking or speaker change strategies that are essential to the maintenance of conversational involvement.”

52

de pausas e em posições consideradas não ‘naturais’. O que seria, no entanto,

a descrição do uso de pausas na fala espontânea?

De acordo com Cruttenden (1986) as pausas tipicamente ocorrem em locais

distintos em um enunciado:

1) Em um componente de fronteira importante (principalmente entre

cláusulas e entre sujeito e predicado). Existe uma correlação entre o tipo de

componente de fronteira e o tamanho da pausa, ou seja, quanto mais

importante a fronteira, maior a pausa. Além disso as pausas tendem a ser mais

longas onde os componentes de fronteira (neste caso geralmente fronteiras de

sentença) envolvem um novo tópico. As pausas deste tipo são tipicamente

silenciosas, mas podem ser preenchidas como ferramenta do discurso, ou seja,

para evitar que outra pessoa interrompa o falante atual;

2) Antes de palavras de alto conteúdo léxico ou, colocando em termos da

teoria da informação, em pontos de baixa probabilidade transacional. Assim, as

palavras precedidas por uma pausa são geralmente difíceis de serem

adivinhadas por antecipação. Este tipo de pausa geralmente ocorre antes de

um componente de fronteira menor, frequentemente dentro de uma oração

substantiva, oração verbal ou oração adverbial, isto é, entre um substantivo

principal e um determinante;

3) Após a primeira palavra em um grupo entoacional. Esta é uma posição

típica por outros ´erros de desempenho´, por exemplo, correções de um falso

início e repetições. Tanto a pausa do tipo 2 quanto a pausa do tipo 3 podem

ser consideradas fenômenos de hesitação. As do tipo 2 indicam dificuldades

em se encontrar a palavra adequada; as do tipo 3 parecem ter uma função de

planejamento, isto é, servem essencialmente como uma operação de espera,

enquanto o falante planeja o restante do enunciado.

Ao introduzir um número superior ou inferior de pausas em sua fala, em

posições talvez diferentes do esperado em uma fala espontânea, o intérprete

pode dificultar a compreensão de sua mensagem. Foram estes os achados de

53

Kurz (2008) no estudo referido acima. Ao comparar a compreensão de um

segmento primeiramente interpretado e depois lido pelos mesmos intérpretes, a

autora identifica uma diferença significativa no nível de compreensibilidade da

mensagem por parte dos ouvintes em detrimento da interpretação.

3.4 Entoaçâo

Outro ponto apontado por Schlesinger (1994) como marcante na fala do

intérprete é a entoação, com destaque para a marcação do pitch final de

fronteira, com uma tendência de os intérpretes terminarem suas frases com um

pitch elevado, não concludente.

Sabemos que o padrão entoacional de um falante é utilizado para

diferenciar uma modalidade de discurso de outra (MADUREIRA, 1999), e que

diferentes padrões entoacionais sugerirão modalidades diferentes, sejam elas

imperativa, declarativa ou interrogativa. A pista entoacional é importante para

decodificarmos também a estrutura gramatical da fala, mas não só. Afinal,

como afirma Bolinger (1958, p. 338) “A entoação é importante para quem está

falando, para quem falará em seguida, para como o ato será compreendido

(uma explicação, um pedido de desculpas, um questionamento), para como o

falante será avaliado (como indivíduo, como falante nativo, como membro de

uma classe social) – apenas para mencionar alguns elementos que afetam

nosso papel como Falantes e Ouvintes13“.

Chun (2002) define quatro funções principais para a entoação:

gramatical, atitudinal, de discurso e sociolinguística.

As funções gramaticais são aquelas que guardam uma maior

aproximação com o nível sintático do discurso, ou seja, como já comentado

anteriormente, a curva entoacional varia conforme a modalidade da oração

(afirmativa, interrogativa, imperativa etc.). No entanto, como destaca Bolinger

13 “Intonation is important for who is speaking, for who will be taking the next turn, for how the act is to be understood (explanation, apology, challenge) for how the speaker will be evaluated (as an individual, as a native speaker, as a member of a social class) – to mention only a few things that affect our roles as Speakers or Listeners”.

54

(1958), a relação entre gramática e entoação é casual e não causal. Existe

uma certa escolha que vai depender de considerações pragmáticas. Isto leva

Chun (2002) a subdividir a categoria de funções gramaticais em duas, onde

uma concentra-se no alinhamento e associação de tons com estruturas

sintáticas em particular (modalidades) e a outra na compartimentação do fluxo

do discurso em várias unidades, ou seja, como função de segmentação da

informação, que está associada a regularidade da fala.

As funções atitudinais são aquelas que ligam a entoação à expressão de

emoções e atitudes. Brown et at (2001) sugerem que pode haver um pequeno

número de padrões entoacionais que estão convencionalmente relacionados a

uma série de atitudes. No inglês, por exemplo, um tom de fronteira final

ascendente (na avaliação de Schlesinger (1994) não concludente no discurso

do intérprete), poderá ser avaliado como característico de um falante que

deseja ser agradável e encorajar o seu interlocutor a participar no diálogo.

As funções de discurso vão além do nível da oração e destinam-se a

constituir coerência e continuidade com o discurso como um todo,

independentemente de seu tamanho ou duração. São destinadas a marcar

proeminências e fronteiras entre orações, parágrafos, tópicos a fim de dar

continuação a um tópico estabelecido ou sinalizar um novo tópico a ser

introduzido. Também evidenciam as pistas ao interlocutor, no caso de diálogo,

de que é agora sua vez de falar.

As funções sociolinguísticas revelam diferenças na entoação de acordo

com o grupo social a que o falante pertence, incluindo aí diferenças de gênero,

idade, características socioeconômicas, geográficas e/ou ocupacionais. Através

da fala, o intérprete revela informações sobre o grupo em que está inserido.

Mais uma vez, mudanças entoacionais na fala do intérprete podem levar a uma

percepção por parte do ouvinte de que o intérprete pertence a um contexto

sociolinguístico diferente do seu.

55

3.5 Pitch Accent

Sabemos que o intérprete faz um uso característico das proeminências,

com sílabas ‘inesperadas’ carregando o pitch accent, ou seja, a sinalização de

uma proeminência acentual por alteração de pitch.

De acordo com LAVER (1994) uma das funções da entoação é sinalizar

que algumas partes de uma estrutura entoacional são, de alguma forma, mais

essenciais para a interpretação do sentido da mensagem do que outras partes,

que vão necessariamente aparecer como menos proeminentes na fala. A

gradiência da proeminência também sinaliza uma coordenação com a

organização métrica de acento e ritmo de fala, imprimindo a esta uma

regularidade que é importante para identificar ao ouvinte os blocos de

informação que estão sendo produzidos. Orações sintaticamente idênticas com

diferentes focos de pitch máximo vão transmitir ao ouvinte pistas de informação

diferentes, e levarão, consequentemente, a diferentes interpretações da

mensagem. Estas diferenças de interpretação de acordo com o ponto em que

se percebe o pitch máximo (proeminência) da fala sugerem que a entoação

pode ser tratada como uma forma de comportamento linguístico.

Cruttenden (1986) identifica que o pitch accent depende de algum tipo

de obstrução do pitch no ponto do acento a partir do pitch das sílabas

circunvizinhas. Isto significa dizer que o pitch accent sempre aparece em

comparação a um grupo entoacional como um todo e identifica um movimento

de fala não isolado. Assim, o pitch accent depende de um movimento que vem

ou se direciona às sílabas adjacentes e pode ser configurado como um

patamar acima, um patamar abaixo, uma movimentação de baixo para cima ou

uma movimentação de cima para baixo. Cada um desses movimentos e/ou

troca de patamar leva a uma pista entoacional diferente, pois a marcação de

proeminência (e, portanto, sinalização de importância da informação) irá variar

de acordo com o local onde está o pitch accent.

Ao situar o pitch accent em um ponto de sua fala, o intérprete está

necessariamente trazendo este ponto como informação mais importante de um

dado segmento. Pitch accent inesperados podem levar à confusão por parte do

56

ouvinte, pois interferem na regularidade da fala e deslocam o foco de atenção

para estruturas sintáticas supostamente menos providas de sentido dentro de

um grupo entoacional.

Um dos objetivos deste estudo é investigar se as características

descritas por Schlesinger também estão presentes na produção de intérpretes

trabalhando do Inglês para o Português Brasileiro e verificarmos se estas

podem de fato afetar a avaliação de qualidade e compreensão da fala

interpretada.

Neste capítulo, discutimos as características mais marcantes da fala do

intérprete de uma perspectiva teórica, mostrando as correlações da fala nos

níveis perceptivo, acústico e fisiológico. Também descrevemos as implicações

que as mudanças nos elementos prosódicos podem trazer ao nível do sentido.

O próximo capítulo discorrerá sobre a metodologia utilizada neste estudo

para analisar e caracterizar a fala do intérprete acústica e perceptivamente

como base para refletirmos sobre o impacto da prosódia na avaliação de

qualidade e compreensão e compreensibilidade da fala do intérprete.

57

Capítulo 4 - Metodologia

Neste capítulo descreveremos a metodologia adotada em nosso estudo,

baseado em um corpus composto de falas semiespontâneas e interpretadas de

um grupo de intérpretes.

4.1 Participantes Sujeitos da Pesquisa

Doze intérpretes profissionais do sexo feminino participaram de nosso

estudo. Todas as participantes são nativas de PB e possuem afiliação em uma

ou mais entidades profissionais, nomeadamente AIIC (Associação Internacional

de Intérpretes de Conferência), APIC (Associação Profissional de Intérpretes

de Conferência) ou ATA (American Translators Association). O tempo médio de

exercício na profissão das intérpretes é de 15 anos (mínimo 6 e máximo 20) e

idade entre 41 e 53 anos, assim distribuídos:

Tabela 2. Intérpretes sujeitos da pesquisa, com respectivas idades e tempo de exercício da profissão.

Sujeito Idade Tempo de profissão

1. S1 45 6

2. S2 46 16

3. S3 53 18

4. S4 52 13

5. S5 44 15

6. S6 48 19

7. S7 48 19

8. S8 51 20

9. S9 47 12

10. S10 45 15

11. S11 50 17

12. S12 41 11

Média 15

58

4.2 Procedimentos metodológicos

4.2.1 Seleção e descrição da fala a ser interpretada

A fala utilizada para o exercício de interpretação foi uma palestra

intitulada Don´t Insist on English (Não Insistam no Inglês), proferida por Patricia

Ryan, de origem britânica, professora de inglês da Universidade de Zayed em

Dubai. A palestra foi filmada em dezembro de 2010 no evento TEDxDubai e

está disponível para download no acervo do TED TALKS, no endereço

http://www.ted.com/search?q=patricia+ryan. A duração total da palestra é de

10:35 minutos. Se desconsiderarmos a vinheta de introdução e finalização do

arquivo sonoro, assim como as pausas cedidas para aplauso ou manifestação

da plateia superiores a 2 segundos, o tempo total de fala é de 9:86 minutos,

com produção de 1370 palavras. A transcrição do discurso original encontra-se

no Anexo 1.

4.2.2 Coleta do corpus

As intérpretes foram audiogravadas através do equipamento Sanako Lab

100, disponibilizado pela Associação Alumni, em quatro sessões consecutivas

no dia 19 de agosto de 2013. Cada profissional trouxe seu próprio laptop e fone

de ouvido para a sessão de gravação, para que a versão a ser interpretada

fosse baixada em seu equipamento. Foram utilizadas entre três e quatro

cabines de interpretação em cada sessão, com ocupação de uma intérprete

por cabine. A ordem de gravação obedeceu a ordem de chegada das

profissionais à Associação Alumni.

Nas cabines, as intérpretes foram instruídas a postar o microfone da

cabine em volta do pescoço, a aproximadamente 7 centímetros de distância da

boca para sua primeira tarefa – falar sobre um tema de sua livre escolha por

aproximadamente um minuto e meio (fala semiespontânea). O objetivo desta

primeira tarefa era ter um registro inicial da fala de cada profissional fora da

tarefa de interpretação, para posterior análise e comparação com a fala

http://www.ted.com/search?q=patricia+ryan

59

interpretada em termos de taxa de elocução, distribuição e número de grupos

entoacionais e pausas e frequência fundamental (f0).

Na sequência, as intérpretes iniciaram a gravação da interpretação em

si. Através de seus fones de ouvido conectados aos laptops, as profissionais

tinham acesso ao áudio e ao vídeo da palestra, assim reproduzindo de maneira

bastante fidedigna um ambiente típico de trabalho, pois podiam acompanhar a

palestrante visualmente enquanto esta proferia sua palestra. Mais uma vez, a

gravação da interpretação foi feita através do microfone da cabine, posicionado

em volta do pescoço de cada intérprete, a aproximadamente 7 centímetros de

distância da boca. Porque as intérpretes utilizavam seus próprios fones de

ouvido como fonte de entrada de áudio e os microfones na cabine como fonte

de saída de áudio, não houve interferência do áudio original no canal de

gravação das intérpretes.

A gravação foi feita na extensão .mp3 e posteriormente convertida

para .wav, canal mono, para análise de fala pelo PRAAT, um software livre

desenvolvido por Paul Boersma e David Weenink, do Instituto de Ciências

Fonéticas de Amsterdam, disponível para download no site www.praat.org.

(BOERSMA, 2002).

4.2.3 Análise Acústica dos Extratos de Áudio

Findo o trabalho de coleta, os áudios completos de cada intérprete foram

abertos no software Praat. Através das ferramentas de edição, o extrato de fala

semiespontânea foi separado da fala interpretada e analisado. Na fala

interpretada, três extratos representativos do discurso foram selecionados para

análise e avaliação – um inicial, na abertura da palestra (com tempo de fala

total, descontados os períodos de aplauso, de 34 seg), um medial, produzido

no meio da palestra, a partir do minuto 5:42 (tempo de fala total, 34 seg) e um

final, na conclusão da palestra (tempo de fala total, 25 seg). Três segmentos

adicionais foram também selecionados para serem posteriormente

incorporados na tarefa de avaliação perceptiva com o objetivo de verificarmos a

60

uniformidade das respostas entre os três grupos de juízes que responderam à

pesquisa. As transcrições dos extratos escolhidos encontram-se no Anexo 2.

Dentro do segmento inicial, havia dois períodos de aplauso no discurso

original, com duração de aproximadamente 5,5 e 2,5 segundos

respectivamente. Na fala das intérpretes, esse tempo de espera se traduzia em

pausas silenciosas, mas com durações diferentes, dependendo da distância de

cada intérprete em relação à fala original. Para deixar as gravações mais

uniformes, optou-se por editar as pausas silenciosas nesses dois pontos,

eliminando qualquer período, nestes dois pontos especificamente, superior a 1

segundo. O mesmo foi feito com a fala original em inglês, para maior

homogeneidade na comparação dos resultados. Os outros extratos não

apresentaram dificuldades e não foram editados.

Os segmentos extraídos da fala de cada intérprete, juntamente com os

segmentos originais em inglês, foram analisados no software Praat. No total, 55

segmentos foram analisados: 12 segmentos contendo a fala semi0espontânea

das intérpretes, 4 segmentos originais (inicial, medial, final e adicional), 12

segmentos contendo os extratos iniciais de cada interpretação, 12 segmentos

contendo os extratos mediais, 12 segmentos contendo os extratos finais, e 3

segmentos contendo os extratos adicionais. Os extratos foram analisados

quanto à quantidade e à distribuição de grupos entoacionais (GE), quantidade

e distribuição de pausas (P), e quantidade e distribuição de alongamentos

vocálicos (AV). Também foram tomadas as medidas de frequência fundamental

(em Hz) média, mínima e máxima de cada extrato.

A Figura 4, a seguir mostra como cada segmento foi analisado

acusticamente. As diferentes camadas mostram a divisão em grupos

entoacionais (GE), incidência de pausas (P) e alongamentos vocálicos (AV). A

segmentação desses elementos foi realizada com base no espectrograma de

banda larga com referência à forma de onda. Como mencionamos

anteriormente, o espectrograma de banda larga é um gráfico que apresenta a

frequência na ordenada, o tempo na abscissa e a intensidade no contraste de

cor (quando o espectrograma é apresentado em tons de cinza, quanto mais

61

escura a região de frequência, maior a intensidade). Os números no eixo

vertical do espectrograma de banda larga mostram a faixa de frequência em

Hz.

Figura 4 – Extrato de segmento analisado, contendo, de cima para baixo, as camadas de: forma de onda com as demarcações dos pulsos glotais em azul, espectrograma de banda larga com traçados de frequência fundamental (em azul) e intensidade (em amarelo) superpostos, camada com identificação dos Grupos Entoacionais, da Pausa e dos Alongamentos Vocálicos percebidos.

4.2.4 Avaliação Perceptiva da Qualidade da Produção Oral dos

Intérpretes

Os extratos foram então submetidos à avaliação de um grupo de 90

juízes, todos cursando ou recém-formados de cursos de Tradução ou

Interpretação, com idade entre 18 e 60 anos. Os juízes foram divididos em três

grupos para analisar 15 extratos de fala. Cada grupo analisou 12 extratos de

fala diferentes (4 iniciais, 4 mediais e 4 finais). Como mencionado 3 extratos

(os extratos adicionais) foram incorporados em todas as versões para

verificação de uniformidade no comportamento de avaliação dos juízes de cada

grupo. Cada versão trazia uma produção de cada uma das intérpretes, de

maneira que todos os 90 juízes avaliaram pelo menos uma fala de cada

intérprete. A distribuição das diferentes versões pode ser visualizada no Anexo

3.

62

A tarefa dos juízes era responder um questionário baseado na Escala de

Likert para verificação de avaliação de qualidade e grau de compreensibilidade.

Este método de avaliação mede uma resposta positiva ou negativa a um

determinado parâmetro de avaliação e é geralmente aplicado em uma escala

de 5 a 7 pontos. Neste estudo, a tarefa dos respondentes era especificar seu

nível de concordância com cada afirmação, dentro de uma escala de cinco

pontos onde 1 significava que o extrato de áudio não atendia em nada o

quesito avaliado, e 5 significava que o extrato atendia extremamente o quesito

avaliado. No total, sete parâmetros foram avaliados, a saber: Agradabilidade

(nada agradável/extremamente agradável), Credibilidade (nada

confiável/extremamente confiável), Naturalidade (nada natural/extremamente

natural), Fluidez (nada fluida/extremamente fluida), Segurança (nada

segura/extremamente segura), Profissionalismo (nada

profissional/extremamente profissional) e Compreensibilidade (nada fácil de

entender/extremamente fácil de entender) (Anexo 4).

A plataforma utilizada foi a Survey Gizmo http://www.surveygizmo.com/,

uma ferramenta de pesquisas online. Cada juiz recebeu um link via email ou

Facebook para identificação e ativação do questionário. Somente os juízes

convidados poderiam responder as perguntas. O questionário foi montado de

forma a considerar apenas válidas as respostas completas; todas as perguntas

eram mandatórias, ou seja, todos os resultados válidos contemplavam 100%

das perguntas respondidas.

4.2.5 Avaliação da qualidade da interpretação em relação ao

discurso interpretado em termos de conteúdo semântico-discursivo

A transcrição das falas foi também submetida à avaliação de conteúdo

por três profissionais com experiência na formação de intérpretes. Os

avaliadores eram intérpretes profissionais, membros das associações AIIC,

APIC e ATA, com idade entre 45 e 51 anos, tempo médio de profissão de 11 a

15 anos e experiência na formação de intérpretes de 3 a 8 anos:

http://www.surveygizmo.com/

63

Tabela 3. Juízes Avaliadores, com respectivas idades, anos de exercício da profissão e anos de experiência na formação de intérpretes.

Avaliador Idade Experiência em

interpretação

Experiência em formação

(anos)

1 51 anos 15 anos 8 anos

2. 45 anos 11 anos 3 anos

3. 50 Anos 20 anos 12 anos

A tarefa dos juízes avaliadores era analisar cada extrato isoladamente

em comparação ao original (Anexo 5). Consoante com o estudo realizado por

Daniel Gile em 1999, os avaliadores deveriam se concentrar no número de

erros (E), número de omissões (O) e manutenção do sentido original (S) para a

avaliação da qualidade da interpretação, atribuindo uma nota final (T) de 0 a 5

(onde 0 seria considerado insuficiente e 5, excelente) a cada extrato. As notas

de cada intérprete por extrato foram somadas, e cada intérprete recebeu uma

pontuação final cumulativa de 0 a 15. Essa pontuação final foi então dividida

por três para termos uma média final possível entre 0 e 5 para cada intérprete.

4.2.6 Tratamento Estatístico

Os resultados foram armazenados em planilhas Excel da Microsoft,

normalizados com o z-score, que é um método de medição estatística usado

para comparar médias de conjuntos de dados diferentes homogeneamente

distribuídos, e submetidos à Análise Exploratória de Variáveis Múltiplas – MFA

(Multiple Factor Analysis). Por combinar métodos de componentes principais,

agrupamentos hierárquicos e particionamentos, a Análise Exploratória de

Variáveis Múltiplas possibilita destacar as semelhanças e diferenças entre os

estímulos (HUSSON et al, 2013).

Para verificar a semelhança entre os grupos de variáveis, que no nosso

estudo são em número de três: (Gc1, as variáveis acústicas; Gc2, as do

diferencial semântico e Gc 3, as do julgamento da transcrição), utilizamos o

coeficiente Lg dado pela fórmula de Pearson. Além do Lg, outro coeficiente de

correlação de grupos de variáveis é o RV, que mede a proximidade de dois

64

conjuntos de pontos que podem ser representados por uma matriz. O RV = Lg

normalizado representa, em estatística multivariada, o quadrado do coeficiente

de Pearson. Seus valores variam entre 0 e 1.

4.2.7 Comitê de Ética

O protocolo da presente Pesquisa foi submetido ao Comitê de Ética da

Pontifícia Universidade Católica de São Paulo e recebeu aprovação, com

CAAE: 44465314.0.0000.5482.

Neste capítulo descrevemos as diferentes fases da metodologia utilizada

para esta dissertação. No próximo capítulo analisaremos os principais

resultados encontrados.

65

Capítulo 5 - Resultados

Neste capitulo, abordaremos os resultados da pesquisa, iniciando com a

inspeção acústica das falas semiespontânea e interpretada de cada intérprete.

A seguir descreveremos os resultados da análise perceptiva e avaliação do

conteúdo semântico-discursivo das falas interpretadas, fechando o capítulo

com uma comparação entre ambos.

Na exposição dos resultados, determinados procedimentos

metodológicos são retomados para facilitar o acompanhamento do que é

exposto.

5.1 Fala Semiespontânea

A fala semiespontânea das intérpretes foi coletada antes da fala

interpretada em um contínuo de gravação. Finalizada a coleta dos áudios, os

arquivos sonoros foram abertos no software Praat para inspeção das

características acústicas, análise e medição em cada trecho de fala da duração

de pausas silenciosas, grupos entoacionais, alongamentos vocálicos, e das

produções de fala em ms e dos valores máximos e mínimos de f0 em Hz. Uma

primeira janela foi aberta para podermos visualizar os dois momentos da

gravação (Figura 5). O primeiro bloco de ondas sonoras indica a fala

semiespontânea e o segundo bloco a fala interpretada.

Figura 5 – Forma de onda do corpus de gravação completo, incluindo no primeiro bloco (à esquerda) a fala semiespontânea das intérpretes e, no segundo bloco (à direita), sua fala interpretada.

66

Como podemos deduzir a partir da figura acima, pelas diferenças de

amplitude das ondas sonoras, algumas intérpretes variaram a intensidade entre

a fala semiespontânea e a fala interpretada. Perceptivamente, também

observamos essa discrepância em termos de loudness alto e baixo. Entretanto,

a medição da intensidade exigiria além do controle da distância do microfone, o

qual efetuamos, a realização de calibração com um Medidor de Nível de

Pressão Sonora (MNPS), também conhecido por decibelímetro em níveis com

diferença de 20dB entre os canais direito e esquerdo de um gravador

esterefônico a partir da referência de um sinal de frequência em 1000 Hz. No

entanto, como a gravação de ambas as falas foi realizada em um contínuo,

dentro dos mesmos ajustes de gravação, podemos apontar a diferença na

amplitude da forma da onda entre os dois momentos de fala e as diferenças

auditivas de loudness percebidas. Com exceção de uma intérprete, S9, todas

as variações de loudness foram para maior na fala interpretada. Os registros

das ondas sonoras completos relativos às falas de cada intérprete podem ser

visualizados no Anexo 6.

A fala semiespontânea foi então isolada do todo para análise, levando

em consideração o número de grupos entoacionais, o número e a distribuição

de pausas silenciosas, respiratórias ou vocais (através da utilização de ums,

ahns e outros), a presença de alongamentos vocálicos, a taxa de elocução e os

valores de frequência fundamental (mínimos e máximos) como podemos

observar na Figura 6.

67

Figura 6 – Forma de onda, espectrograma de banda larga com superposição do traçado de frequência fundamental, camada de divisão dos grupos entoacionais (GE), camada com as delimitações das pausas silenciosas e camada com as delimitações dos alongamentos vocálicos (AV) na fala semiespontânea do S2.

A fala espontânea teve duração de 83,52 a 106,87 segundos. As

intérpretes apresentaram frequência fundamental média nos segmentos entre

175,68 e 237,84 hertz, consoante aos dados encontrados na literatura que

indicam uma frequência fundamental média de 204 Hz (BARALDI, 2007) para

mulheres adultas (entre 18 e 45 anos) falantes do Português Brasileiro. A

frequência fundamental mínima e máxima foi medida posicionando o cursor

nos valores mínimo e máximo de f0 em cada trecho de fala no traçado gerado

por meio da função show pitch do Praat. Erros de registro de f0 foram

descartados. Com as medidas de frequência fundamental mínima e máxima

coletadas para cada segmento, as configurações de pitch (pitch settings) foram

alteradas, de maneira que o campo de frequência a ser computado ficasse

entre os valores mínimo e máximo identificados para cada extrato. A partir daí,

utilizamos a função get pitch para obter a frequência fundamental média de

cada segmento. O procedimento foi repetido para cada extrato analisado

(inicial, medial, final e adicional original e interpretado).

A taxa de elocução na fala de livre escolha (semi-espontânea) variou de

1,81 a 2,92 palavras por segundo, valores correspondentes a uma variação de

68

108,6 a 175,2 palavras por minuto, achados também consoantes com a

literatura (ZACKIEWICS e ANDRADE, 2000).

A frequência de pausas foi de uma pausa a cada 2,52 a uma pausa a

cada 3,87 segundos, com número de pausas total entre 22 e 36. No geral, a

distribuição de pausas acompanhou a distribuição dos grupos entoacionais (de

23 a 37 grupos entoacionais em cada trecho de fala. Pausas de hesitação no

meio de um grupo entoacional foram achados infrequentes.

5.2 Extratos Originais do Discurso em Inglês

Descontados os intervalos para aplauso, especialmente contidos no

segmento inicial da palestra, os quatro extratos originais do discurso utilizados

nesta pesquisa totalizaram respectivamente 2,49 palavras por segundo; 2,53

palavras por segundo; 1,83 palavras por segundo e 2,31 palavras por segundo.

Se convertermos esses números para palavras por minuto teremos 149,4

palavras por minuto para o segmento inicial, 151,8 para o segmento medial,

109,8 para o segmento final e 138,72 para o segmento adicional. De acordo

com a tabela desenvolvida por Tauroza e Allison para o inglês britânico (1990,

pg 102), essa média revela uma taxa de elocução considerada de normal a

moderadamente lenta para fala em palestra, como observado abaixo:

Tabela 4: Taxa de Elocução média em palavras por minuto verificada em diferentes modos de fala para o Inglês Britânico.

Rádio Palestra Entrevista Conversação

Acima do normal 190 185 250 260

Moderadamente rápido 170 – 190 160 – 185 210 – 250 230 – 260

Normal 150 – 170 125 – 160 160 – 210 190 – 230

Moderadamente lenta 130 – 150 100 – 125 120 – 160 160 – 190

Abaixo do normal 130 100 120 160

A frequência média observada nos segmentos inicial, medial, final e

adicional originais foi de 219,32 hz, com a média de frequência mais alta sendo

69

verificada no primeiro segmento (239,89h). A distribuição e número de grupos

entoacionais e pausas apresentou o mesmo padrão que a fala semiespontânea

das intérpretes, com uma frequência de uma pausa a cada 2,71 segundos, em

média.

5.3 Fala Interpretada

A taxa de elocução das falas interpretadas apresentou grande

variabilidade, com algumas intérpretes se aproximando mais da taxa original e

outras utilizando taxas mais lentas ou mais rápidas, sem um padrão

estabelecido. No entanto, entre as 12 intérpretes gravadas, dez diminuíram sua

taxa de elocução ao iniciar a interpretação, mantendo no geral uma taxa

consistentemente inferior à taxa da fala semiespontânea, independentemente

da taxa de elocução da fala original. A Tabela 5 traz uma comparação do

número de palavras por minuto entre as diferentes falas.

Tabela 5 – Número de palavras por minuto produzidas por cada um dos Sujeitos e Palestrante, contemplando: Fala Original (O), nas posições Inicial (I), medial (M) e Final (F); Fala Semiespontânea (SE); e Segmentos Interpretados de cada intérprete nas posições Inicial (I), Medial (M) e Final (F).

O S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12

SE 171,6 160,8 108,6 162 175,2 135,6 141,6 141 164,4 142,2 138 153

I 149,4 148,8 139,8 103,2 132 133,8 121,2 133,8 115,2 136,8 151,2 129 156

M 151,8 127,2 143,4 102,6 120 127,8 146,4 132 123,6 155,4 151,2 147 132

F 109,8 124,8 121,1 103,2 120 135,6 133,8 126,6 112,8 111,6 135,6 141 122,4

Em relação à distribuição e número de grupos entoacionais e pausas, as

falas interpretadas apresentaram mais frequentemente um número de pausas

superior ao número de grupos entoacionais, indicando a utilização de pausas

silenciosas, respiratórias ou vocais (através da utilização de ums, ahns e

outros) não só entre grupos entoacionais, mas também intragrupos. Esses

achados são consoantes aos de Scheslinger (1994), com as intérpretes

introduzindo um número maior de pausas em posições consideradas não

“naturais”, quebrando assim as unidades de sentido dentro de um mesmo

grupo entoacional e produzindo sensação de hesitação.

70

Todas as intérpretes registraram aumento na frequência fundamental

média na fala interpretada em comparação à fala semi-espontânea. No geral, o

segmento inicial foi o que apresentou os maiores picos de frequência,

registrando variação entre 194,66 e 267,95 hz, comparados aos valores entre

175,68 e 237,84 hz da fala semi-espontânea. É interessante observar que o

segmento inicial foi também o segmento com registro de maior frequência na

fala original.

A Tabela 6 traz a compilação da duração total dos segmentos de fala

analisados, bem como os dados relativos ao número de palavras por segundo

e por minuto, ao número de grupos entoacionais, ao número de pausas total,

ao número de pausas por segundo, ao número de alongamentos vocálicos

percebidos e às medições de frequência fundamental (média, valor mínimo e

valor máximo) de todos os extratos analisados.

Tabela 6 – Resultados obtidos com o levantamento de ocorrências e medições de parâmetros acústicos. Da esquerda para a direita: tipos de segmentos de fala analisados, sua duração total, número de palavras por segundo e por minuto, número de grupos entoacionais, número de pausas total, número de pausas por segundo, número de alongamentos vocálicos percebidos e valores de frequência fundamental (média, valor mínimo e valor máximo).

S1 Tempo TXE TXE GE P P AV f0 f0min f0max

seg pal/s pal/m no. no. p/s no. hz hz Hz

Livre Escolha 85,01 2,86 171,6 29 30 2,83 3 195,28 80,13 372,2

Seg_inicial 35,39 2,48 148,8 13 15 2,35 10 211 119,8 373

Seg_medial 32,91 2,12 127,2 11 13 2,53 1 199,75 120,8 341,6

Seg_final 25,41 2,08 124,8 11 11 2,31 0 180,7 120,1 258,4

S2

Livre Escolha 88,67 2,68 160,8 24 23 3,85 5 211,79 142,9 467,3

Seg_inicial 2,73 2,33 139,8 13 13 2,8 4 249,37 141,2 463,8

Seg_medial 32,21 2,39 143,4 9 9 3,57 2 236,53 147,8 459,4

Seg_final 26,72 2,02 121,2 12 13 2,05 1 236,14 168,6 402,6

S3

Livre Escolha 106,87 1,81 108,6 29 28 3,81 1 207,02 173,7 444

Seg_inicial 24,66 1,72 103,2 9 10 2,46 1 230,5 142,2 407,8

71

Seg_medial 32,6 1,71 102,6 8 13 2,5 1 237,13 77,32 398,9

Seg_final 25,46 1,72 103,2 6 5 5,09 0 223,74 139,3 388,4

S4

Livre Escolha 88,97 2,7 162 24 23 3,86 1 197,96 122,3 394,8

Seg_inicial 38,99 2,2 132 15 17 2,29 4 250,13 138,3 495,4

Seg_medial 33,34 2 120 8 11 3,03 2 236,54 138,8 372,2

Seg_final 25,39 2 120 9 9 2,82 4 231,32 139,9 410,2

S5

Livre Escolha 85,85 2,92 175,2 35 34 2,52 4 191,17 110,2 475

Seg_inicial 36,22 2,23 133,8 12 14 2,58 4 214,11 138,2 458

Seg_medial 31,81 2,13 127,8 7 11 2,89 3 222,97 80,91 473,7

Seg_final 25,21 2,26 135,6 7 8 2,95 2 215,91 155,5 358,2

Adicional 34,63 2,16 129,6 9 10 3,46 2 204,87 74,59 393,3

S6

Livre Escolha 104,36 2,26 135,6 37 36 2,89 5 210 155,8 371,5

Seg_inicial 29,14 2,02 121,2 13 13 2,24 2 238,49 155,3 469,6

Seg_medial 31,5 2,44 146,4 11 14 2,62 0 243,32 173,6 412,7

Seg_final 26 2,23 133,8 9 8 3,25 0 243,31 165,7 417,9

S7

Livre Escolha 93,56 2,36 141,6 26 25 3,74 5 179,34 64,71 288,7

Seg_inicial 39,42 2,23 133,8 12 13 3,03 6 258,6 151,9 481,2

Seg_medial 34,86 2,2 132 8 9 3,87 2 267,95 75,75 465,3

Seg_final 23,62 2,11 126,6 8 7 3,37 1 234,72 142,7 466,9

Adicional 36,68 1,88 112,8 7 9 4,58 2 253,92 144,3 486,3

S8

Livre Escolha 83,52 2,35 141 24 23 3,63 0 175,68 83,32 324,4

Seg_inicial 37,83 1,92 115,2 11 10 3,78 5 194,66 100,8 343,4

Seg_medial 32,41 2,06 123,6 9 11 2,94 1 203,87 143,3 315,7

Seg_final 24,43 1,88 112,8 8 8 3,05 1 206,35 85,3 303,8

S9

Livre Escolha 84,9 2,74 164,4 28 27 3,14 5 183,8 84,06 356,4

Seg_inicial 35,45 2,28 136,8 10 12 2,95 2 222,47 95,32 441,5

Seg_medial 31,58 2,59 155,4 8 12 2,63 1 194,27 87,05 463,1

72

Seg_final 25,18 1,86 111,6 10 11 2,28 0 185,39 129,5 332,5

S10

Livre Escolha 87,76 2,37 142,2 23 22 3,98 0 178,52 129,8 354,4

Seg_inicial 36,15 2,52 151,2 11 13 2,78 3 221,15 143,5 459,5

Seg_medial 31,74 2,52 151,2 8 9 3,52 0 208,43 76,34 374,4

Seg_final 25,19 2,26 135,6 7 8 3,14 3 193,83 140,4 306,2

S11

Livre Escolha 88,65 2,3 138 25 24 3,56 33 166,24 91,14 273,9

Seg_inicial 37,51 2,15 129 11 13 2,88 4 200,02 126,3 332

Seg_medial 34,32 2,45 147 13 14 2,45 2 196,58 115,9 410,4

Seg_final 24,61 2,35 141 12 10 2,46 1 178,59 119,3 305,6

S12

Livre Escolha 94,35 2,55 153 30 29 3,25 8 237,84 140,1 458

Seg_inicial 38,73 2,6 156 11 16 2,42 1 240,87 111,5 481,5

Seg_medial 33,59 2,2 132 6 10 3,35 0 240,4 100 371,4

Seg_final 24,96 2,04 122,4 9 11 2,26 1 231,34 95,5 348,1

Adicional 33,04 2,17 130,2 8 11 3 1 252,65 98,63 447,1

Original

Seg_inicial 34,49 2,49 149,4 11 10 3,49 0 239,89 121 401,7

Seg_medial 32,79 2,53 151,8 10 10 3,27 0 205,97 123,8 386,3

Seg_final 24,55 1,83 109,8 12 12 2,04 0 218,52 132,3 398,4

Adicional 32,87 2,31 138,6 14 16 2,05 1 212,91 68,74 427,3

5. 4 Avaliação Perceptiva da Qualidade da Produção Oral dos

Intérpretes

Noventa juízes entre 18 e 60 anos participaram da pesquisa, com um

total de 21 juízes da área de tradução (23,3%) e 69 da área de interpretação

(76,5%). Vinte e cinco juízes (27,78%) haviam concluído seu curso nos últimos

dois anos, com o restante 65 juízes (72,2%) ainda matriculados nos seus

respectivos cursos de tradução ou interpretação da Pontifícia Universidade

Católica (Curso de Graduação em Tradução e Curso Sequencial de

Interpretação). Os juízes foram divididos em grupos de trinta para a avaliação

73

das três versões. O perfil dos juízes de cada versão pode ser observado na

Tabela abaixo:

Tabela 7 – Perfil dos juízes em cada versão da avaliação perceptiva, V1, V2 e V3, mostrando números percentuais e absolutos de participantes em cursos de Tradução ou de Interpretação e se foram concluídos ou estão em andamento.

V1

V2

V3

Curso Percentual No. Percentual No. Percentual No.

Tradução 10.0% 3 33.3% 10 26.7% 8

Interpretação 90.0% 27 66.7% 20 73.3% 22

Concluído 50.0% 15 10.0% 3 23.3% 7

Não concluído 50.0% 15 90.0% 27 76.7% 23

Como mostrado no Anexo 3, cada versão de avaliação contava com 4

segmentos iniciais, 4 segmentos mediais, 4 segmentos finais e 4 segmentos

adicionais, de forma que cada juiz tivesse a oportunidade de ouvir cada

intérprete pelo menos uma vez. Os três segmentos adicionais foram repetidos

em todas as versões para verificação da uniformidade no julgamento das falas

dos intérpretes.

Cada extrato foi avaliado através de uma Escala de Likert de 5 pontos. A

tarefa dos juízes era a de escolher para cada extrato ouvido se o áudio não

atendia em nada o quesito avaliado, se atendia pouco o quesito avaliado, se

não atendia nem muito nem pouco o quesito avaliado, se atendia muito o

quesito avaliado ou se atendia extremamente o quesito avaliado. Os resultados

foram então ponderados para atribuição de nota, com “Nada” recebendo peso

1, “Pouco” recebendo peso 2, “Nem Muito nem Pouco” recebendo peso 3,

“Muito” recebendo peso 4 e “Extremamente” recebendo peso 5. As notas

atribuídas a cada extrato foram então multiplicadas por seu peso ponderado,

somadas e divididas pelo número de juízes, para chegarmos a uma média final

por extrato. Os dados individualizados médios ponderados de cada extrato da

avaliação perceptiva da fala interpretada podem ser encontrados no Anexo 7.

A seguir, os resultados médios ponderados das avaliações dos

segmentos adicionais.

74

Tabela 8 – Resultados médios ponderados da avaliação dos segmentos adicionais em cada Versão (V1, V2 e V3).

S5 V1 V2 V3

Agradabilidade 3,53 3,76 3,8

Confiabilidade 3,53 3,56 3,53

Naturalidade 3,76 3,46 3,56

Fluidez 3,8 3,43 3,5

Segurança 3,53 3,53 3,46

Profissionalismo 3,73 3,63 3,63

Compreensibilidade 3,46 3,43 3,53

Média 3,62 3,54 3,57

S7 V1 V2 V3




Fluidez 2,16 2,13 2,26

Segurança 2,56 2,46 2,96


Compreensibilidade 2,56 2,63 2,8

Média 2,33 2,11 2,32

S12 V1 V2 V3




Fluidez 3,33 3,1 2,9

Segurança 3,23 3,36 3,1


Compreensibilidade 3,46 3 2,86

Média 3,31 3,16 2,97

Apesar de diferenças em números absolutos, os três grupos chegaram a

um mesmo resultado em termos de classificação dos extratos, com o S5

75

recebendo as maiores pontuações, S12 em segundo lugar e S7 em terceiro

lugar.

A Tabela 9 abaixo traz os resultados médios ponderados obtidos nas

avaliações das Versões 1, 2 e 3 em relação a cada Sujeito, nos segmentos

inicial (I), medial (M) e final (F).

Tabela 9 – Resultados médios ponderados finais da avaliação de cada intérprete nos extratos interpretados, por segmento Inicial (I), Medial (M) e Final (F).

Agrad Conf Nat Flu Seg Prof Comp

S1

I 3,33 3,5 3,4 3,4 3,5 3,2 3,5

M 3,93 3,96 3,96 3,86 4,03 3,9 3,86

F 2,7 3,36 2,96 3,3 3,26 3,33 3,26

S2

I 3,33 3,7 3,2 3,56 3,83 3,8 3,7

M 4,36 4,36 4,36 4,33 4,36 4,36 4,16

F 4,2 4,16 4,16 4,23 4,16 4,2 4,26

S3

I 2,86 2,6 2,5 2,36 2,53 2,76 2,53

M 2,36 2,4 2,23 2,3 2,33 2,63 2,23

F 2,8 2,53 2,56 2,3 2,4 2,46 2,4

S4

I 3,73 3,83 3,83 3,96 4 3,9 4,06

M 4,2 3,86 3,76 3,66 3,76 3,76 3,8

F 3,5 3,73 3,53 3,7 3,46 3,56 3,86

S5

I 3,46 3,46 3,13 3,13 3,33 3,56 3,63

M 4,3 4,2 3,93 3,86 3,96 4 3,73

F 4,4 4,46 4,36 4,5 4,6 4,46 4,56

S6

I 3,13 3,3 3,23 3,06 3,2 3,2 3,6

M 3,66 3,6 3,56 3,6 3,5 3,6 3,6

76

F 3,86 3,76 3,83 3,8 3,63 3,7 3,83

S7

I 2,53 3,16 2,6 3,03 3,13 3 3,5

M 2,46 3,16 2,73 2,86 3,3 3,03 3,26

F 1,73 3,13 2,13 3,16 3,63 3 3,2

S8

I 2,2 2,96 2,73 2,73 2,96 3,03 3,66

M 1,9 3,03 2,63 2,83 3,23 3,06 2,73

F 2,4 2,8 2,76 2,5 2,83 2,83 2,86

S9

I 2,1 2,36 2,46 2,2 2,23 2,46 2,86

M 3,03 3,1 2,96 2,8 2,8 3,13 3,16

F 3,23 2,76 2,56 2,4 2,86 2,7 2,73

S10

I 2,23 3,26 3,13 3,56 3,66 3,5 3,63

M 2,03 2,93 2,26 2,63 3,13 2,9 2,63

F 2,46 3,13 2,96 3,36 3,6 3,3 3,23

S11

I 2,76 3,2 2,76 2,96 3,13 3,16 3,5

M 3,56 4,16 3,86 4,1 4,3 4,16 4,26

F 2,23 3,03 3,1 3,1 3,8 3,26 3,66

S12

I 3,13 2,86 2,8 2,7 2,63 2,8 3,03

M 2,93 3,06 3,06 2,93 3 3,13 3,13

F 3,5 3,76 3,6 3,8 3,73 3,6 3,86

A média final de cada intérprete na avaliação da fala interpretada pode

ser encontrada na Tabela 10. Os quesitos em que as intérpretes apresentaram

as menores notas foram Agradabilidade, Naturalidade, Fluidez e Segurança

(nesta ordem).

Na média, nenhuma intérprete teve avaliação abaixo de 2 nem atingiu a

marca de 5. As médias finais das intérpretes estão na última coluna à direita.

77

Tabela 10 - Média ponderada final de cada quesito por sujeito (compilação dos segmentos inicial, medial e final).

Média Agrad Conf Nat Flu Seg Prof Compr MF

S1 3,32 3,6 3,44 3,52 3,59 3,47 3,54 3,49

S2 3,96 4,07 3,9 4,04 4,11 4,12 4,04 4,03

S3 2,67 2,51 2,43 2,32 2,42 2,61 2,38 2,47

S4 3,81 3,8 3,7 3,77 3,74 3,74 3,9 3,78

S5 4,05 4,04 3,8 3,83 3,96 4 3,97 3,94

S6 3,55 3,55 3,54 3,48 3,44 3,5 3,67 3,52

S7 2,24 3,15 2,48 3,01 3,35 3,01 3,32 2,93

S8 2,1 2,93 2,7 2,68 3 2,97 3,08 2,79

S9 2,78 2,74 2,66 2,46 2,63 2,76 2,91 2,7

S10 2,24 3,1 2,78 3,18 3,46 3,23 3,16 3,02

S11 2,85 3,46 3,24 3,38 3,74 3,52 3,8 3,42

S12 3,18 3,22 3,15 3,14 3,12 3,17 3,34 3,19

5.5 Avaliação da qualidade da interpretação em relação ao discurso

interpretado em termos de conteúdo semântico-discursivo

Foram calculadas as médias a partir das notas atríbuídas aos quesitos

avaliados em relação à performance de cada intérprete em cada extrato de fala

e atribuída a cada intérprete uma pontuação final. Os resultados das

avaliações de conteúdo de cada avaliador foram então comparados para

verificação de uniformidade na ordem de classificação dos sujeitos. Quando as

médias finais eram as mesmas, o primeiro critério de desempate utilizado foi

contabilizar as maiores notas no nível dos segmentos, primeiramente

considerando a incidência total da nota mais alta, depois a incidência total da

segunda nota mais alta e assim por diante. Só foi considerado empate

pontuações com exatamente a mesma composição de notas, o que aconteceu

duas vezes. Neste caso, a posição imediatamente abaixo ficou vaga. As

avaliações completas de cada avaliador por sujeito e por segmento podem ser

78

visualizadas no Anexo 8. A tabela abaixo mostra a classificação dos Sujeitos

de acordo com cada Avaliador.

Tabela 11 – Classificação final de cada sujeito por avaliador (compilação dos segmentos inicial, medial e final).

Avaliador 1 Avaliador 2 Avaliador 3

1º lugar S2 S5 S2 S5

2º lugar S1 S1

3º lugar S10 S10 S2

4º lugar S4 S1 S7

5º lugar S7 S7 S11

6º lugar S5 S12 S9 S10

7º lugar S12 S8


9º lugar S9 S6 S8

10º lugar S8 S4 S6


12º lugar S3 S3 S3

Cinco sujeitos, S1, S2, S5, S7 e S10 apareceram nas primeiras seis

posições nas avaliações dos três juízes. Três sujeitos, S3, S6 e S8 apareceram

nas seis últimas posições. Os sujeitos S4, S9, S11 e S12 aparecem uma vez

entre os seis primeiros e duas vezes entre os seis últimos colocados.

A Tabela abaixo traz a média e classificação final de cada Sujeito.

Tabela 12 – Nota final atribuída a cada sujeito por avaliador, média dos três avaliadores e classificação dos sujeitos.

Avaliador

1

Avaliador

2

Avaliador

3

MÉDIA Classif.

S1 4 4,83 4,67 4,5 3º

S2 4,33 4,93 4,67 4,64 1º

S3 1,00 1,83 2,33 1,72 12º

S4 3,67 4,53 4,33 4,17 6º

79

S5 3,67 4,93 5,00 4,53 2º

S6 2,00 4,53 3,67 3,4 11º

S7 3,67 4,77 4,67 4,37 4º

S8 2,33 4,60 4,00 3,64 10º

S9 2,67 4,43 4,33 3,81 9º

S10 3,67 4,87 4,33 4,29 5º

S11 3,00 4,60 4,67 4,09 7º

S12 3,33 4,77 3,67 3,92 8º

5.6 Comparação das análises perceptiva e de conteúdo semântico-

discursivo

De um modo geral, as médias finais de avaliação do conteúdo da fala

interpretada mostraram um espectro de pontuação mais amplo que o da

análise perceptiva, com a média mais baixa sendo 1,72 e a mais alta 4,64 para

a primeira contra 2,47 e 4,03 para a segunda. Abaixo podemos ver uma

comparação das avaliações. As diferentes cores sinalizam a classificação das

intérpretes. Em azul, resultados iguais ou com apenas uma posição de

diferença. Em verde, duas posições de diferença. Em vermelho, três posições

de diferença e em destaque os dois sujeitos que apresentaram diferença de

cinco posições.

Tabela 13 - Comparação das médias finais ponderadas das avaliações das transcrições e dos arquivos sonoros.

Intérprete Média

Transcrições

Classificação Média

Arquivos

Sonoros

Classificação

Sujeito 1 4,5 3º 3,49 5º

Sujeito 2 4,6433 1º 4,03 1º

Sujeito 3 1,72 12º 2,47 12º

Sujeito 4 4,1767 6º 3,78 3º

Sujeito 5 4,5333 2º 3,94 2º

Sujeito 6 3,4 11º 3,52 4º

80

Sujeito 7 4,37 4º 2,93 9º

Sujeito 8 3,6433 10º 2,79 10º

Sujeito 9 3,81 9º 2,7 11º

Sujeito 10 4,29 5º 3,02 8º

Sujeito 11 4,09 7º 3,42 6º

Sujeito 12 3,9233 8º 3,19 7º

Seis sujeitos da pesquisa tiveram exatamente a mesma classificação

nas duas avaliações; Sujeito 2 – 1ª posição; Sujeito 5 – 2ª posição; Sujeito 11 –

7ª posição; Sujeito 12 – 8ª posição; Sujeito 8 – 10ª posição e Sujeito 3 – 12ª

posição.

Os Sujeitos 2 e 5 receberam as melhores pontuações em ambas as

avaliações. Se observarmos a análise acústica da produção da interpretação,

veremos que as duas intérpretes apresentaram pouca variabilidade entre a

produção semi-espontânea e a produção interpretada em relação à intensidade

(análise perceptiva, vide Anexo 6), número e distribuição de pausas e grupos

entoacionais e alongamentos vocálicos. As variações de taxa de elocução e de

frequência média foram inferiores a 20%, a primeira a menor na fala

interpretada, e a segunda a maior na fala interpretada. Os quesitos com maior

pontuação na análise perceptiva foram o de Profissionalismo (Sujeito 2) e

Agradabilidade da voz (Sujeito 5). Os quesitos mais adversos foram

Naturalidade (Sujeito 2) e Fluidez (Sujeito 5).

Os Sujeitos 11, 12, 8 e 3 aparecem entre os seis piores classificados em

ambas as avaliações. Os Sujeitos 8 e 3 apresentam a menor taxa de elocução

do grupo, com produção média de taxa de elocução na fala interpretada de

117,2 palavras por minuto e 103 palavras por minuto, respectivamente,

comparados a média de 137,4 do discurso original e 133,88 do restante das

intérpretes, uma diferença de aproximadamente 20%. O Sujeito 3 tem Fluidez

com a pior pontuação e Agradabilidade da voz como o quesito melhor avaliado,

enquanto para o Sujeito 8 este é o parâmetro com pior avaliação.

Compreensibilidade é a melhor pontuação do Sujeito 8.

81

O Sujeito 12 apresenta a maior incidência de pausas interrompendo

unidades de sentido (grupos entoacionais) e a maior frequência fundamental

média. O Sujeito 11 apresenta a menor frequência fundamental média. Os

quesitos com pior avaliação foram Segurança (Sujeito 12) e Agradabilidade de

voz (Sujeito 11). O mais bem avaliado foi Compreensibilidade para ambos.

Os Sujeitos 1 e 9 apresentaram diferenças de duas posições entre a

avaliação semântica-discursiva e a avaliação perceptiva da fala, a menor para

a segunda, com o Sujeito 1 passando da 3ª para a 5ª posição e o Sujeito 9 da

9ª para a 11ª posição.

O Sujeito 4 e o Sujeito 10 registraram uma diferença de 3 posições

cada, com o Sujeito 4 passando da 6ª para a 3ª posição e o Sujeito 10 da 5ª

para a 8ª posição. As melhores avaliações ficaram em Compreensibilidade

(Sujeito 4) e Segurança (Sujeito 10) e as piores Naturalidade (Sujeito 4) e

Agradabilidade de voz (Sujeito 10).

Agradabilidade de voz foi o quesito com menor pontuação para 5 das 12

intérpretes e com a maior pontuação para duas delas, talvez sugerindo que a

qualidade vocal da intérprete pode ter um papel importante na percepção da

qualidade de seu trabalho. No entanto, a agradabilidade da voz não apresentou

impacto na avaliação de compreensibilidade da interpretação, uma vez que

esses dois descritores tiveram, no geral, avaliação diretamente oposta, com

agradabilidade de voz tendo a pior avaliação no cômputo de todas as

intérpretes (média geral de 3,06) e compreensibilidadeimpa maior (média geral

de 3,42).

Efetivamente, a maior diferença encontrada entre as avaliações ficou

com os Sujeitos 6 e 7. O Sujeito 6 passou da 11ª posição em conteúdo para 4ª

posição na análise perceptiva da fala. Em movimento contrário, o Sujeito 7

passou da 4ª posição em conteúdo para 9ª posição na análise perceptiva.

Enquanto o Sujeito 6 registra na análise acústica padrão semelhante aos

sujeitos melhor avaliados na análise perceptiva (pouca variabilidade entre a

produção semi-espontânea e a produção interpretada em relação à

intensidade, número e distribuição de pausas e grupos entoacionais e

alongamentos vocálicos e taxa de elocução e de frequência média com

82

diferença inferior a 20%, o Sujeito 7 apresenta a maior variabilidade entre falas,

com grande aumento de intensidade e aumento de frequência fundamental

superior a 30%. O pior quesito para o Sujeito 7 foi agradabilidade de voz, como

o quesito melhor avaliado sendo Segurança. A percepção de segurança está

relacionada na literatura sobre expressividade com f0 abaixado. O Sujeito 7

está no grupo dos sujeitos que têm o f0 mais baixo.

Apesar de posições diferentes, esta combinação de Agradabilidade de

Voz com a pontuação mais baixa e Segurança como quesito melhor avaliado

se repete para três das doze intérpretes. O segundo quesito com pior avaliação

entre as intérpretes é Naturalidade, com 3 intérpretes registrando menor

pontuação neste parâmetro.

Dada a destacada importância da compreensibilidade na tarefa de

interpretação, consideraremos, a seguir, as porcentagens obtidas na avaliação

desse descritor em grau alto (muito e extremamente) nos extratos de fala

analisados e discutiremos o impacto dos fatores prosódicos em relação aos

resultados obtidos. A compreensibilidade baixa remete ao nada ou pouco

compreensível e a compreensibilidade média a nem muito nem pouco no teste

de diferencial semânico aplicado.

A Tabela 14 apresenta os resultados da avaliação da fala de cada

intérprete em relação aos três trechos (inicial, medial e final) de fala

interpretada.

Tabela 14 - Compreensibilidade atribuida a cada sujeito por extrato (Inicial, Medial e Final), totalizando as porcentagens de compreensibilidade alta (muito e extremamente), media (nem muito nem pouco) e baixa (pouco e nada).

Sujeito Compreensibilidade Inicial Medial Final

S1 Baixa 13,30% 13,30% 20,00%

Média 40,00% 16,70% 33,30%

Alta 46,70% 70,00% 46,60%

S2 Baixa 13,30% 6,60% 0,00%

Média 26,70% 6,70% 10,00%

Alta 60,00% 86,70% 90,00%

S3 Baixa 56,60% 63,30% 43,40%

Média 20,00% 26,70% 46,70%

Alta 23,30% 10,00% 10,00%

83

S4 Baixa 0,00% 16,70% 6,70%

Média 23,30% 13,30% 16,70%

Alta 76,70% 70,00% 76,70%

S5 Baixa 10,00% 3,30% 0,00%

Média 30,00% 20,00% 6,70%

Alta 60,00% 76,60% 93,30%

S6 Baixa 6,60% 16,60% 3,30%

Média 33,30% 10,00% 33,30%

Alta 60,00% 73,40% 63,30%

S7 Baixa 16,70% 23,30% 26,60%

Média 33,30% 33,30% 30,00%

Alta 50,00% 43,40% 43,40%

S8 Baixa 23,30% 36,70% 33,30%

Média 36,70% 46,70% 40,00%

Alta 40,00% 16,70% 26,70%

S9 Baixa 33,30% 23,30% 40,00%

Média 46,70% 40,00% 40,00%

Alta 20,00% 36,70% 20,00%

S10 Baixa 10,00% 43,40% 16,60%

Média 30,00% 36,70% 50,00%

Alta 60,00% 20,00% 33,30%

S11 Baixa 6,70% 3,30% 3,30%

Média 50,00% 6,70% 36,70%

Alta 43,30% 90,00% 60,00%

S12 Baixa 30,00% 20,00% 13,30%

Média 36,70% 50,00% 16,70%

Alta 33,30% 30,00% 70,00%

Como podemos observar, somente os sujeitos 2, 4, 5 e 6 alcançaram

porcentagens acima de 60% na avaliação dos três trechos de fala interpretada.

O sujeito 11 obteve porcentagem inferior a 50% em um dos extratos

(inicial). Se compararmos a produção desse extrato com os extratos medial e

final, que pontuaram maior compreensibilidade, podemos ver que o extrato

inicial é o que apresenta a maior quantidade de pausas não naturais (de um

total de 13 pausas, 3 pausas (20%) foram encontradas, interferindo na

formação dos grupos entoacionais) e também o maior número de

alongamentos vocálicos, como podemos ver na tabela abaixo:

84

Tabela 15 – Resultados do Sujeito 11 por extrato (Inicial, Medial e Final), mostrando o número de Grupos Entoacionais (GE), Número de Pausas (P) e Número de Alongamentos Vocálicos (AV).

S11 GE P AV

Seg_inicial 11 13 4

Seg_medial 13 14 2

Seg_final 12 10 1

Os sujeitos 1, 7, 10 e 12 foram avaliados com porcentagens abaixo de

50% em dois dos extratos e os sujeitos 3, 8 e 9, nos 3 extratos. Vale lembrar

que os sujeitos 1 e 7 tiveram média na avaliação das transcrições superior a 4

(Sujeito 1 = 4,5 e Sujeito 7 = 4,37), ou seja, o conteúdo estava presente em

suas falas, mas a maneira de expressá-lo trouxe dificuldades de compreensão.

Esses resultados indicam que a compreensibilidade da fala do intérprete é

afetada pelas características prosódicas.

5.7 Análise Estatística

Os dados quantitativos foram normalizados usando o z-score. Como

podemos verificar no dendograma da Figura 7 abaixo, formaram-se dois

clusters principais, um englobando os sujeitos 1, 11, 5, 4, 2 e o outro os demais

sujeitos. Dentro desses clusters apresentam-se mais próximos os sujeitos: 1 e

11; 12 e 6; 10, 8 e 9; 5, 4 e 2. O Sujeito 3 é o mais afastado do grupo. Esse foi

o sujeito que obteve as piores avaliações em termos de avaliação da

transcrição e de expressividade oral. Um outro sujeito mais afastado dos

demais no grupo é o Sujeito 7, que embora muito bem avaliado na avaliação

de transcrição, foi mal avaliado quanto à expressão oral.

85

Figura 7: Dendograma com a distribuição dos sujeitos em clusters.

Ainda sobre a distribuição dos sujeitos, considerando-se as Dimensões

1 e 2 (Dim1 e Dim 2), que apresentam melhor projeção no espaço vetorial,

verificamos que, se compararmos com a ordem de classificação obtida a partir

da avaliação pelos juízes dos arquivos sonoros, a distribuição dos sujeitos é

fortemente influenciada pelos fatores prosódicos. Os agrupamentos nos

quadrantes das Dimensões 1 e 2 do gráfico da Figura 8 demonstram o impacto

dos fatores relativos à expressão oral na ordenação dos posicionamentos em

termos das distâncias entre os sujeitos. Se compararmos a sequência de

ordenação dos posicionamentos em relação à correção que apresentamos no

Tabela 13 temos, em relação à avaliação da transcrição 2, 5, 1, 7, 10, 4, 11,

86

12, 10, 7, 8, 6 e 3 e, em relação à expressão oral; 2, 5, 4, 6, 1, 11, 12, 10, 7, 8,

9 e 3. Verificamos que os agrupamentos seguem a sequência relativa à

ordenação segundo à expressão oral. Na Figura 8 a seguir, podemos observar

em no quadrante superior direito, os sujeitos 2, 5 e 4, no inferior direito, sujeitos

6,1 e 11, no inferior esquerdo o 8 e o 9 e no superior direito mo ais próximos a

linha média horizontal, o os sujeitos 12 e 10 e mais afastados o 7 e o 3.

Figura 8 - Distribuição dos sujeitos de acordo com as Dimensões 1 e 2 (Dim 1 e Dim 2) do espaço vetorial.

Pela aplicação da MFA, verificamos, também, que os estilos se

separaram. Na Figura 9, verificamos nos quadrantes do lado esquerdo a

distribuição no estílo de Fala Interpretada (I) e nos do lado direito a de fala

semiespontânea (SE). Isso siginifica que todos os sujeitos se diferenciaram

quanto ao estilo.

87

Figura 9 – Distribuição dos sujeitos de acordo com o estilo de fala interpretada (I) e de fala semiespontânea (E).

Foram as variáveis da DIM 1, a Z.VarF0 (z-score da variação de f0) e a

AZ.F0MED (z-score da média de F0) que tiveram uma grande influência nesse

arranjo dos estímulos e provocaram a separação entre os estímulos I e SE. Os

sujeitos 7, 11 e 1 são os que tiveram maior variação entre a fala interpretada e

a semiespontânea; os demais apresentaram menor variação, estando os

Sujeitos 2 e 4 entre os menores.

Pelos valores de Lg, que podem ser visualizados na Tabela 16, o grupo

de variáveis com maior força é o Gc1, ou seja, o dos correlatos acústicos da

prosódia. Pelos valores do RV, que pode ser visualizado na Tabela 17, o grupo

88

que melhor se aproxima dos demais é o Gc2, ou seja o do diferencial

semântico. O Gc1 apresenta mais representatividade em maior número de

dimensões (Dim 2, 3, 4 e 5), como podemos observar na Tabela 18.

Tabela 16- Valores de LG em relação a cada grupo de variáveis: Gc1 (acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição).

Gc1 Gc2 Gc3 MFA

Gc1 1,3646 0,3227 0,2805 0,9174

Gc2 0,3227 1,0047 0,6046 0,9008

Gc3 0,2805 0,6046 1 0,8789

MFA 0,9174 0,9008 0,8789 1,2575

Tabela 17 - Valores de RV em relação a cada grupo de variáveis: Gc1 (acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição.

Gc1 Gc2 Gc3 MFA

Gc1 1 0,2756 0,2401 0,7004

Gc2 0,2756 1 0,6032 0,8014

Gc3 0,2401 0,6032 1 0,7838

MFA 0,7004 0,8014 0,7838 1

Tabela 18 - Representatividade dos grupos nas 5 Dimensões (Dim 1,2,3,4 e 5) Gc1 (acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição).

Dim,1 Dim,2 Dim,3 Dim,4

Gc1 20,518 92,4724 68,3569 71,6509

Gc2 40,4239 1,1177 17,0447 24,5882

R 39,0581 6,4099 14,5984 3,7609

A relevância dos grupos pode ser visualizada na Figura 10 a seguir.

89

Figura 10 – Relevância dos grupos de vriaáveis de maior para menor: Gc1 (acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição).

Se considerarmos apenas as variáveis do Gc1 (acústico) verificamos

que entre os correlatos acústicos, a variabilidade de F0 foi a variante mais

relevante e a menos importante a de Pausas por Segundo. As demais variáveis

apresentaram semelhança em termos de relevância. Na Figura 11, observamos

a distribuição das variáveis nas Dimensões 1 e 2 (Dim 1 e Dim 2) e a

relevãncia delas demonstrada pela extensão das flechas.

90

Figura 11 - Distribuição das variáveis nas Dimensões 1 e 2 (Dim1 e Dim2).

Se considerarmos todas as variáveis dos três grupos (Gc1, Gc2 e Gc3)

em conjunto, verificamos que o número de pausas e de pausas por segundo

aparecem diametralmente opostos. Também verificamos haver maior dispersão

entre as variáveis do Gc1 e o agrupamento entre as variáveis do Gc2 e do Gc3,

o que indica que Gc2 e Gc3 são redundantes para expressar os fenômenos em

estudo, já as variáveis Gc1, por conta do espalhamento, são melhores para

representar todo o espaço vetorial, ou seja, para representar e expressar os

fenômenos em estudo. Na Figura 12, a seguir, podemos verificar esses fatos.

91

Figura 12 – Distribuição de todas as variáveis dos três grupos: Gc1 (acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição) nas Dimensões 1 e 2 (Dim,1 e Dim,2).

As variáveis que influenciam no arranjo da distribuição dos pontos no

eixo horizontal (DIM 1) são as variáveis relacionadas na Tabela 19 a seguir.

92

Tabela 19 - Variáveis da Dimensão 1 (Dim, 1).

Verifica-se na Dim1 que há forte correlação entre Z.S (Segurança) e

Z.Compr (Compreensibilidade) e um pouco menos com Z.C e Z.P e Z.F e

Z.Ptrad.

As variáveis que influenciam no arranjo da distribuição dos pontos no

eixo vertical (DIM 2) são as variáveis quantitativas relacionadas na Tabela 20 a

seguir.

Tabela 20 - Variáveis da Dimensão 2 (Dim, 2).

Verifica-se na Dim, 2 que há uma forte correlação entre Z.f0MED e

Z.VarF0 com Z.PS e uma correlação negativa (ou inversa) com Z.GE e Z.NP, o

que pode ser interpretado como co-ocorrência de extensa variabilidade do F0 e

de número de Pausas por Segundo e como evidência de quanto mais longos

os grupos entoacionais, menor incidência de pausas ou vice-versa.

Neste capítulo analisamos os resultados das diferentes avaliações e

análises a que as falas semi-espontânea e interpretada dos Sujeitos da

pesquisa foram submetidas e apontamos as similaridades e diferenças que

93

foram encontradas. O próximo capítulo conclui esta dissertação e aponta

caminho para futuras investigações na área.

94

Capítulo 6 - Conclusão

O objetivo deste estudo foi verificar as características prosódicas da fala

da fala interpretada de um grupo de intérpretes, tendo como contraponto a sua

fala semi-espontânea e analisar como tais características poderiam influenciar

a avaliação de qualidade e compreensão da mensagem produzida pelo

intérprete.

Como já mencionamos na introdução desta dissertação, os critérios de

avaliação de qualidade na interpretação estão sempre sujeitos a uma avaliação

subjetiva, que irá variar de acordo com quem está avaliando o trabalho e seu

papel no processo de interpretação, seja ele o de ouvinte, cliente ou colega

intérprete, monolíngue ou com conhecimento dos dois idiomas de trabalho,

com ou sem experiência no processo de interpretação.

No nosso caso, mesmo os juízes que avaliaram estritamente os

conteúdos das transcrições, se pautando teoricamente em critérios ditos mais

“objetivos” (tais como presença e número de erros e omissões, correção e

outros), não puderam deixar de lado uma abordagem mais subjetiva.

Como destaca Daniel Gile (1999) em relação ao critério de omissões e

erros utilizado para avaliação: “Este método não é isento de falhas, tanto por

causa de uma grande variabilidade entre os examinadores do que pode ou não

ser considerado erro ou omissão e também porque o que pode ser identificado

como erro ou omissão em uma transcrição pode ser considerado uma

produção aceitável em uma apresentação oral do discurso14”.

Nossos juízes avaliadores do conteúdo semântico ainda apontaram mais

um elemento dificultador na tarefa de avaliação – a falta de um critério que

14 “This method is not without pitfalls, both because of high inter-rater variability in the

perception of what is and what is not an error or omission and because what may be

identified as an error or omission in a transcript may be an acceptable rendition in an

oral presentation of the speech”

95

pudesse incorporar o estilo da fala de cada intérprete. Ao somente julgar as

falas transcritas por sua quantidade de erros, omissões e transmissão completa

do sentido, eles se sentiram incapazes de atribuir um peso às diferentes

escolhas semânticas feitas pelos intérpretes quando estas não interferiam

diretamente nos quesitos determinados, muito embora percebessem diferenças

em escolhas mais ricas ou mais pobres de vocabulário e na construção

semântica entre as falas interpretadas.

De uma maneira geral, no entanto, o trabalho nos trouxe elementos

importantes no caminho da pesquisa do trabalho de interpretação simultânea.

Pudemos ver pelos resultados que a fala interpretada para o português

brasileiro mostra padrão muito similar às falas interpretadas para o inglês e o

hebreu estudadas por SCHLESINGER (1994). Também no PB, foram

encontradas pausas no meio de estruturas gramaticais, uso característico das

proeminências, com sílabas “inesperadas” carregando o pitch accent, ou valor

de pitch máximo, marcação do pitch final de fronteira, com tendência de os

intérpretes concluírem suas frases com um pitch elevado, não concludente, e

produção sem ritmo regular, com alterações fora do padrão tanto em duração

quanto em taxa de elocução.

Isso demonstra que a fala interpretada é uma fala característica por si

só, diferente de outras modalidades de fala, seja ela espontânea,

semiespontânea, fala em leitura ou fala em shadowing. Nesta dissertação, os

dados estatísticos comprovaram que os dois estilos analisados, o semi-

espontâneo e o interpretado, são estilos diferenciados. Por esta razão, além de

compararmos a avaliação da fala interpretada com outras modalidades de fala,

como tem sido feito nos estudos mais recentes de qualidade na interpretação

(HOLUB, 2010; RENNERT, 2010; LENGLET, 2015), é também fundamental

entendermos como a prosódia afeta a avaliação de qualidade da interpretação.

É isso que tentamos desenvolver neste trabalho e os resultados

demonstram, em termos de classificação geral das intérpretes, haver certa

compatibilidade entre a avaliação da transcrição da produção dos sujeitos e a

avaliação das características da fala. As intérpretes que tiveram a melhor e pior

96

avaliação nas duas instâncias (Sujeitos 2 e 3, respectivamente) foram

exatamente as mesmas. Além disso, 6 das doze intérpretes mantiveram

resultados iguais ou com apenas uma posição de diferença nas duas

avaliações.

No entanto, equivalência em termos de sentido não é garantia de uma

melhor ou pior avaliação da qualidade da interpretação. Além de 10 das 12

intérpretes registrarem notas consistentemente mais baixas em produção oral,

vimos que a própria ordem de classificação geral das intérpretes também foi

alterada. Duas intérpretes caíram duas posições (Sujeitos 1 e 9), com médias

passando de 4,5 e 3,81 para 3,48 e 2,7, respectivamente. Na escala de 5

pontos, isto significa que ambas as intérpretes perderam mais de um ponto na

nota (20%), passando de uma avaliação entre muito boa e ótima (Sujeito 1)

para entre regular e muito boa e de uma avaliação entre regular e muito boa

(Sujeito 9) para uma entre pouco boa e regular.

Diferença ainda maior em número de posições foi encontrada nos

Sujeitos 4 e 10. O Sujeito 4 apresenta ganho de três posições, aproximando-se

mais das intérpretes mais bem avaliadas, S2 e S5, como evidenciado no

dendograma da Figura 7. Na avaliação da transcrição, a diferença do Sujeito 4

para o Sujeito 2 é de 0,5 ponto e para o Sujeito 5 é de 0,36 ponto; na avaliação

de fala, a diferença S4-S2 cai para 0,25 ponto e S4-S5 para 0,16 ponto.

Caminho contrário traça o Sujeito 10, com queda de 3 posições e média

passando de 4,29 (entre muito bom e ótimo) para 3,02 (regular).

Diferenças ainda mais marcantes são encontradas nos Sujeitos 7 e 6. O

Sujeito 7 apresenta perda de 5 posições e média indo de 4,37 para 2,93 (um

total de 1,44 pontos), ou seja, passando de uma interpretação avaliada como

entre muito boa e ótima para abaixo de regular.

Os Sujeitos 7 e 10 mostram similaridades na avaliação da fala. Ambos

trazem a Agradabildade como o quesito com menor avaliação (2,24 para

97

ambos – abaixo de regular) e Segurança com a maior avaliação (3,35 e 3,46,

respectivamente). Em relação à pontuação recebida pelos outros sujeitos em

relação a esses quesitos e aos demais avaliados, suas performances em

termos de expressão oral não foram bem avaliadas. Na análise do pitch,

observamos com apoio na inspeção do traçado de f0 e na medição de valores

de f0, que ambas as intérpretes lançam mão de modulações abruptas, referida

pelos ouvintes no estudo de MOSER (1995) como uma entoação exagerada e

característica de fala histriônica.

Finalmente, o Sujeito 6 ganha 7 posições, indo da 11ª para 4ª posição,

apresentando notas altas todos os quesitos – Agradabilidade (4ª melhor nota,

com 3,55); Confiabilidade (4ª melhor nota, com 3,55); Naturalidade (4ª melhor

nota, com 3,54); Fluidez (4ª melhor nota, com 3,48); Segurança (5ª melhor

nota, com 3,44); Profissionalismo (5ª melhor nota, com 3,5) e

Compreensibilidade (4ª melhor nota, com 3,67). Todas os quesitos de

avaliação de fala ultrapassam a média de 3,4 registrada pelo Sujeito 6 na

avaliação do conteúdo da transcrição, novamente comprovando o papel da

prosódia na avaliação do trabalho do intérprete.

Com base nos resultados, podemos afirmar que as intérpretes que mais

aproximaram as características prosódicas da fala interpretada de sua fala

semi-espontânea tenderam a receber uma melhor avaliação de qualidade e

compreensibilidade da interpretação. Aquelas que mais se afastaram das

características prosódicas identificadas na fala semiespontânea tenderam a ser

pior avaliadas.

Assim, embora a fala interpretada evidencie características singulares,

pudemos verificar uma variabilidade prosódica entre as intérpretes na produção

dessa fala. Isso indica que há espaço para se trabalhar a fala interpretada na

formação do intérprete. A incorporação de softwares de análise acústica como

o Praat, utilizado como ferramenta deste estudo, poderá permitir que

instrutores e alunos visualizem melhor essa fala e os diferentes elementos a

98

serem trabalhados (frequência fundamental, taxa de elocução, variação de

pitch etc.).

Ainda precisamos caminhar muito na compreensão de como a fala

interpretada pode ser avaliada, mas aprendemos através deste estudo que as

questões prosódicas tëm papel importante na avaliação de qualidade e

compreensão e compreensibilidade da fala interpretada. Como vimos na

Tabela 14, das doze intérpretes aqui avaliadas, apenas 3 atingiram mais de

60% em alta compreensibilidade. Isso é muito pouco. Precisamos utilizar nosso

conhecimento para fornecer programas de formação para intérpretes que

englobem as questões prosódicas, tão fundamentais para nossa profissão.

Como destacamos na introdução desse trabalho, a interpretação é uma

atividade completamente baseada na fala, tanto como fonte quanto como

resultado final. É preciso dar mais atenção às características prosódicas da fala

do intérprete, pois estas afetam a maneira pela qual tanto a qualidade do

trabalho é percebida quanto a mensagem interpretada é compreendida.

Este trabalho dá um primeiro passo nesta direção, na certeza de que

outros virão para enriquecer uma área ainda tão carente de pesquisa.

Precisamos desenvolver mais estudos na área e as possibilidades para tanto

são muitas, desde o desenvolvimento de experimentos de manipulação

prosódica e verificação dos seus efeitos até comparações entre grupos de

interpretes com e sem treinamento em questões de prosódia.

Em um futuro cada vez mais desafiador para a profissão de intérprete,

uma maior compreensão da fala interpretada será uma ferramenta importante

na formação de novos e melhores profissionais.

99

Referências Blibliográficas

BAIGORRI JALÓN, J. From Paris to Nuremberg: The Birth of Conference

Interpreting, Benjamins Translation Library, 2014

BAIGORRI JALÓN, J. Interpreting Vol. 4(1), 29–40, John Benjamins Publishing

Co, 1999, disponível em http://www.researchschool.org/intranets/baigorri_1.pdf.

Último acesso em 09/07/2015.

BARALDI, G. et al. Estudo da freqüência fundamental da voz de idosas

portadoras de diferentes graus de perda auditiva. Rev. Bras.

Otorrinolaringologia, São Paulo, v.73, n.3, p. 378-383, 2007, disponível em

http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-

72992007000300013&lng=en&nrm=iso. Último acesso em 09/07/2015.

BARBOSA, P. Syllable-Timing in Brazilian Portuguese": Uma Crítica a Roy

Major. DELTA, vol. 16 no. 2. São Paulo, 2000, disponível em

http://dx.doi.org/10.1590/S0102-44502000000200006. Último acesso em

09/07/2015.

BARBOSA, P. Prosódia: uma entrevista com Plínio A. Barbosa. ReVEL, v. 8, n.

15, 2010, disponível em

http://www.revel.inf.br/files/entrevistas/revel_15_entrevista_plinio.pdf. Último

acesso em 09/07/2015.

BOERSMA, P, WEENINK, D. Praat: doing phonetics by computer. In:

http://www.fon.hum.uva.nl/praat/. Amsterdan, 2002.

BOLINGER, D. Intonation and Grammar. Language Learning 8, 31-117, 1958.

BROWN, G., CURRIE, K., KENWORTHY, J. Questions of Intonation. Croom-

Helm, London, 1980 Cauldwell, R. Streaming Speech. Speech in Action, UK,

2001.

BUHLER, H. Linguistic (semantic) and extra-linguistic (pragmatic) criteria for the

evaluation of conference interpretation and interpreters. Multilingua, 5 (4): 231-

235, 1986.

http://www.researchschool.org/intranets/baigorri_1.pdf

http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-72992007000300013&lng=en&nrm=iso

http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-72992007000300013&lng=en&nrm=iso

http://dx.doi.org/10.1590/S0102-44502000000200006

http://www.revel.inf.br/files/entrevistas/revel_15_entrevista_plinio.pdf

100

CHIARO, D. & NOCELLA, G. Interpreters’ perception of linguistic and non-

linguistic factors affecting quality: A survey through the World Wide Web, 2004,

disponível em https://www.erudit.org/revue/meta/2004/v49/n2/009351ar.pdf.


CHUN, D.M. Discourse Intonation in L2: From theory and research to practice,

Benjamins Publishing Company, 2002

COLLADOS AÍS, A. La evaluación de la calidad em interpretación simultânea.

La impostancia de la comunicación no verbal. Granada: Comares, 1998.

CRUTTENDEN, A. Intonation, Cambridge Textbooks in Linguistics, 1986

FERRARI, M. Simultaneous Consecutive Revisited, 2007, disponível em

https://iacovoni.files.wordpress.com/2009/01/simultaneousconsecutive-2.pdf.


FLEROV, C. On Comintern and Hush-a-Phone: Early history of simultaneous

interpretation equipment, 2013, disponível em http://aiic.net/page/6625/on-

comintern-and-hush-a-phone-early-history-of-simultaneous-interpretation-

equipment/lang/1. Último acesso em 09/07/2015

GILE, D. L’évaluation de la qualité de l’interprétation ales délégués: une étude

de cas, 1990, disponível em

http://www.openstarts.units.it/dspace/handle/10077/2156. Último acesso em

09/07/2015.

GILE, D. Basic Concepts and Models for Interpreter and Translator Training,

Benjamins Translation Library, 1995

GILE, D. Testing the Effort Models’ tightrope hypothesis in simultaneous

interpreting – A contribution, Hermes, Journal of Linguistics no. 23, 1999 –

disponível em http://download2.hermes.asb.dk/archive/FreeH/H23_09.pdf.


GRICE, M. / BAUMANN, S. An Introduction to Intonation – Functions and

Models, 2007, disponível em http://www.gtobi.uni-koeln.de/lit/grice-baumann-

int-func-models-revised-1107.pdf. Último acesso em 09/07/2015.

GUMPERZ, J. Discourse Strategies, Cambridge University Press, 1982,

disponível em http://catdir.loc.gov/catdir/samples/cam031/81020627.pdf. Último

acesso em 09/07/2015.

https://www.erudit.org/revue/meta/2004/v49/n2/009351ar.pdf

https://iacovoni.files.wordpress.com/2009/01/simultaneousconsecutive-2.pdf

http://www.openstarts.units.it/dspace/handle/10077/2156

http://download2.hermes.asb.dk/archive/FreeH/H23_09.pdf

http://www.gtobi.uni-koeln.de/lit/grice-baumann-int-func-models-revised-1107.pdf

http://www.gtobi.uni-koeln.de/lit/grice-baumann-int-func-models-revised-1107.pdf

http://catdir.loc.gov/catdir/samples/cam031/81020627.pdf

101

HARTLEY, A; MASON, I; PENG, G. PEREZ, IA; Peer- and Self-Assessment in

Conference Interpreting Training. Research output: Book/Report ›

Commissioned report, 2003.

HOLUB, E. "Does Intonation Matter? The impact of monotony on listener

comprehension", in: The Interpreters' Newsletter, 15, pp. 117-126, 2010.

HUSSON, F.; JOSSE J.; LÊ S.& MAZET, J. (2013). FactoMineR: Multivariate

Exploratory Data Analysis and Data Mining with R. R package version 1.25,

disponível em http://cran.r-project.org/web/packages/FactoMineR/index.html.


KAHANE, E. Thoughts on the quality of interpretation, 2000, disponível em

http://aiic.net/page/197/thoughts-on-the-quality-of-interpretation/lang/1. Último

acesso em 09/07/2015.

KURZ, I. Conference Interpreting—User Expectations, Coming of Age.

Proceedings of the 30th Annual Conference of the American Translators

Association (D. L. Hammond, ed.), Medford (NJ), Learned Information, 1989

KURZ I. / PÖCHHACKER F. Quality in TV interpreting, Translatio – Nouvelles

de la FIT – FIT Newsletter XIV 3:4, 350-358, 1995

KURZ, I. Quality and role: The Professionals' view, 2008. Disponível em

http://aiic.net/page/3044/quality-and-role-the-professionals-view/lang/1. Último

acesso em 09/07/2015.

KURZ, I. The Impact of non-native English on students’ interpreting

performance, em Efforts and Models in Interpreting and Translation Research,

2008. Benjamins Translation Library.

LAVER, J. The Phonetic Description of Voice Quality. Cambridge University

Press, 1980

LAVER, J. Principles of Phonetics, Cambridge Textbooks in Linguistics, 1994.

LENGLET, C. The impact of prosody on the Comprehensibility and quality of

simultaneous interpreting: A pilot study, Translation and Comprehensibility,

2015, disponível em http://di.umons.ac.be/details.aspx?pub=74a252b8-ede5-

4c1e-93d9-af4c2c9f0974. Último acesso em 09/07/2015.

MADUREIRA, S. Estudos de prosódia/Ester M. Scarpa, org – Campinas, SP:

Editora da Unicamp, 1999

http://cran.r-project.org/web/packages/FactoMineR/index.html

http://aiic.net/page/197/thoughts-on-the-quality-of-interpretation/lang/1

http://aiic.net/page/3044/quality-and-role-the-professionals-view/lang/1

http://di.umons.ac.be/details.aspx?pub=74a252b8-ede5-4c1e-93d9-af4c2c9f0974

http://di.umons.ac.be/details.aspx?pub=74a252b8-ede5-4c1e-93d9-af4c2c9f0974

102

MADUREIRA, S. Sobre a expressividade da Fala in Kyrillos, L. Expressivdade

Editora Revinter, 2004

MIGLIORINI, L.; MASSINI-CAGLIARI, G. Sobre o ritmo do Português Brasileiro:

evidências de um padrão acentual. REVEL v. 8, n. 15, 2010, disponível em

http://www.revel.inf.br/files/artigos/revel_15_sobre_o_ritmo.pdf. Último acesso

em 09/07/2015.

MOSER P. Survey on expectations of users of conference interpretation, 1995,

disponível em http://aiic.net/page/736/survey-on-expectations-of-users-of-

conference-interpretation/lang/1. Último acesso em 09/07/2015.

MOSER P., ‘Expectations of Users of Conference Interpretation’. Interpreting,

1(2), 145-178, 1996.

MUNDAY, J. Translation theory before the twentieth century”. In: Introducing

Translation Studies. London: Routledge, p. 19, 2005

PÖCHHACKER, F, Interpreting quality: global professional standards? 2013,

disponível em http://lourdesderioja.com/2013/04/24/the-issue-of-quality/. Último

acesso em 09/07/2015.

PÖCHHACKER, ZWISCHENBERGER, Survey on quality and role: conference

interpreters’ expectations and self-perceptions, 2010, disponível em

http://aiic.net/page/3405/survey-on-quality-and-role-conference-interpreters-

expectations-and-self-perceptions/lang/1. Último acesso em 09/07/2015.

RAMLER, S. Nurember and Beyond. The Memoirs of Siegfried Ramler, Ahuna

Press, 2008

RENNERT, S. The impact of fluency on the subjective assessment of

interpreting quality", in: The Interpreters' Newsletter, 15, pp. 101-115, 2010

RILLIARD, A et at, Proceedings of the VIIth GSCP International Conference.

Speech and Corpora, edited by di Mello, Heliana, Pettorino, Massimo, Raso,

Tommaso Firenze University Press, 2012.

ROLAND, R. Interpreters as diplomats: a diplomatic history of the role of

interpreters in world politics, pg 20, 1922.

SCHLESINGER, M. Intonation in the production of and perception of

simultaneous interpretation, In Lambert and Moser-Mercer (Eds.) Bridging the

Gap. Empirical Research in Simultaneous Interpretation. Benjamins, 1994.

http://www.revel.inf.br/files/artigos/revel_15_sobre_o_ritmo.pdf

http://aiic.net/page/736/survey-on-expectations-of-users-of-conference-interpretation/lang/1

http://aiic.net/page/736/survey-on-expectations-of-users-of-conference-interpretation/lang/1

http://lourdesderioja.com/2013/04/24/the-issue-of-quality/

http://aiic.net/page/3405/survey-on-quality-and-role-conference-interpreters-expectations-and-self-perceptions/lang/1

http://aiic.net/page/3405/survey-on-quality-and-role-conference-interpreters-expectations-and-self-perceptions/lang/1

103

SELESKOVITCH, D., English, Interpreting For International Conferences,

Washington, DC: Pen and Booth, 1978.

SELESKOVITCH, D. Who should assess an interpreter’s performance in

Multilingua - Journal of Cross-Cultural and Interlanguage Communication,

Volume 5, Issue 4, Pages 236–236, ISSN (Online) 1613-3684, ISSN (Print)

0167-8507, DOI: 10.1515/mult.1986.5.4.236, 2009.

TAUROZA & ALLISON, Applied Linguistics (1990) 11 (1): 90-105, 1990.

VANDER ELST, P. The Nuremberg Trial, 2000. Disponível em

http://aiic.ca/page/983/the-nuremberg-trial/lang/1. Último acesso em

09/07/2015.

WEBER W.K., Improved Ways of Teaching Consecutive Interpretation in The

Theoretical and Practical Aspects of Teaching Conference Interpretation. Ed. by

L. Gran and J. Dodds, Udine, Campanotto Editore, pp. 161-166, 1989.

ZACKIEWICS, D.V. e ANDRADE, C.F. Seis parâmetros de fluência. Revista da

Sociedade Brasileira de Fonoaudiologia: 5(7), 59-64, 2000.

http://aiic.ca/page/983/the-nuremberg-trial/lang/1

104

ANEXO 1 - Transcrição da Palestra Original

I know what you’re thinking. You think I’ve lost my way, and somebody’s going

to come on the stage in a minute and guide me gently back to my seat. I get

that all the time in Dubai. “Here on holiday are you, dear?” “Come to visit the

children? How long are you staying?”

Well actually, I hope for a while longer yet. I have been living and teaching in

the Gulf for over 30 years. And in that time, I have seen a lot of changes. Now

that statistic is quite shocking. And I want to talk to you today about language

loss and the globalization of English. I want to tell you about my friend who was

teaching English to adults in Abu Dhabi. And one fine day, she decided to take

them into the garden to teach them some nature vocabulary. But it was she who

ended up learning all the Arabic words for the local plants, as well as their uses

– medicinal uses, cosmetics, cooking, herbal. How did those students get all

that knowledge? Of course, from their grandparents and even their great-

grandparents. It’s not necessary to tell you how important it is to be able to

communicate across generations.

But sadly, today, languages are dying at an unprecedented rate. A language

dies every 14 days. Now, at the same time, English is the undisputed global

language. Could there be a connection? Well I don’t know. But I do know that

I’ve seen a lot of changes. When I first came out to the Gulf, I came to Kuwait in

the days when it was still a hardship post. Actually, not that long ago. That is a

little bit too early. But nevertheless, I was recruited by the British Council, along

with about 25 other teachers. And we were the first non-Muslims to teach in the

state schools there in Kuwait. We were brought to teach English because the

government wanted to modernize the country and to empower the citizens

through education. And of course, the U.K. benefited from some of that lovely

oil wealth.

Okay. Now this is the major change that I’ve seen – how teaching English has

morphed from being a mutually beneficial practice to becoming a massive

international business that it is today. No longer just a foreign language on the

school curriculum, and no longer the sole domain of mother England, it has

105

become a bandwagon for every English-speaking nation on earth. And why

not? After all, the best education – according to the latest World University

Rankings – is to be found in the universities of the U.K. and the U.S. So

everybody wants to have an English education, naturally. But if you’re not a

native speaker, you have to pass a test.

Now can it be right to reject a student on linguistic ability alone? Perhaps you

have a computer scientist who’s a genius. Would he need the same language

as a lawyer, for example? Well, I don’t think so. We English teachers reject

them all the time. We put a stop sign, and we stop them in their tracks. They

can’t pursue their dream any longer, ‘til they get English. Now let me put it this

way: if I met a monolingual Dutch speaker who had the cure for cancer, would I

stop him from entering my British University? I don’t think so. But indeed, that is

exactly what we do. We English teachers are the gatekeepers. And you have to

satisfy us first that your English is good enough. Now it can be dangerous to

give too much power to a narrow segment of society. Maybe the barrier would

be too universal.

Okay. “But,” I hear you say, “what about the research? It’s all in English”. So the

books are in English, the journals are done in English, but that is a self-fulfilling

prophecy. It feeds the English requirement. And so it goes on. I ask you, what

happened to translation? If you think about the Islamic Golden Age, there was

lots of translation then. They translated from Latin and Greek into Arabic, into

Persian, and then it was translated on into the Germanic languages of Europe

and the Romance languages. And so light shone upon the Dark Ages of

Europe. Now don’t get me wrong; I am not against teaching English, all you

English teachers out there. I love it that we have a global language. We need

one today more than ever. But I am against using it as a barrier. Do we really

want to end up with 600 languages and the main one being English, or

Chinese? We need more than that. Where do we draw the line? This system

equates intelligence with a knowledge of English, which is quite arbitrary.

And I want to remind you that the giants upon whose shoulders today’s

intelligentsia stand did not have to have English, they didn’t have to pass an

English test. Case in point, Einstein. He, by the way, was considered remedial

106

at school because he was, in fact, dyslexic. But fortunately for the world, he did

not have to pass an English test. Because they didn’t start until 1964 with

TOEFL, the American test of English. Now it’s exploded. There are lots and lots

of tests of English. And millions and millions of students take these tests every

year. Now you might think, you and me, “Those fees aren’t bad, they’re okay,”

but they are prohibitive to so many millions of poor people. So immediately,

we’re rejecting them.

It brings to mind a headline I saw recently: “Education: The Great Divide”. Now I

get it, I understand why people would want to focus on English. They want to

give their children the best chance in life. And to do that, they need a Western

education. Because, of course, the best jobs go to people out of the Western

Universities, that I put on earlier. It’s a circular thing.

Okay. Let me tell you a story about two scientists, two English scientists. They

were doing an experiment to do with genetics and the forelimbs and the hind

limbs of animals. But they couldn’t get the results they wanted. They really

didn’t know what to do, until along came a German scientist who realized that

they were using two words for forelimb and hind limb, whereas genetics does

not differentiate and neither does German. So bingo, problem solved. If you

can’t think a thought, you are stuck. But if another language can think that

thought, then, by cooperating, we can achieve and learn so much more.

My daughter came to England from Kuwait. She had studied science and

mathematics in Arabic. It’s an Arabic medium school. She had to translate it into

English at her grammar school. And she was the best in the class at those

subjects. Which tells us that when students come to us from abroad, we may

not be giving them enough credit for what they know, and they know it in their

own language. When a language dies, we don’t know what we lose with that

language.

This is – I don’t know if you saw it on CNN recently – they gave the Heroes

Award to a young Kenyan shepherd boy who couldn’t study at night in his

village, like all the village children, because the kerosene lamp, it had smoke

and it damaged his eyes. And anyway, there was never enough kerosene,

107

because what does a dollar a day buy for you? So he invented a cost-free solar

lamp. And now the children in his village get the same grades at school as the

children who have electricity at home. When he received his award, he said

these lovely words: “The children can lead Africa from what it is today, a dark

continent, to a light continent”. A simple idea, but it could have such far-

reaching consequences.

People who have no light, whether it’s physical or metaphorical, cannot pass

our exams, and we can never know what they know. Let us not keep them and

ourselves in the dark. Let us celebrate diversity. Mind your language. Use it to

spread great ideas.

Thank you very much.

Sukran

108

ANEXO 2 - Extratos Segmentos Inicial, Medial, Final e

Adicional

Segmento Inicial

I know what you’re thinking… You think I’ve lost my way and

somebody’s going to come on the stage in a minute and guide me

gently back to my seat. I get that all the time in Dubai. Here on holiday,

are you dear? Come to visit the children? How long are you staying?

Well, actually I hope for a while longer yet. I have been living and

teaching in the Gulf for over 30 years. And in that time I have seen a lot

of changes.

S1 – Eu sei que cês tão pensando…cês tão pensando que eu me perdi…e

aí…me perdi e alguém vai vir aqui e vai me retirar do palco, me levar de volta

pro meu assento daqui a pouco, né? Isso acontece comigo o tempo inteiro,

em Dubai. Ah, você está de férias… Vem ver as crianças… Quanto tempo cê

vai ficar? Bom, na verdade, eu espero que ainda por um bom tempo. Eu vivo

e trabalho no Golfo há mais de 30 anos. E nesse tempo, eu já vi muitas

mudanças.

S2 – Eu sei que vocês tão pensando. Vocês estão pensando que eu me

perdi e que logo, logo vem alguém e que vai me levar de volta para o meu

assento. O tempo inteiro isso acontece aqui em Dubai. Ah, você está de

férias querida? Veio visitar os filhos? Quanto tempo você vai ficar? Bom, na

verdade, eu esperei que eu pudesse ficar um pouquinho. Eu já sou

professora há 30 anos! Moro aqui no Golfo há 30 anos. E nesse período, eu

vi muitas mudanças.

S3 – Bem, eu volto toda vez. Bem... venha visitar as crianças… Quanto

tempo você vai ficar? Bem, na verdade, eu espero um pouquinho e eu estou

feliz e vivi, muito feliz, ensinando no Golfo e pilos últimos 30 anos…e naquele

momento vi muitas mudanças.

S4 – Eu sei o que vocês estão pensando…tão pensando… bem parece que

outra coisa vai acontecer, alguém vai pegar e vai levar ela embora de volta

109

pro meu assento, não é? É isso que vocês estão pensando. Isso me

acontece o tempo todo em Dubai. Ah, a senhora está aqui de férias? Ah, veio

visitar os netinhos? Quanto tempo vai ficar? Bem, na verdade, eu já estou

aqui no Golfo por mais de 30 anos, não só morando, mas também

ensinando. E nesse período observei muitas mudanças.

S5 – Eu sei o que cês estão pensando. Devem ter pensado…acho que ela

errou o caminho, daqui a pouco alguém vem e leva ela de volta lá pro lugar

dela, onde ela tava sentada. Isso acontece muito em Dubai. Ah, querida, está

de férias? Oh, veio visitar os netos? Vai ficar quanto tempo? Mas na verdade,

eu já moro e es...dou aulas aqui no Golfo já há mais de 30 anos. E durante

esse período de tempo, eu já observei muitas mudanças.

S6 – (...) Ah, toda hora me perguntam isso, em Dubai. Você está aqui em

férias, querida? Venha visitar as crianças… Por quanto tempo você vai ficar

aqui? Bem, na verdade eu achava…gostaria de ficar mais tempo. Eu estou

há mais de 30 anos vivendo e dando aulas no Golfo. E naquela época, e

nesse, perdão, nesse período, eu vi muitas mudanças.

S7 – Eu sei o que vocês estão pensando… Vocês acham que eu errei e

alguém vai chegar aqui, eu me perdi, alguém vai vir no palco e me levar de

volta pra meu assento? As pessoas me dizem isso o tempo todo lá em

Dubai. Tá aqui de férias querida? Vem visitar as crianças? Quanto tempo

você vai ficar? Bom, na verdade, ainda vou ficar mais um tempo. Eu já moro

e dou aulas na área do Golfo há muitos anos e neste tempo, eu já vi muitas

mudanças.

S8 – Eu sei o que que vocês tão pensando, achando que eu não…estou aqui

meio perdida e alguém vai gentilmente me levar pro meu lugar. Eu sei que é

assim aqui no Dubai. Você está de férias, querida? Veio visitar os filhos?

Quanto tempo vai ficar aqui? Mas na verdade, eu já estou vivendo e dando

aulas aqui no Golfo há mais de 30 anos. E durante esse tempo todo, eu vi

várias mudanças.

S9 – Eu sei o que cês tão pensando. Que eu…não estou no lugar certo, que

alguém vai subir aqui e me levar de volta pro meu lugar na plateia. Eu ouço

isso o tempo todo em Dubai. Vocês estão aqui de férias? Vem visitar as

crianças… Quanto tempo cê vai ficar? Bom, na verdade, eu ainda vou ficar

110

aqui um bom tempo. Eu já moro aqui no Golfo pra mais de 30 anos. E

durante esse tempo, eu já vi muitas mudanças.

S10 – Eu sei o que vocês tão pensando…tão pensando que na verdade, eu

não sei o que fazer, pra onde ir, e que alguém vai vir aqui daqui a pouco no

palco e me conduzir de volta ao meu assento. Me acontece o tempo todo

isso. E…você tá aqui, de férias, querida, em Dubai? Veio visitar as crianças?

Quando tempo você vai ficar? Bom, na verdade, eu espero que por um bom

tempo ainda. Eu moro aqui na região do Golfo já há 30 anos. Durante esse

período, eu vi muitas mudanças acontecerem.

S11 – Eu sei o que vocês estão pensando, estão pensendo que eu me perdi

e que alguém irá subir nesse palco e vão me levar de volta para o meu

assento. Isso sempre acontece em Dubai. Aqui, vamos ver o que vai

acontecer… Venham visitar as crianças… Quanto tempo a senhora vai ficar?

Bom, na verdade, eu moro e dou aula nessa região do Golfo já há mais de 30

anos! E durante esse período eu observei, vivenciei uma série de mudanças.

S12 – Bom, eu já sei o que vocês estão pensando, vocês pensaram que eu

me perdi, que alguém subirá no palco daqui a pouco e irá me levar de volta

ao meu assento!?! Eu ouço isso o tempo inteiro lá em Dubai. Ah, senhora,

como você está hoje? Cê veio visitar as crianças? Quanto tempo você irá

ficar aqui? Bom, na verdade, é... eu espero ficar um pouco mais tempo ainda.

Eu fico muito feliz já ah…lecionando e vivendo no Golfo já há mais de 30

anos. E naquela época e, oh, desculpe, durante todo esse momento, eu já vi

várias mudanças.

111

Segmento Medial

Now, don’t get me wrong; I am not against teaching English, all you

English teachers out there. I love it that we have a global language.

We need one today more than ever. But I am against using it as a

barrier. Do we really want to end up with 600 languages, and the

main one being English or Chinese? We need more than that! Where

do we draw the line? This system equates intelligence with a

knowledge of English…which is quite arbitrary!

S1 – Mas vejam bem, eu não contra o ensino de inglês; eu adoro que nós

tenhamos uma. Um idioma global, nós precisamos mais do que nunca.

Mas eu contra usá-lo como uma barreira. Nós realmente queremos

acabar com 600 línguas e a principal sendo inglês ou chinês? Nós

precisamos mais disso. Onde está aí o limite? Esse sistema, ele equaliza

a inteligência com o conhecimento de inglês, que é muito arbitrário!

S2 – Eu não sou contra, não, ensinar inglês. Eu adoro! Adoro que nós

tenhamos uma linguagem global e nós precisamos muito dela, mais do

que qualquer modelo ou de qualquer época. Mas eu não concordo em

usá-la como uma barreira...Nós queremos ter só 600 idiomas e a principal

ser inglês ou chinês? Nós precisamos mais do que isso! Como

estabelecer limites? Este é um sistema que limita a inteligência com o

conhecimento de inglês, que é arbitrário, não?

S3 – Bem, mas eu não acredito que devemos não ter um idioma global.

Acredito que isso seja. Mas eu acho que não deve funcionar como uma

barreira. Ou devemos ter 600 idiomas e uma seria inglês e ... chinês?

Bem, onde delimitamos essa linha? Nós temos ah...não podemos

controlar a inteligência a partir do conhecimento de inglês.

S4 – Veja, eu amo e adoro o fato de termos um idioma global; eu acho

que nós precisamos disso mais do que nunca. Mas sou contra usarmos a

língua como a barreira. Será que nós queremos também ter 600 idiomas

e uma delas ser inglês ou chinês? Não, nós precisamos encontrar

uma...algo que nos atenda, mas o sistema precisa ser inteligente; é

bastante arbitrário. Por que o inglês?

112

S5 – É claro que eu não sou contra ensinar inglês; eu adoro, eu acho

ótimo termos uma língua global; precisamos disso mais do que nunca.

Mas eu sou contra usar a língua como uma barreira. Nós queremos ter

600 idiomas e a principal ser simplesmente inglês ou chinês? Nós

precisamos de algo mais. Esse sistema diz que é igual, inteligência e

conhecimento de inglês! É um sistema muito arbitrário!

S6 – Não me interpretem errado. Eu não sou contra o ensino do inglês,

eu acho ótimo que seja uma língua global, um idioma. E ele é muito

necessário hoje, mais do que nunco. Mas eu acho que nós podemos

olhar como uma barreira. Será que nós queremos 600 línguas e a

principal sendo inglês ou chinês? Nós precisamos mais do que isso.

Aonde estabelecer um limite? Esse sistema que cria inteligência com o

conhecimento do inglês...é muito arbitrário.

S7 – Por favor, não me entendam mal. Eu não sou contra o ensino do

inglês. Eu adoro...eu adoro que nós temos uma. Um idioma global. Nós

precisamos disso hoje, mais que nunca. Mas eu sou contra usá-lo como

barreira. Nós precisamos terminar com as 600 com 600 idiomas e termos

apenas uma língua, o inglês? Aonde é que vamos traçar a linha? O

sistema, ele...faz coincidir inteligência com o conhecimento do inglês, o

que é uma coisa arbitrária.

S8 – Não pensem que eu sou contra ensinar inglês. Eu adoro ter um

idioma global. Nós precisamos hoje mais do que nunca. Mas eu não

quero usar como uma barreira. Nós temos que ter 600 idiomas e depois

ter só inglês ou chinês? Precisamos mais do que isso. Então como nós

vamos demarcar? É um sistema que precisa de inteligência para

conhecimento de inglês. E isso é arbitrário.

S9 – Eu não sou contra dar aulas de inglês, eu adoro que nós temos uma

língua global. Nós usamos hoje uma mais do que sempre. Mas eu estou

contra usá-la como uma barreira. Será que nós queremos mesmo ter 600

línguas e a principal vai ser inglês ou chinês? Não, nós precisamos de

mais do que isso. Quando é o ponto de que não tem mais volta? É

preciso de inteligência com o conhecimento de inglês, o que é uma coisa

bem arbitrária.

113

S10 – Não me entendam mal, não sou contra os professores de inglês, é

ótimo que exista um idioma global. Ele é mais preciso do que nunca hoje;

porém eu sou contra usar esse idioma como uma barreira. Será que nós

realmente queremos terminar com 600 idiomas, sendo que o principal

será o inglês ou o chinês? Precisamos ir além disso. Onde é que vamos

estabelecer o limite? Este sistema requer inteligência, de grande

inteligência, do conhecimento de inglês. Bastante arbitrário, não?

S11 – Por favor, não me entendam mal, eu não estou contra as

instituições que ensinam inglês, é necessário um idioma global. E

precisamos hoje mais do que nunca. Mas o que eu sou contra é contra o

uso como barreira. Realmente vocês querem acabar tendo 600 línguas e

uma delas ser o inglês ou o chinês? Não. Precisamos mais do que isso,

aonde traçar o limite? Esse sistema ele exige inteligência com o

conhecimento do inglês, o que é um pouco arbitrário, não é mesmo?

S12 – Agora, deixa eu explicar melhor, não é que eu est....quero só

ensinar inglês. Eu adoro ter um idioma global, mais do que nunca. Mas o

que eu sou contra é que seja uma barreira. Nós realmente queremos ter

600 idiomas e o principal ser inglês ou chinês? Nós precisamos mais do

que isso, onde que a gente estabelece um limite? Esse sistema ele cria

inteligência, com um conhecimento de inglês, que é bastante arbitrário.

114

Segmento Final

People who have no light, whether it’s physical or metaphorical,

cannot pass our exams and we can never know what they know. Let

us not keep them and ourselves in the dark. Let us celebrate

diversity. Mind your language. Use it to spread great ideas.

S1 – As pessoas que não têm luz, seja física ou de forma metafórica, não

podem passar nos nossos testes. E nós não podemos saber o que eles

sabem. Não vamos afastá-los e mantê-los, a eles e a nós mesmos, no

escuro. Vamos celebrar a diversidade. Cuide de sua linguagem. Use-a

para espalhar excelentes ideias!

S2 – As pessoas que não têm luz, seja física ou metafórica, não podem

passar os nossos exames e provas. E nós nunca vamos saber o que eles

sabem. Não vamos impedi-los e impedir a nós mesmos que vejam a luz.

Vamos celebrar a diversidade. Prestem atenção, cuidem do seu idioma.

Usem pra disseminar grandes ideias!

S3 – As pessoas que não têm luz, seja física ou metafórica, não pode

passar nos nossos exames e...agora podem passar nos seus exames. E

nunca sabemos os que eles podem saber. Bem, vamos celebrar a

diversidade. Os...Aprenda o seu idioma, use-o para disseminar grandes

ideias.

S4 – As pessoas que não têm essa luz, seja ela física ou metafórica, não

vão conseguir passar nas nossas provas e nós nunca vamos entender ou

aprender o que é que eles sabem. E isso nos mantém no escuro. Vamos

celebrar a diversidade. Cuidem da sua língua! Usem-na para disseminar

ideias brilhantes.

S5 – As pessoas quando não têm luz, quer seja no ponto de vista físico

ou metafórico, não conseguem passar nos seus exames, nos seus testes.

E nós não sabemos o que eles sabem. Não vamos mantê-los, ou nos

manter, no escuro. Vamos celebrar a diversidade. Então, realmente,

cuidado com a sua língua; use-a para espalhar as grandes ideias!

S6 – As pessoas que não têm luz, seja física ou metafórica, essa luz, não

podem passar as nossas provas. São pessoas que...nós não vamos

115

saber nunca o que elas não sabem, o que elas sabem ou não. Ou seja,

não vamos nos manter no escuro. Vamos celebrar a diversidade. Importe-

se com a sua língua! Use-a para espalhar grande ideias!

S7 – As pessoas que não têm a luz, seja ela física ou metafórica, não

podem passar as nossas provas, e nós não podemos saber o que eles

sabem. Não vamos deixá-los no escuro. Nem a nós mesmos. Vamos

celebrar a diversidade. Importe-se com a sua língua! Use-a para espalhar

grandes ideias!

S8 – Às vezes as pessoas não têm uma ideia dessa luz, física ou em

termos de metáfora. E elas não podem passar nas provas. E não vamos

deixar essas pessoas no escuro. Vamos celebrar a diversidade. Pensem

no seu idioma e usem para espalhar as grandes ideias.

S9 – As pessoas que não têm luz, seja física ou metafórica, não podem

passar nossos... nossos testes. E nós nunca vamos saber o que eles

sabem. Isso não nos mantém, nem a nós, no escuro. Vamos celebrar a

diversidade. Cuide da sua língua. Use para espalhar grandes ideias.

S10 – As pessoas que não têm acesso a iluminação, seja física ou

metafórica, não conseguirão passar os nossos exames, ser aprovadas

nos nossos exames, e nós jamais saberemos o que elas sabem. Não

permitamos que elas e nós continuemos no escuro. Vamos comemorar a

diversidade. Preocupem-se com o seu idioma, usem o seu idioma para

disseminar grandes ideias.

S11 – As pessoas que não têm o luz, seja física ou metafora, de forma

metafórica, não podem passar o seu exame. E nunca vamos saber aquilo

que eles efetivamente sabem e isso vai deixar eles e a nós no escuro. Por

isso, vamos celebrar a diversidade, importe-se com o seu idioma. Use o

seu idioma para disseminar ideias maravilhosas.

S12 – As pessoas que não têm luz, seja ela física ou metafórica, não

podem passar nas nossas provas, e nós nunca saberemos o que eles

sabem. Isso nã...os impede e nos impede, ou nos deixa no escuro.

Vamos celebrar a diversidade. Preocupe-se com o seu idioma, utilize ele

para espalhar grandes ideias.

116

Segmento Adicional

Now let me put it this way. If I met a monolingual Dutch speaker who had the cure

for cancer. Would I stop him from entering my British University. I don’t think so.

But indeed. That is exactly what we do. We English teachers are the gatekeepers.

And you have to satisfy us first. That your English is good enough. Now it can be

dangerous to give too much power to a narrow segment of society.

S5. Deixa eu falar, colocar dessa forma; se eu encontrasse, por exemplo, um

holandês, que só falasse holandês, mas tivesse a cura pro câncer, eu não deixaria

essa pessoa entrar na minha universidade. Nossa, eu faria isso? É exatamente o que

fazemos. Nós, professores de inglês, fazemos o controle. A gente é que define se eu o

seu inglês é bom o suficiente. Pode ser, claro, perigoso ver tanto poder pra definir um

segmento da sociedade.

S7. Então deixa eu falar assim desse jeito, se eu encontrasse...ah, um ah...holandês,

que fala holandês, que é monolíngue, e aí...eu ia impedi-lo de vir... ah estudar na

minha universidade? Bem, na verdade é isso que nós fazemos...Nós pedimos que

você nos atenda e nos mostre que o seu inglês é bom o suficiente. E na verdade é um

pouco perigoso dar tanto poder a apenas um segmento da sociedade.

S12. Bom, deixa eu explicar da seguinte forma, se eu conhecesse uma pessoa que

falasse holandês...é ... monolíngue e que tivesse a cura do câncer, eu interromperia

ele de entrar na universidade? Não, mas é exatamente isso que nós fazemos. Somos

os cuidadores do portal e vocês precisam nos garantir que seu inglês é bom o

suficiente, antes de entrar. Agora, pode ser perigoso dar poder demais a um outro

segmento da sociedade.

117

ANEXO 3 – Distribuição dos extratos de fala em cada

versão de avaliação

V1 V2 V3

S7medial2 S2 inicial S12medial2

S1 inicial S5 inicial S3 inicial



S11 inicial S5medial2 S8 inicial

S5medial2 S8 medial S7medial2

S12 medial S10 medial S11 medial



S2 medial S12medial2 S1 medial

S12medial2 S7 final S5medial2

S10 final S1 final S9 final



S6 final S7medial2 S5 final

118

ANEXO 4 - Instruções para Avaliação dos Extratos de

Fala

Iniciais do nome:________________

Idade:________________

Data:________________

Curso (assinale a alternativa aplicável):

Tradução:________________ Interpretação________________

Concluído sim__ não___ Se sim, em

________________

Instruções para análise:

Você vai ouvir 15 extratos da interpretação de uma palestra do inglês para o

português. Ouça cada extrato e então escolha assinale a opção de 1 a 5 que

melhor descreve sua impressão em relação ao extrato ouvido. Responda todas

as perguntas. Você poderá ouvir cada extrato apenas uma vez. Por favor,

apenas se concentre na impressão que o sujeito lhe passa através de sua fala,

ou seja, com o sujeito lhe soa. Cada extrato deve ser avaliado como único. Por

favor, não faça nenhuma comparação entre eles.

119

Extrato:________________

1. Agradabilidade

O quão agradável lhe parece a voz da intérprete?

1 - Nada

agradável

2 – Pouco

agradável

3 – Nem

muito nem

pouco

agradável

4 – Muito

agradável

5 –

Extremamente

agradável

2. Credibilidade

Você acha que pode confiar nesta intérprete para passar a mensagem da

palestrante?

1 - Nada

confiável

2 – Pouco

confiável

3 – Nem

muito nem

pouco

confiável

4 – Muito

confiável

5 –

Extremamente

confiável

3. Naturalidade

Você acha que a fala da intérprete soa natural?

1 - Nada

natural

2 – Pouco

natural

3 – Nem

muito nem

pouco

natural

4 – Muito

natural

5 –

Extremamente

natural

4. Segurança

Esta intérprete lhe soa segura?

1 - Nada

segura

2 – Pouco

segura

3 – Nem

muito nem

4 – Muito

segura

5 –

Extremamente

120

pouco

segura

segura

5. Profissionalismo

Esta intérprete lhe soa profissional?

1 - Nada

profissional

2 – Pouco

profissional

3 – Nem

muito nem

pouco

profissional

4 – Muito

profissional

5 –

Extremamente

profissional

6. Compreensibilidade

É fácil entender a mensagem que intérprete está passando?

1 - Nada fácil

entender

2 – Pouco

fácil

entender

3 – Nem

muito nem

pouco fácil

entender

4 – Muito

fácil

entender

5 –

Extremamente

fácil entender

121

ANEXO 5 – Instruções para Avaliação das Transcrições

Iniciais Avaliador: __________

Data:_____________

Prezado Avaliador

Você está recebendo a transcrição de três extratos da interpretação de um

discurso original produzidos por 12 intérpretes diferentes. Os segmentos foram

extraídos das partes inicial, medial e final do discurso, e totalizam em média 35

segundos. Sua tarefa será analisar cada extrato de transcrição isoladamente

em comparação ao original, levando em consideração o número de erros (E),

número de omissões (O) e manutenção do sentido original (S) e então atribuir

uma nota para cada quesito em uma escala de 0 a 5 (onde 0 é insuficiente e 5,

excelente). Ao final, por favor atribua uma nota final (T) para cada extrato como

um todo. Considere que cada transcrição é uma tentativa de reproduzir o mais

fielmente possível a fala do intérprete. Não existem erros de tipografia no

material transcrito; quaisquer erros ortográficos são reprodução intencional da

fala do intérprete. O mesmo vale para a pontuação, utilizada para se aproximar

o máximo possível da entoação produzida pelo intérprete. Os extratos

deverão ser sempre analisados em relação ao discurso original e não em

comparação uns com os outros.

122

ANEXO 6 – Forma de Onda do Corpus de Gravação

Completo – Fala Semi-espontânea + Fala Interpretada

de Cada Intérprete

S1

S2

S3

S4

123

S5

S6

S7

S8

124

S9

S10

S11

S12

125

ANEXO 7 – Resultados Ponderados Médios Finais da

Análise Perceptiva por Extrato – Versões 1, 2 e 3

V1

Extrato S7 adicional

Agradabilidade 2,1

Confiabilidade 2,6

Naturalidade 2,06

Fluidez 2,16

Segurança 2,56

Profissionalismo 2,3

Compreensibilidade 2,56

Média 2,33

Extrato S1 inicial

Agradabilidade 3,33

Confiabilidade 3,5

Naturalidade 3,4

Fluidez 3,4

Segurança 3,5



Média 3,4

126

Extrato S4 inicial

Agradabilidade 3,73

Confiabilidade 3,83

Naturalidade 3,83

Fluidez 3,96

Segurança 4,0



Média 3,90

Extrato S7 inicial

Agradabilidade 2,53

Confiabilidade 3,16

Naturalidade 2,6

Fluidez 3,03

Segurança 3,13

Profissionalismo 3


Média 2,99

127

Extrato S11 inicial

Agradabilidade 2,76

Confiabilidade 3,2

Naturalidade 2,76

Fluidez 2,96

Segurança 3,13


Compreensibilidade 3.5

Média 3,06


Agradabilidade 3,53

Confiabilidade 3,53

Naturalidade 3,76

Fluidez 3,8

Segurança 3,53



Média 3,62

128

Extrato S12 medial

Agradabilidade 2,93

Confiabilidade 3,06

Naturalidade 3,06

Fluidez 2,93

Segurança 3,0



Média 3,03

Extrato S9 medial

Agradabilidade 3,03

Confiabilidade 3,1

Naturalidade 2,96

Fluidez 2,8

Segurança 2,8



Média 2,99

129

Extrato S5 medial

Agradabilidade 4,3

Confiabilidade 4,1

Naturalidade 3,93

Fluidez 3,86

Segurança 3,96



Média 3,98

Extrato S2 medial

Agradabilidade 4,36

Confiabilidade 4,36

Naturalidade 4,36

Fluidez 4,33

Segurança 4,36



Média 4,32

130


Agradabilidade 3,26

Confiabilidade 3,5

Naturalidade 3,13

Fluidez 3,33

Segurança 3,23



Média 3,31

Extrato S10 final

Agradabilidade 2,46

Confiabilidade 3,13

Naturalidade 2,96

Fluidez 3,36

Segurança 3,6



Média 3,14

131

Extrato S3 final

Agradabilidade 2,8

Confiabilidade 2,53

Naturalidade 2,56

Fluidez 2,3

Segurança 2,4



Média 2,49

Extrato S8 final

Agradabilidade 2,4

Confiabilidade 2,8

Naturalidade 2,76

Fluidez 2,5

Segurança 2,83



Média 2,71

132

Extrato S6 final

Agradabilidade 3,86

Confiabilidade 3,76

Naturalidade 3,83

Fluidez 3,80

Segurança 3,63



Média 3,76

133

V2

Extrato S2 inicial

Agradabilidade 3,33

Confiabilidade 3,7

Naturalidade 3,2

Fluidez 3,56

Segurança 3,83



Média 3,58

Extrato S5 inicial

Agradabilidade 3,46

Confiabilidade 3,46

Naturalidade 3,13

Fluidez 3,13

Segurança 3,33



Média 3,38

134

Extrato S9 inicial

Agradabilidade 2,1

Confiabilidade 2,36

Naturalidade 2,46

Fluidez 2,2

Segurança 2,23



Média 2,38

Extrato S12 inicial

Agradabilidade 3,13

Confiabilidade 2,86

Naturalidade 2,8

Fluidez 2,7

Segurança 2,63



Média 2,85

135


Agradabilidade 3,76

Confiabilidade 3,56

Naturalidade 3,46

Fluidez 3,43

Segurança 3,53



Média 3,54

Extrato S8 medial

Agradabilidade 1,9

Confiabilidade 3,03

Naturalidade 2,63

Fluidez 2,83

Segurança 3,23



Média 2,77

136

Extrato S10 medial

Agradabilidade 2,03

Confiabilidade 2,93

Naturalidade 2,26

Fluidez 2,63

Segurança 3,13



Média 2,64

Extrato S6 medial

Agradabilidade 3,66

Confiabilidade 3,6

Naturalidade 3,56

Fluidez 3,6

Segurança 3,5



Média 3,58

137

Extrato S3 medial

Agradabilidade 2,36

Confiabilidade 2,4

Naturalidade 2,13

Fluidez 2,3

Segurança 2,33



Média 2,34


Agradabilidade 3,13

Confiabilidade 3,13

Naturalidade 3,06

Fluidez 3,1

Segurança 3,36


Compreensibilidade 3

Média 3,16

138

Extrato S7 final

Agradabilidade 1,73

Confiabilidade 3,13

Naturalidade 2,13

Fluidez 3,16

Segurança 3,63

Profissionalismo 3


Média 2,85

Extrato S1 final

Agradabilidade 2,7

Confiabilidade 3,36

Naturalidade 2,96

Fluidez 3,3

Segurança 3,26



Média 3,16

139

Extrato S11 final

Agradabilidade 2,23

Confiabilidade 3,03

Naturalidade 3,1

Fluidez 3,1

Segurança 3,8



Média 3,16

Extrato S4 final

Agradabilidade 3,5

Confiabilidade 3,73

Naturalidade 3,53

Fluidez 3,7

Segurança 3,46



Média 3,62

140

Extrato S7adicional V2

Agradabilidade 1,53

Confiabilidade 2,23

Naturalidade 1,73

Fluidez 2,13

Segurança 2,46



Média 2,11

141

V3


Agradabilidade 3,1

Confiabilidade 3,06

Naturalidade 2,83

Fluidez 2,9

Segurança 3,1



Média 2,97

Extrato S3 inicial

Agradabilidade 2,86

Confiabilidade 2,6

Naturalidade 2,5

Fluidez 2,36

Segurança 2,53



Média 2,59

142

Extrato S6 inicial

Agradabilidade 3,13

Confiabilidade 3,3

Naturalidade 3,23

Fluidez 3,06

Segurança 3,2



Média 3,24

Extrato S10 inicial

Agradabilidade 2,23

Confiabilidade 3,26

Naturalidade 3,13

Fluidez 3,56

Segurança 3,66



Média 3,28

143

Extrato S8 inicial

Agradabilidade 2,2

Confiabilidade 2,96

Naturalidade 2,73

Fluidez 2,73

Segurança 2,96



Média 2,89


Agradabilidade 1,5

Confiabilidade 2,56

Naturalidade 1,93

Fluidez 2,26

Segurança 2,96



Média 2,32

144

Extrato S11 medial

Agradabilidade 3,56

Confiabilidade 4,16

Naturalidade 3,86

Fluidez 4,1

Segurança 4,3



Média 4,05

Extrato S7 medial

Agradabilidade 2,46

Confiabilidade 3,16

Naturalidade 2,73

Fluidez 2,86

Segurança 3,3



Média 2,97

145

Extrato S4 medial

Agradabilidade 4,2

Confiabilidade 3,86

Naturalidade 3,76

Fluidez 3,66

Segurança 3,76



Média 3,82

Extrato S1 medial

Agradabilidade 3,93

Confiabilidade 3,96

Naturalidade 3,96

Fluidez 3,86

Segurança 4,03



Média 3,92

146


Agradabilidade 3,8

Confiabilidade 3,53

Naturalidade 3,56

Fluidez 3,5

Segurança 3,46



Média 3,57

Extrato S9 final

Agradabilidade 3,23

Confiabilidade 2,76

Naturalidade 2,56

Fluidez 2,4

Segurança 2,86



Média 2,74

147

Extrato S2 final

Agradabilidade 4,2

Confiabilidade 4,16

Naturalidade 4,16

Fluidez 4,23

Segurança 4,16



Média 4,19

Extrato S12 final

Agradabilidade 3,5

Confiabilidade 3,76

Naturalidade 3,6

Fluidez 3,8

Segurança 3,73



Média 3,69

148

Extrato S5 final

Agradabilidade 4,4

Confiabilidade 4,46

Naturalidade 4,36

Fluidez 4,5

Segurança 4,6



Média 4,47

149

ANEXO 8 – Resultados Avaliação Conteúdo Semântico-

Discursivo por Avaliador

Avaliador 1

INICIAL MEDIAL FINAL MÉDIA

E O S T E O S T E O S T

S1 5 5 5 5 2 3 2 2 5 5 5 5 4

S2 4 5 5 5 3 4 3 3 4 5 5 5 4,33

S3 1 1 1 1 1 1 0 1 2 1 1 1 1,00

S4 4 4 4 4 2 2 2 2 5 5 5 5 3,67

S5 4 3 3 3 5 5 5 5 3 4 3 3 3,67

S6 3 2 2 2 2 2 2 2 2 3 2 2 2,00

S7 4 4 3 4 3 2 2 2 5 5 5 5 3,67

S8 4 4 4 4 2 3 2 2 1 1 1 1 2,33

S9 4 4 3 4 2 3 2 2 2 2 3 2 2,67

S10 5 5 5 5 2 3 2 2 4 4 4 4 3,67

S11 4 4 5 4 3 3 2 3 2 3 2 2 3,00

S12 4 4 4 4 3 3 2 3 3 2 3 3 3,33

150

Avaliador 2



S1 5 5 4,8 5 5 4,5 4,8 4,5 5 5 4,8 5 4,83

S2 5 5 4,8 5 5 4,5 5 4,8 5 5 5 5 4,93

S3 0,5 0,5 0 0 3 2 2 2,5 4 2,5 2,5 3 1,83

S4 5 4,8 4,8 4,8 4 4 4 4 5 4,5 4,5 4,8 4,53

S5 5 4,8 5 5 5 4,5 5 4,8 5 5 5 5 4,93

S6 5 4 5 4 5 4,8 4,8 4,8 5 4,5 4,5 4,8 4,53

S7 4,5 5 5 4,5 5 4,8 4,8 4,8 5 5 5 5 4,77

S8 5 4,5 5 4,8 4,5 5 4,5 4,5 4 4 4 4,5 4,60

S9 5 4,8 4,8 4,8 4,5 4,8 4,5 4,5 4,5 4,5 4 4 4,43

S10 5 4,8 4,8 4,8 4,8 4,8 4,8 4,8 5 5 5 5 4,87

S11 4 4 4,5 4,5 4,5 4,5 4,5 4,5 4,8 5 4,8 4,8 4,60

S12 5 5 5 5 4,8 4,8 4,8 4,8 4,5 5 4,5 4,5 4,77

Avaliador 3



S1 4 5 5 5 4 4 5 4 4 5 5 5 4,67

S2 5 5 5 5 4 4 4 4 5 5 5 5 4,67

S3 0 0 2 2 2 2 2 2 3 4 3 3 2,33

S4 3 5 4 5 3 3 3 3 5 4 5 5 4,33

S5 4 5 5 5 5 5 5 5 4 5 5 5 5,00

S6 4 1 4 3 4 4 4 4 5 4 5 4 3,67

S7 4 4 5 5 4 4 4 4 5 5 5 5 4,67

S8 5 5 5 5 3 5 4 3 4 3 4 4 4,00

S9 5 5 5 5 4 5 4 4 4 4 4 4 4,33

S10 4 5 5 5 4 4 4 4 4 5 5 4 4,33

S11 3 5 5 4 4 5 4 5 4 5 4 5 4,67

S12 3 4 4 4 3 4 3 3 4 5 5 4 3,67