PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO
Layla Penha
A Importância da Prosódia na Avaliação de Qualidade e
na Compreensão e Compreensibilidade da Fala
Interpretada Simultaneamente
Mestrado em Linguística Aplicada e Estudos da Linguagem
São Paulo
2015
Layla Penha
A Importância da Prosódia na Avaliação de Qualidade e
na Compreensão e Compreensibilidade da Fala
Interpretada Simultaneamente
Dissertação apresentada à banca
examinadora da Pontifícia
Universidade Católica de São
Paulo, como exigência parcial para
obtenção do título de Mestre em
Linguística Aplicada e Estudos da
Linguagem, sob orientação da
Prof.ª. Drª. Sandra Madureira.
São Paulo
2015
AUTORIZO A REPRODUÇÃO E DIVULGAÇÃO TOTAL OU PARCIAL DESTE
TRABALHO, POR QUALQUER MEIO CONVENCIONAL OU ELETRÔNICO,
PARA FINS DE ESTUDO E PESQUISA, DESDE QUE CITADA A FONTE.
FICHA CATALOGRÁFICA
Penha, Layla.
A Importância da Prosódia na Avaliação de Qualidade e na Compreensão e
Compreensibilidade da Fala Interpretada Simultaneamente, 2015.
150 páginas
Dissertação de Mestrado apresentada à banca examinadora da Pontifícia
Universidade Católica de São Paulo, como exigência parcial para obtenção do
título de Mestre. Área de Concentração: Linguística Aplicada e Estudos da
Linguagem.
Orientador: Madureira, Sandra.
1. Intérprete de Conferências, 2. Interpretação Simultânea, 3. Prosódia, 4.
Qualidade na Interpretação, 5. Compreensão e Compreensibilidade na
Interpretação.
Layla Penha
A Importância da Prosódia na Avaliação de Qualidade e na Compreensão e
Compreensibilidade da Fala Interpretada Simultaneamente
Dissertação apresentada à banca
examinadora da Pontifícia
Universidade Católica de São
Paulo, como exigência parcial para
obtenção do título de Mestre em
Linguística Aplicada e Estudos da
Linguagem, sob orientação da
Prof.ª. Drª. Sandra Madureira.
Aprovada em: ___/___ /___
Banca Examinadora
Prof. Dr.:________________________________________
Instituição:_____________________ Assinatura:__________
Prof. Dr.:________________________________________
Instituição:_____________________ Assinatura:__________
Prof. Dr.:________________________________________
Instituição:_____________________ Assinatura:__________
AGRADECIMENTOS
Primeiramente, gostaria de agradecer a minha orientadora, Prof. Sandra
Madureira, por ter me acolhido no programa e por me apresentar ao mundo
acadêmico de forma tão generosa e ao mesmo tempo, tão profissional, sem
dúvida marca indelével pelo resto de minha vida. Também à Prof. Zuleica
Camargo, por sua competência e conhecimento, certamente um exemplo a ser
seguido, ao Prof. Mário Fontes, pela inestimável contribuição na análise
estatística deste trabalho, e à Prof. Lúcia Helena França, por suas sugestões,
correções e observações preciosas na leitura desta dissertação.
Aos incríveis colegas que participaram desta pesquisa, como sujeitos
avaliados e avaliadores, os quais não posso nomear, por razões de
confidencialidade, mas cuja disposição e coragem foram fundamentais para a
realização deste estudo.
Aos colegas do curso de pós-graduação em Linguística Aplicada da
PUC São Paulo, Amaury Guitar, Cris Magacho, Daniel Leão, Gabriela Daneluci,
Hosana Alves, Lilian Kuhn, Malu Waldow, Nathalia Reis, Renata Vieira e
Robinson Melo, por terem sido grandes parceiros de jornada, ombros amigos
nas lágrimas e companheiros das risadas, e em particular à Andrea Baldi, por
sua amizade, carinho e inestimável ajuda na revisão deste trabalho.
Aos colegas do Departamento de Inglês que atuam no Curso Sequencial
de Interpretação Glória Sampaio, Leila Darin, Luciana Carvalho, Reynaldo
Pagura e Vicky Weischtordt, por terem me dado a oportunidade de participar de
um programa tão importante na formação de intérpretes no Brasil.
Às minhas parceiras de trabalho e de vida, sócias do Grupo Coletivo de
Intérpretes, que acompanharam cada passo de meu caminho profissional e
educacional, Andrea Negreda, Carla Gazola, Cecilia Tsukamoto, Daniele
Fonseca, Emily Ruiz, Flávia Romano, Patrizia Copola e Suzana Gontijo.
Aos meus alunos, por sua receptividade, abertura, vontade de aprender
e experimentar, e ainda por me permitirem aplicar em aula muitas das lições
aprendidas durante este programa de mestrado.
Aos colegas intérpretes dedicados à formação de intérpretes, pesquisa e
aprimoramento da profissão, Branca Vianna, Carmen Nigro, Carla Nejm,
Christiano Sanches, Daniele Fonseca, David Coles, Denise Vasconcelos,
Jayme Pinto, Marcelle Castro, Paulo Silveira, Raffaella Quental e Raquel
Schaitza, aos quais admiro muito e que me serviram como exemplo neste
caminho.
E, finalmente, à minha incrível família, meu amado Beto Tibiriçá,
companheiro e parceiro de tantos anos, Isabella e Nuno, filhos tão queridos,
Edna e Lino Penha, pais sempre tão presentes – mesmo na ausência de um –
e ainda aos meus irmãos, cunhados e cunhadas, sogros, sobrinhos mais que
fantásticos e imprescindíveis agregados.
Sem todos e cada um de vocês, nada disso seria possível.
Layla
RESUMO
Penha, L. A Importância da Prosódia na Avaliação de Qualidade e na
Compreensão e Compreensibilidade da Fala Interpretada
Simultaneamente. [Dissertação]. São Paulo: Pontifícia Universidade Católica
de São Paulo, 2015.
Esta dissertação contempla a interpretação simultânea, modalidade inserida
dentro da área de Interpretação de Conferências. O objetivo deste estudo é
verificar as características prosódicas da fala semi-espontânea e da fala
interpretada de um grupo de intérpretes e analisar como as características da
fala interpretada podem influenciar a avaliação de qualidade e compreensão da
mensagem produzida pelo intérprete. Participam como sujeitos da pesquisa
doze intérpretes de conferência, do sexo feminino. As intérpretes foram
audiogravadas em uma fala semi-espontânea e durante a interpretação
simultânea de uma palestra. Três segmentos amostrais representativos do
discurso (nas posições inicial, medial e final da palestra) foram selecionados.
Foram realizados três tipos de estudo: um de natureza acústica, um de
natureza perceptiva da qualidade e compreensibilidade da produção oral dos
intérpretes e outro da qualidade da interpretação em relação ao discurso
interpretado em termos de conteúdo semântico-discursivo. Com a utilização do
software Praat, foram analisadas acusticamente as características prosódicas
da fala semi-espontânea das intérpretes e dos extratos selecionados,
comparando-os em termos de número e distribuição de grupos entoacionais e
pausas, taxa de elocução e frequência fundamental média, mínima e máxima.
Por meio de um questionário com base na escala de Likert aplicado a 90
juízes, foram avaliados os efeitos impressivos da produção oral dos intérpretes
e através de um protocolo de avaliação aplicado a 3 profissionais da área de
formação em interpretação foram comparadas as transcrições do discurso
produzido pelas intérpretes em relação ao discurso interpretado para
verificação da manutenção do sentido original (S), presença de erros (E) e de
omissões (O). Os resultados foram discutidos para verificação de similaridades
e diferenças entre as avaliações. Esse projeto foi aprovado pelo Comitê de
Ética em Pesquisa sob o no. 44465314.0.0000.5482.
Descritores: Intérprete de Conferências, Interpretação Simultânea, Prosódia,
Qualidade na Interpretação, Compreensão e Compreensibildade na
Interpretação
ABSTRACT
This paper addresses the area of simultaneous interpretation, interpreting mode
inserted in the field of Conference Interpreting. The purpose of this study is to
verify the prosodic features of semi-spontaneous and interpreted speeches of a
group of interpreters and analyze how such features may interfere in the
assessment of quality and comprehension of the message delivered in
interpretation. The subjects of this study were twelve female conference
interpreters. The interpreters were recorded when producing a semi-
spontaneous speech and during the simultaneous interpretation of a lecture.
Three sampling segments representing the speech (extracted from the start,
middle and end positions of the lecture) were selected. We conducted three
types of assessment: an acoustic analysis of the selected speech samples, a
perceptive assessment on the quality and comprehensibility of interpreters’ oral
production, and an assessment on the quality of the content of the interpretation
compared to the original lecture. Using the software Praat, we analyzed the
prosodic features of interpreters’ semi-spontaneous and interpreted speeches
acoustically, comparing them in terms of number and distribution of intonation
groups and pauses; speech rate; and average, minimum and maximum
fundamental frequency rates. By means of a questionnaire based on the Likert
Scale applied to 90 judges, we assessed the impressive effects of interpreters’
oral production. Three interpreter trainers followed an assessment protocol to
compare the speech produced by interpreters and the original lecture and verify
completeness of original sense (S), errors (E) and omissions (O). Results were
then compared for similarities and differences. This project was approved by the
Brazilian Research Ethics Committee under no. 44465314.0.0000.5482.
Key words: Conference Interpreter, Simultaneous Interpreting, Prosody,
Comprehension and Comprehensibility in Interpretation, Quality in
Interpretation.
Lista de Tabelas
Tabela 1. Comparação da classificação dos critérios de qualidade de acordo
com Chiaro e Nocella (2004) e Bühler (1986) (Pochhacker, 2013)...................39
Tabela 2. Intérpretes sujeitos da pesquisa, com respectivas idades e tempo de
exercício da profissão........................................................................................57
Tabela 3. Juízes Avaliadores, com respectivas idades, anos de exercício da
profissão e anos de experiência na formação de intérpretes............................63
Tabela 4. Taxa de Elocução média em palavras por minuto verificada em
diferentes modos de fala para o Inglês Britânico.......................................…….68
Tabela 5. Número de palavras por minuto produzidas por cada um dos Sujeitos
e Palestrante, contemplando: Fala Original (O), nas posições Inicial (I), medial
(M) e Final (F); Fala Semi-espontânea (SE); e Segmentos Interpretados de
cada intérprete nas posições Inicial (I), Medial (M) e Final (F)..........................69
Tabela 6. Resultados obtidos com o levantamento de ocorrências e medições
de parâmetros acústicos. Da esquerda para a direita: tipos de segmentos de
fala analisados, sua duração total, número de palavras por segundo e por
minuto, número de grupos entoacionais, número de pausas total, número de
pausas por segundo, número de alongamentos vocálicos percebidos e valores
de frequência fundamental (média, valor mínimo e valor máximo)...................70
Tabela 7. Perfil dos juízes em cada versão da avaliação perceptiva, V1, V2 e
V3, mostrando números percentuais e absolutos de participantes em cursos de
Tradução ou de Interpretação e se foram concluídos ou estão em
andamento.................................................................................................…….73
Tabela 8. Resultados médios ponderados da avaliação dos segmentos
adicionais em cada Versão (V1, V2 e V3).........................................................74
Tabela 9. Resultados médios ponderados finais da avaliação de cada
intérprete nos extratos interpretados, por segmento Inicial (I), Medial (M) e Final
(F)......................................................................................................................75
Tabela 10. Média ponderada final de cada quesito por sujeito (compilação dos
segmentos inicial, medial e final).......................................................................77
Tabela 11. Classificação final de cada sujeito por avaliador (compilação dos
segmentos inicial, medial e final).......................................................................78
Tabela 12. Nota final atribuída a cada sujeito por avaliador, média dos três
avaliadores e classificação dos sujeitos............................................................79
Tabela 13. Comparação das médias finais ponderadas das avaliações das
transcrições e dos arquivos sonoros.................................................................80
Tabela 14. Compreensibilidade atribuida a cada sujeito por extrato (Inicial,
Medial e Final), totalizando as porcentagens de compreensibilidade alta (muito
e extremamente), media (nem muito nem pouco) e baixa (pouco e nada).......82
Tabela 15. Resultados do Sujeito 11 por extrato (Inicial, Medial e Final),
mostrando o número de Grupos Entoacionais (GE), Número de Pausas (P) e
Número de Alongamentos Vocálicos (AV).........................................................84
Tabela 16. Valores de LG em relação a cada grupo de variáveis: Gc1
(acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição)......88
Tabela 17. Valores de RV em relação a cada grupo de variáveis: Gc1
(acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição)......88
Tabela 18. Representatividade dos grupos nas 5 Dimensões (Dim 1,2,3,4 e 5)
Gc1 (acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da
transcrição)........................................................................................................88
Tabela 19. Variáveis da Dimensão 1 (Dim, 1)...................................................92
Tabela 20. Variáveis da Dimensão 2 (Dim, 2)...................................................92
Lista de Figuras
Figura 1. Avaliação dos critérios de qualidade para a interpretação simultânea
de acordo com intérpretes e participantes de conferência................................35
Figura 2. Padrões perceptivos de pitch, loudness e duração da fala e seus
correlatos acústico e fisiológico.........................................................................48
Figura 3. Forma da onda, espectrograma de banda larga de emissão da
palavra “fogo” com camada de segmentação dos segmentos consonantais e
vocálicos............................................................................................................49
Figura 4. Extrato de segmento analisado, contendo, de cima para baixo, as
camadas de: forma de onda com as demarcações dos pulsos glotais em azul,
espectrograma de banda larga com traçados de frequência fundamental (em
azul) e intensidade (em amarelo) superpostos, camada com identificação dos
Grupos Entoacionais, da Pausa e dos Alongamentos Vocálicos
percebidos..................................................................................................…....61
Figura 5. Forma de onda do corpus de gravação completo, incluindo no
primeiro bloco (à esquerda) a fala semi-espontânea das intérpretes e, no
segundo bloco (à direita), sua fala interpretada................................................65
Figura 6. Forma de onda, espectrograma de banda larga com superposição do
traçado de frequência fundamental, camada de divisão dos grupos
entoacionais (GE), camada com as delimitações das pausas silenciosas e
camada com as delimitações dos alongamentos vocálicos (AV) na fala semi-
espontânea do S2..............................................................................................67
Figura 7. Dendograma com a distribuição dos sujeitos em clusters.........…….85
Figura 8. Distribuição dos sujeitos de acordo com as Dimensões 1 e 2 (Dim 1 e
Dim 2) do espaço vetorial..................................................................................86
Figura 9. Distribuição dos sujeitos de acordo com o estilo de fala interpretada
(I) e de fala semi-espontânea (E)......................................................................87
Figura 10. Relevância dos grupos de vriaáveis de maior para menor: Gc1
(acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da
transcrição)........................................................................................................89
Figura 11. Distribuição das variáveis nas Dimensões 1 e 2 (Dim1 e
Dim2)..........................................................................................................….90
Figura 12. Distribuição de todas as variáveis dos três grupos: Gc1 (acústico),
Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição) nas Dimensões
1 e 2 (Dim,1 e Dim,2).........................................................................................91
Sumário Introdução ................................................................................................................................... 15
Capítulo 1 - Perspectiva Histórica da Interpretação ................................................................... 22
1.1 A Interpretação Consecutiva ......................................................................................... 23
1.2 A Interpretação Simultânea .......................................................................................... 25
1.3 A Interpretação no Futuro ............................................................................................. 30
Capitulo 2 - Avaliação de Qualidade na Interpretação ............................................................... 32
Capítulo 3 - Fundamentação Teórica .......................................................................................... 44
3.1 O Modelo dos Esforços e a Fala do Intérprete .............................................................. 45
3.2 Prosódia ......................................................................................................................... 47
3.3 Pausa ............................................................................................................................. 51
3.4 Entoaçâo ........................................................................................................................ 53
3.5 Pitch Accent ................................................................................................................... 55
Capítulo 4 - Metodologia............................................................................................................. 57
4.1 Participantes Sujeitos da Pesquisa ................................................................................ 57
4.2 Procedimentos metodológicos ..................................................................................... 58
Capítulo 5 - Resultados ................................................................................................................ 65
Capítulo 6 - Conclusão ................................................................................................................. 94
Referências Blibliográficas .......................................................................................................... 99
ANEXO 1 - Transcrição da Palestra Original .............................................................................. 104
ANEXO 2 - Extratos Segmentos Inicial, Medial, Final e Adicional ............................................. 108
ANEXO 3 – Distribuição dos extratos de fala em cada versão de avaliação ............................. 117
ANEXO 4 - Instruções para Avaliação dos Extratos de Fala ....................................................... 118
ANEXO 5 – Instruções para Avaliação das Transcrições............................................................ 121
ANEXO 6 – Forma de Onda do Corpus de Gravação Completo – Fala Semi-espontânea + Fala
Interpretada de Cada Intérprete ............................................................................................... 122
ANEXO 7 – Resultados Ponderados Médios Finais da Análise Perceptiva por Extrato – Versões
1, 2 e 3 ....................................................................................................................................... 125
ANEXO 8 – Resultados Avaliação Conteúdo Semântico-Discursivo por Avaliador ................... 149
15
Introdução
No trabalho de interpretação simultânea, o intérprete produz uma fala
em que utiliza palavras de sua escolha, mas que ao mesmo tempo está
pautada pelo discurso do outro. Esta fala singular não é, portanto, nem
completamente espontânea, nem completamente guiada ou laboratorial, e suas
características merecem ser estudadas em maior profundidade, pois há
escassez de trabalhos nessa área (SCHLESINGER, 1994; COLLADOS AÍS,
1998; HOLUB, 2010; RENNERT, 2010; LENGLET. 2015). Apesar de escolher
suas palavras, o intérprete precisa esperar o discurso original para
compreender seu significado, lógica e registro. Só a partir de então poderá
construir sua fala – que compreenderá vocabulário, estrutura gramatical,
entoação, posicionamento de adjetivos e advérbios, registro de formalidade,
etc. – e que poderá ser parecida ou completamente diferente da estrutura que
usaria fora da cabine de interpretação.
Tradicionalmente, embora se considere desejável que o intérprete
produza uma fala expressiva, as questões prosódicas assumem um papel
secundário na definição e avaliação da qualidade do trabalho do intérprete.
Estudos realizados entre intérpretes e ouvintes usuários da interpretação
mostram que os aspectos prosódicos são considerados menos relevantes na
avaliação dos itens que contribuem para a qualidade da interpretação e
aparecem em uma lista de importância atrás dos critérios linguísticos, mais
atrelados à consistência de sentido, coesão lógica e outros (BÜHLER, 1986;
KURZ, 1989, MOSER 1996; CHIARO E NOCELLA, 2004; PÖCHHACKER e
ZWISCHENBERGER, 2010). No entanto, quando os mesmos avaliadores têm
como tarefa analisar a produção oral dos intérpretes, estes tendem a atribuir
maior qualidade e mais alto nível de compreensibilidade àquelas versões que
são superiores nas mesmas características prosódicas consideradas menores
na avaliação da qualidade do trabalho do intérprete, como voz agradável,
vivacidade e fluência, sugerindo que talvez os elementos prosódicos sejam
igualmente importantes na avaliação de qualidade e compreensibilidade da
interpretação.
16
O objetivo deste estudo é verificar as características prosódicas da fala
da fala interpretada de um grupo de intérpretes, tendo como contraponto a sua
fala semi-espontânea e analisar como tais características podem influenciar a
avaliação de qualidade e compreensão da mensagem produzida pelo
intérprete. A interpretação é uma atividade completamente baseada na fala,
tanto como fonte quanto como resultado final. A abordagem tradicional nas
pesquisas sobre a qualidade da produção do intérprete tenta dissociar os
elementos prosódicos de outros elementos linguísticos de uma produção que é
exclusivamente verbal/vocal. Tentar traçar uma linha entre sentido e produção
vocal sem levar em consideração as características prosódicas da fala é
ignorar que a produção vocal carrega também sentido em si, e que esse
sentido contribui para a avaliação de qualidade atribuída unicamente aos
quesitos linguísticos encontrados em tais pesquisas.
Este trabalho é pioneiro ao enfocar a prosódia da fala de um grupo de
intérpretes trabalhando para o português brasileiro (PB) e poderá contribuir
para uma maior reflexão sobre o trabalho de interpretação. Como mencionado
no caput desta introdução, a fala do intérprete é singular em suas
características prosódicas e merece uma descrição na literatura. Conhecer as
características prosódicas e como estas podem afetar positiva ou
negativamente a avaliação do trabalho de interpretação pode nos ajudar a
melhorar a formação do intérprete, e trabalhar com as características da fala de
forma mais proativa em nossos cursos.
Também importante aqui é situar a profissão e formação do intérprete de
conferências e a avaliação de qualidade desta profissão dentro de uma
perspectiva histórica e espacial. À medida que nos aproximamos do centenário
da atividade de interpretação de conferência, a reflexão crítica sobre o passado
pode orientar a proposição de metas e contribuir para o futuro da profissão.
Esta dissertação compreende 6 capítulos. Os próximos parágrafos
trazem um breve relato de cada um deles e a explicação do porquê de sua
escolha.
17
No capítulo 1, abordaremos a interpretação de conferências de uma
perspectiva histórica.
A história da interpretação perpassa a história da humanidade. A figura
do intérprete sempre esteve presente desde que o homem passa a se
comunicar por meio da linguagem, e diferentes povos desenvolvem línguas
diferentes. Com efeito, a referência mais antiga à profissão vem do Egito
Antigo, em um baixo-relevo no túmulo de um príncipe de Elefantina datado
3000 anos AC.
Ao longo dos tempos, os intérpretes estiveram a serviço de missionários
e comerciantes, generais e revolucionários, imperadores e conquistadores,
embora os diplomatas, até a 1ª guerra mundial, basicamente utilizassem o
francês. A partir da mudança conjuntural do mundo pós primeira guerra – e da
reorganização política que se sucede – a profissão de intérprete de
conferência, como conhecemos hoje, é introduzida.
Neste capítulo visitaremos um pouco a história da interpretação de
conferências e da formação deste novo intérprete, e como a introdução da
tecnologia influenciou modificações nesta prática. Também analisaremos as
diferentes modalidades da interpretação de conferências formadas ao longo do
tempo, na tentativa de traçar um panorama global da profissão – de seus
primórdios até os dias de hoje. O objetivo aqui, obviamente, não é esgotar o
tema em apenas um capítulo, o que não seria de qualquer forma possível, mas
trata-se de uma perspectiva importante para melhor situar os leitores sobre
esse trabalho tão específico e ainda tão pouco estudado, suas principais
características e desafios.
No capítulo 2, abordaremos as pesquisas de avaliação de qualidade na
interpretação. A tarefa de se avaliar a qualidade de uma interpretação não é
fácil e levanta muitas questões. A primeira delas diz respeito a quem deve
caber a avaliação de qualidade. O ouvinte da interpretação, àquele para qual a
interpretação está sendo feita, só pode, na verdade, avaliar a produção final da
18
interpretação, sem ter meios de compará-la com o discurso original e
consequentemente, não pode julgar se ela transmite plenamente a mensagem
original – razão pela qual, supostamente, ela está acontecendo.
Por outro lado, de acordo com KAHANE (2000), a tarefa de
comunicação da mensagem interpretada está sujeita ao cenário em que está
inserida e deve ser parte de um contexto. Diferentes contextos trazem
diferentes exigências e, portanto, a avaliação da qualidade da interpretação vai
necessariamente depender de seu contexto. Não há, portanto, possibilidade de
uma avaliação absolutamente objetiva:
“Uma definição simplista da tarefa ou função da interpretação é a
de mediação para facilitar a comunicação entre falante e ouvinte.
Igualmente simples seria adicionar que a interpretação simultânea (IS)
que melhor alcance este objetivo seria, por definição, da melhor
qualidade. Talvez este possa ser o modelo ideal, mas na verdade
sabemos que o assunto é mais complexo. A função de mediação do
intérprete não é clara: será mediação ou interferência? Não nem mesmo
temos ideia clara da relação falante-ouvinte. É melhor para o intérprete
se integrar nesta relação ou ser parte fora dela? Como é essa relação?
Como pode variar? Qual é o propósito da situação onde a comunicação
acontece? É uma grande conferência ou uma pequena reunião de
pessoas que já se conhecem? Quais são as intenções e expectativas
mútuas dos participantes? Onde está e quem é o ouvinte, e quais suas
qualidades e expectativas, etc?1 KAHANE (2000, p. 1)
1 “One simplistic definition of the interpreter's task or function is that of
mediation to facilitate communication between speaker and listeners. It would be
equally simple to add that the simultaneous interpretation (SI) that best achieves that
goal would by definition be of the best quality. That may be the ideal model, but in
actuality we know things are more complex. The interpreter's mediating function is not
clear: is it mediation or interference? We do not even have a clear idea of the speaker-
listener relationship. Is it better for the interpreter to integrate into that relationship or
to stay outside it? What are speaker-listener relationships like? How do they vary?
What is the purpose of the situation wherein communication is taking place? Is it a
multitudinous conference or a small meeting of people already well acquainted with
each other? What are the mutual intentions and expectations of the participants? Where
is or who supposedly is the listener, and what qualities and expectations does he have,
19
A despeito de todas essas dificuldades, tentativas de pesquisa de
qualidade em interpretação continuam a ser produzidas desde o trabalho de
Bühler (1986), marco fundamental na pesquisa da área, até os dias de hoje.
Apesar de pequenos, importantes avanços foram atingidos e assimilados
desde então. O propósito deste capítulo é revistar as mais importantes
pesquisas realizadas na área desde 1986, criando assim a base para caminhos
para estudos futuros.
No capítulo 3, abordaremos as questões concernentes às características
prosódicas da fala. O objetivo deste capítulo é abordar a prosódia, descrever
suas características e funções, e o significado e as implicações de cada um
dos elementos prosódicos encontrados na fala do intérprete, a partir da
descrição desenvolvida por Miriam Schlesinger em 1994.
O intérprete comunica sua mensagem através da voz, seguindo tanto
um código linguístico como um código não verbal. Os sinais produzidos por
ambos os códigos podem estar separados, unidos, ou em contraposição um ao
outro (COLLADOS AÍS, 1998). Entender primeiramente o código não verbal do
intérprete através de sua produção prosódica e, a posteriori, entender o que
essa produção pode transmitir em termos de sentido parece condição sine qua
non para se possa investigar a avaliação de qualidade e compreensão da fala
do intérprete.
No capítulo 4, descrevemos a metodologia da pesquisa realizada para
esta dissertação, mostrando o passo a passo das diferentes avaliações e
análises conduzidas.
O grande desafio deste estudo foi desenvolver uma pesquisa que fosse
abrangente o suficiente para atender todos os objetivos aqui propostos, ou
etc?” Exceto quando de outra forma apontado, todas as traduções inseridas no texto
foram realizadas pela autora deste estudo.
20
seja, tanto a análise, caracterização da fala interpretada em relação à semi-
espontânea do intérprete quanto à verificação da interferência de diferentes
padrões melódicos e rítmicos na avaliação de qualidade e compreensão da
mensagem produzida na interpretação. Para tanto, diferentes tipos de análise
foram realizados a partir de um mesmo corpus – a fala semi-espontânea e a
interpretação de um discurso produzidas por doze intérpretes diferentes.
As intérpretes foram audiogravadas em uma fala semi-espontânea e
durante a interpretação simultânea de uma palestra. Três segmentos amostrais
representativos do discurso (nas posições inicial, medial e final da
palestra) foram selecionados. Foram realizados três tipos de estudo: um de
natureza acústica, um de natureza perceptiva da qualidade e
compreensibilidade da produção oral dos intérpretes e outro da qualidade da
interpretação em relação ao discurso interpretado em termos de conteúdo
semântico-discursivo.
Com a utilização do software Praat, foram analisadas acusticamente as
características prosódicas da fala semi-espontânea das intérpretes e dos
extratos selecionados, comparando-os em termos de formação de grupos
entoacionais, número e distribuição de pausas, taxa de elocução e frequência
fundamental média, mínima e máxima. Por meio de um questionário com base
na escala de Likert aplicado a 90 juízes, foram avaliados os efeitos impressivos
da produção oral dos intérpretes e através de um protocolo de avaliação
aplicado a 3 profissionais da área de formação em interpretação foram
comparadas as transcrições do discurso produzido pelas intérpretes em
relação ao discurso interpretado para verificação da manutenção do sentido
original (S), presença de erros (E) e de omissões (O). Os resultados foram
discutidos para verificação de similaridades e diferenças entre as avaliações.
No capítulo 5, abordamos os resultados da pesquisa, seguindo os
mesmos passos descritos na metodologia. Assim, iniciamos o capítulo com os
resultados da avaliação acústica da fala de cada intérprete, tanto no modo de
fala interpretada quanto na semi-espontânea, trazendo uma comparação entre
as duas modalidades. A seguir, descrevemos os resultados da análise
21
perceptiva da fala do intérprete e do protocolo de análise do conteúdo das
interpretações. Na etapa final do capítulo, comparamos os resultados das
diferentes análises, tentando identificar as similaridades e diferenças
encontradas.
O capítulo 6 conclui esta dissertação e aponta algumas direções para
futuros estudos na área. Este trabalho prova-se importante por pela primeira
vez caracterizar a fala do intérprete trabalhando para o Português Brasileiro e
compará-la aos achados da literatura para falas interpretadas em outros
idiomas. Também traça relações interessantes entre os resultados obtidos
pelos intérpretes nas diferentes fases de avaliação, tentando estabelecer elos
entre o conteúdo semântico da fala interpretada, sua produção acústica e as
percepções de qualidade e compreensibilidade que derivam dela.
Certamente outros trabalhos serão necessários para entendermos mais
completamente a fala interpretada e suas características prosódicas, quais os
elementos que mais afetam positiva ou adversamente a mensagem proferida
pelo intérprete e como poderemos abordar estas questões na formação de
novos intérpretes.
Os resultados obtidos neste estudo, no entanto, serão um bom ponto de
partida para investigações vindouras.
22
Capítulo 1 - Perspectiva Histórica da Interpretação
Como vimos na introdução deste trabalho, a interpretação como
transferência oral de uma mensagem entre dois falantes que não podem – ou
não querem – comunicar-se na mesma língua, já existe há milhares de anos.
Neste capítulo, vamos visitar um pouco desta história.
Na Grécia e na Roma Antiga, os serviços de interpretação eram
corriqueiros, uma vez que poucos Romanos e Gregos se davam ao trabalho de
aprender as línguas dos povos conquistados – algo que acreditavam ser
abaixo de sua dignidade. Assim, a utilização de intérpretes também tinha uma
dimensão política, pois era preciso que estivessem presentes mesmo quando
não necessários a fim de demonstrar a superioridade greco-romana. O serviço
era geralmente prestado por escravos ou representantes dos povos dominados
que não tinham nenhum status social.
A partir da Idade Média, a profissão começa a ser mais valorizada, com
intérpretes desempenhando um papel importante nas negociações
internacionais em tempos de guerra e paz, nas expedições comerciais, na
disseminação do Cristianismo durante as Cruzadas e também nos
monastérios, tanto facilitando a comunicação entre monges de diferentes
nacionalidades e origens, quanto acompanhando missionários em suas
viagens ao estrangeiro.
Conhecidos na Europa desde o século 13, os dragomanos ou turgimões
eram os intérpretes formados pelo Império Otomano para atuar na
comunicação com os países europeus.
A era das grandes descobertas é outro marco para a interpretação,
quando os navegadores começam a lançar mão dos serviços de nativos
capturados ou de conquistadores que são feitos prisioneiros e depois libertados
e que aprendem a língua de seus algozes durante o período de cativeiro.
23
Exemplos de ambos os casos são encontrados em várias partes do mundo,
como os “intérpretes residentes” no Canadá, nativos de francês que se
estabelecem entre os Huronianos e Iroqueses; os “meninos língua” de
Portugal, meninos de rua recolhidos por padres jesuítas e enviados ao Brasil
para aprender o idioma nativo e ajudar na comunicação entre portugueses e
índios; e a índia Malinche, no México, que ajuda os espanhóis a se comunicar
com os nativos. Relatos similares aparecem nas histórias da exploração da
África e Ásia.
Na Europa, a soberania política da França torna aos poucos o francês a
língua franca da diplomacia, movimento esse rejeitado por muitos países. O
imperador da Áustria, Leopoldo I, prefere o italiano como língua da corte.
Também os otomanos recusam o francês – e o latim – no contato com os
países europeus. Assim, cada corte formava seus próprios intérpretes, com
escolas em Constantinopla, Viena e Veneza.
É só ao final da primeira guerra mundial, no entanto, que a profissão de
intérprete de conferência começa a tomar sua forma atual, primeiramente na
modalidade hoje conhecida como Interpretação Consecutiva. É então que os
primeiros intérpretes são formados nessa ‘nova’ modalidade.
1.1 A Interpretação Consecutiva
Como mencionado na seção anterior, o francês era considerado o
idioma oficial da diplomacia, posição ocupada até a primeira guerra mundial.
No pós-guerra, as reuniões entre os países vitoriosos se intensificam,
culminando na Conferência de Paz de Paris, em 1919, que por sua vez leva à
assinatura do Tratado de Versalhes, finalmente selando a paz entre os aliados
e a Alemanha. Setenta delegados representando a coligação dos 27 países
vitoriosos participam da Conferência. Presenças essenciais do encontro, o
Presidente americano Woodrow Wilson e o Premier britânico Lloyd George,
ambos não falantes de francês, conseguem com que o inglês se torne um dos
idiomas oficiais da conferência.
24
É exatamente para a ocasião que temos os primeiros registros da
descrição da modalidade ‘Interpretação Consecutiva de Conferência’ e
formação do intérprete, ainda que de forma muito rudimentar. A interpretação
consecutiva seria produzida pelo intérprete após terminada a intervenção do
orador. Sem contar com nenhum tipo de suporte eletrônico, o intérprete deveria
se posicionar próximo ao orador, ouvir e tomar notas do que fosse dito por
alguns minutos, e depois produzir sua fala.
Como a profissão de intérprete de conferências a rigor não existia na
época, não havia disponibilidade de intérpretes profissionais. Era, portanto,
preciso recrutar pessoas que tivessem um bom conhecimento de ambos os
idiomas e uma certa cultura geral para atuarem como intérpretes. Era este o
caso de Paul Mantoux (intérprete chefe da conferência), Jean Herbert e
Gustave Camerlynck, e tantos outros que atuaram na conferência. Todos
tinham algum tipo de experiência em interpretação, embora não na modalidade
de conferência. Camerlynck já havia servido como intérprete para a Artilharia
Britânica na Primeira Guerra, assim como Mantoux, intérprete oficial dos
generais britânicos alocados em Flandres, e Jean Herbert havia interpretado
para autoridades francesas na residência de Lloyd George em Londres, em
1917. Entretanto, como bem coloca Baigorri-Jalón (1999, p. 01):
“Ninguém – incluindo os próprios intérpretes – tinha uma ideia clara do
que a tarefa exigia. Foi preciso improvisar e aprender no fazer2”.
Ou ainda nas palavras do próprio Jean Herbert:
“Ainda bem que minhas interpretações não foram gravadas, porque se
as ouvisse agora certamente ficaria ruborizado. No entanto, foi o melhor
que podia ser feito à época e, por incrível que pareça, foi apreciado3
(HERBERT:1978, p. 6 em BAIGORRI JALÓN, 1999).
2 ‘No one — including the interpreters themselves — had a clear idea of the tasks entailed. They had
to improvise and learn on the job.’ 3 ‘I am grateful that my interpretations were not recorded, because if I heard them now I should
25
Apesar das dificuldades, a interpretação consecutiva foi considerada um
sucesso e muitos dos intérpretes originais acabaram tornando-se formadores
das próximas gerações de intérpretes, uma vez que o modelo foi
imediatamente replicado nas instituições formadas a partir dessa conferência,
ou seja, a Liga das Nações, a OIT, Organização Internacional do Trabalho, e o
Tribunal Permanente de Justiça Internacional, todas elas instituindo o francês e
o inglês como línguas oficiais e lançando mão da interpretação consecutiva em
suas reuniões de trabalho.
No entanto, embora a modalidade fosse considerada bastante eficiente
e os intérpretes admirados por seus serviços, o processo tornava as reuniões
excessivamente longas e logo foram empenhados esforços para o
desenvolvimento de um novo método de interpretação que demandasse menos
tempo e fosse mais vantajoso para os participantes. Vem dessa necessidade o
investimento na criação de uma tecnologia que possibilitasse que o discurso
original e o discurso interpretado fossem proferidos de forma simultânea.
Investimentos em uma nova tecnologia mudaram o rumo da
interpretação de conferências, dando surgimento a uma nova modalidade até
então inexistente – a interpretação simultânea com equipamento.
1.2 A Interpretação Simultânea
É preciso deixar claro que sempre houve, na história da interpretação,
um modo simultâneo de se traduzir a mensagem. Na modalidade de
interpretação hoje conhecida por chuchotage ou whispering, o intérprete
traduzia simultaneamente um discurso ao ouvido do interlocutor, sem a
utilização de equipamento. Apesar de pequenos ajustes em termos de controle
do volume de voz, não há diferença entre o trabalho de interpretação
simultânea em cabine e a chuchotage. No entanto, a interpretação simultânea
com equipamento é uma invenção do século XX e é sobre ela que
certainly blush. However, that was the best that could be done at the time and, strange as it may
sound, it was appreciated.’
26
discorreremos a seguir.
Existem muitas referências à utilização da interpretação simultânea
antes dos Julgamentos de Nuremberg, certamente o grande marco do
“nascimento” da modalidade. As informações, no entanto, são bastante
contraditórias e incompletas.
Na versão ocidental, o primeiro equipamento de interpretação
simultânea foi inventado por um engenheiro inglês chamado Gordon Finlay. A
ideia original veio do empresário americano Edward Filene, ao participar da
reunião da Liga das Nações em 2 de abril de 1925 e verificar os problemas
derivados da interpretação consecutiva. Em uma carta ao Secretário Geral da
Liga das Nações na época, Sir Eric Drummond, Edward Filene explica como
funcionaria o equipamento. Deve-se observar que a ideia de Filene descrevia
uma modalidade de interpretação simultânea diferente do que temos hoje,
quando o intérprete traduz diretamente do áudio original. No esquema proposto
por ele, o intérprete faria a interpretação com base em textos que lhes eram
disponibilizados com bastante antecedência. Os intérpretes traduziriam os
textos antes da sessão e depois leriam os textos pré-traduzidos
simultaneamente ao discurso original.
Finlay foi chamado para colocar a ideia em prática. Para montar o
sistema, utilizou equipamentos de telefonia já existentes no mercado, o que
deu à nova modalidade de interpretação o nome de “interpretação telefônica”.
Em 27 de novembro de 1926, é anunciado um curso preparatório de 4 a 6
semanas em “interpretação telefônica”. Ao final, 24 alunos seriam escolhidos
por exame para receber treinamento adicional até abril de 1927. Como na
época o padrão de qualidade em intepretação era a interpretação consecutiva,
vem daí a alcunha pouco elogiosa de “telefonistas” que os intérpretes mais
tradicionais atribuíram aos primeiros intérpretes simultâneos. Por envolver uma
parafernália de cabos, microfones e fones de ouvido, o processo a princípio
não foi muito popular entre os intérpretes, que temiam ser condenados a uma
tarefa menor, repetindo palavra por palavra o que ouviam sem tempo de refletir
sobre o discurso e reformulá-lo de forma elegante.
27
A invenção é primeiramente oferecida à AT&T, mas é a IBM que aceita
participar no desenvolvimento do equipamento de interpretação simultânea,
patenteado em 1926 e utilizado pela primeira vez, de acordo com autores
ocidentais, na reunião da Conferência Internacional do Trabalho, em junho de
1927. Um relatório escrito por A. Gordon-Finlay na época observa: “A
experiência nos mostra que este é um trabalho de natureza difícil e exata, que
demanda qualidades especiais dos intérpretes e particularmente fatigante
devido ao grau de concentração envolvido”.
O boletim da Liga das Nações de agosto de 1927 menciona a utilização
do novo "Intérprete Elétrico", desejando que a nova modalidade de
interpretação ajudasse a comunicação daqueles que estavam aprisionados em
sua própria língua, dando assim o impulso necessário para sua disseminação.
Os russos, no entanto, discordam desta versão. Para eles, o primeiro
registro de utilização de tecnologia para a interpretação simultânea na então
União Soviética monta de 1928. Na "História da Interpretação Simultânea",
Flerov (2013), afirma que a interpretação simultânea foi utilizada na União
Soviética pela primeira vez no VI Congresso Mundial da Internacional
Comunista em 1928. A revista Krasnaya Niva daquele ano mostra uma foto dos
intérpretes sentados em poltronas em frente ao pódio. À volta de seus
pescoços, podemos ver um equipamento ligado a um microfone. Não há fone
de ouvido, o som vem diretamente do pódio.
Alguns anos mais tarde, na XIII Sessão do Comitê Executivo da
Internacional de 1933, os intérpretes já se posicionavam em cabines, captando
o áudio original a partir de fones de ouvido.
Em 1935, o XV Congresso de Fisiologia Internacional, em Leningrado, é
aberto com o discurso de Ivan Pavlov, interpretado simultaneamente do Russo
para o Francês, Inglês e Alemão. Os participantes do congresso recebem
instruções em como utilizar o equipamento de intepretação simultânea. Mais
uma vez, há relatos de que os intérpretes recebem o discurso de Pavlov por
28
escrito com antecedência e apenas leem a tradução simultaneamente.
Até então utilizado apenas esporadicamente antes da segunda guerra
mundial, é em 1945 que o sistema de interpretação simultânea tem sua prova
de fogo. O responsável por sua utilização nos Julgamentos de Nuremberg é o
Coronel Léon Dostert, intérprete pessoal do General Eisenhower, que é
chamado a Nuremberg para achar uma solução prática que possa driblar o
problema da barreira linguística entre acusados, promotoria e defesa.
São quatro línguas oficiais dos Julgamentos de Nuremberg - Inglês,
Francês, Russo e Alemão. O uso da interpretação consecutiva é afastado,
porque isso faria com que os julgamentos se alongassem por demais. Leon
Dostert fica encarregado de organizar a interpretação simultânea dos
julgamentos, o que significa recrutar e treinar equipes de intérpretes, muitos
dos quais não tinham nenhuma experiência de trabalho, muito menos com a
interpretação simultânea. A exemplo do que acontecera na Conferência de
Paris, parte do treinamento acontece durante a execução do trabalho em si,
como contam dois intérpretes da época:
“Os monitores acompanhavam constantemente nosso desempenho,
corrigindo erros e sugerindo maneiras para melhorarmos. Pediram que eu
abaixasse meu tom de voz, o que fiz4”. Patricia Vander Elst (2000)
“Não tínhamos nenhuma experiência em que nos apoiar e tivemos que
desenvolver as habilidades necessárias por nossa conta. Os intérpretes
precisavam ter capacidade linguística e mental para lidar com o desafio...5”
Siegfried Ramler (2008, pg. 50)
Apesar das dificuldades, o novo método de interpretação se prova
indispensável no julgamento de Nuremberg, não só atendendo plenamente a
necessidade de diminuição de tempo de interpretação, mas também se
4 ‘The monitors would keep a close watch on our performance and would tell us where we went wrong and how to improve our delivery. I was told to pitch my voice lower, which I did’. 5 ‘We had no body of experience to draw on, and had to develop the necessary skills on our own. It required interpreters who were lingusitically and mentally able to rise to that challenge...’
29
mostrando satisfatório em termos de qualidade e exatidão das informações
fornecidas. Os bons resultados são o marco inicial da ascensão da
interpretação simultânea e queda da consecutiva.
Em 1947, as Nações Unidas adotam a Resolução 152 tornando a
interpretação simultânea um serviço permanente. Em 1948, a interpretação
simultânea é introduzida oficialmente no parlamento suíço. Em 58, no
parlamento canadense. Gradualmente, a interpretação simultânea começa a
ter papel de maior destaque entre as modalidades de interpretação.
Atualmente, a interpretação simultânea responde por 98% do trabalho
dos intérpretes membros da AIIC – Associação Internacional de Intérpretes de
Conferência (WEBER, 1989). Embora em proporção infinitamente menor, a
interpretação consecutiva é ainda utilizada, principalmente em uma sub
modalidade conhecida como ´Consecutiva Intermitente’, que é uma
interpretação consecutiva iniciada a partir de cada frase proferida pelo orador,
sem necessariamente utilizar a tomada de notas.
Em um mundo em que as distâncias estão cada vez menores e as
relações entre os países mais estreitas, a relevância da interpretação toma
forma e força. Somente a União Europeia, de longe o maior empregador de
intérpretes de conferência no contexto atual, dispõe de interpretação nas 23
línguas oficiais dos 27 Estados-Membros, com mais de uma centena de
combinações linguísticas possíveis. As Nações Unidas oferecem interpretação
simultânea para e do inglês, francês, espanhol, chinês, russo e árabe.
Em seu website, a Comissão Europeia define interpretação de
conferência como uma comunicação exclusivamente oral: “é a transposição de
uma mensagem de uma língua para outra, com naturalidade e fluência,
adotando a linguagem, o tom e as convicções do orador e falando na primeira
pessoa”. Nas conferências internacionais participam pessoas oriundas de
meios e culturas diferentes, que falam línguas diferentes. Cabe ao intérprete
permitir-lhes comunicar entre si, não pela tradução palavra a palavra, mas pela
veiculação do conteúdo da mensagem.
30
1.3 A Interpretação no Futuro
Os avanços na comunicação e na tecnologia trazem para o futuro novos
desafios à profissão. A crescente necessidade de precisão e prontidão estimula
o desenvolvimento de diferentes modalidades de interpretação, como é o caso
da Consecutânea. Embora ainda não amplamente aceito, o termo se refere a
interpretação consecutiva feita a partir de uma de gravação. O intérprete
posiciona-se próximo ao orador, grava o que é dito, e depois reproduz o
discurso original podendo utilizar como recurso a gravação realizada,
produzindo uma modalidade de interpretação que é parte consecutiva e
simultânea. A gravação pode ser feita através de uma caneta digital (tecnologia
Livescribe). Estudos mostram resultados ainda incipientes, embora crescentes
em termos de satisfação de público, na aprovação desta modalidade
(FERRARI, 2007), e ela continua como uma das apostas para o futuro.
Também as tecnologias de comunicação à distância modificam as
necessidades de interpretação, com áudio e vídeo conferências trazendo
dificuldades adicionais ao intérprete. A interpretação remota já é uma realidade
no cenário atual e tudo indica que tende a crescer, trazendo com isso novos
desafios à profissão. Os intérpretes no futuro provavelmente trabalharão fora
do ambiente onde a produção do discurso está sendo feita e terão que lidar
com desafios tais como a falta de sincronia entre imagem e áudio, a escolha de
apenas uma imagem que possam ver como representativa do cenário real
como um todo, ou ainda a dependência exclusiva do meio áudio para sua
produção.
Além disso, outras questões em relação ao mercado certamente se
farão importantes – em um mundo virtual, a interpretação poderá ser feita por
qualquer intérprete, em qualquer lugar do mundo, o que traz implicações até na
maneira como as associações são organizadas hoje, de forma regional.
Também exigências de mercado impulsionam novas áreas de interpretação
que não a interpretação de conferências, como a interpretação comunitária
31
(hoje já muito forte nos Estados Unidos, principalmente nos campos do Direito
e da Medicina), a interpretação no campo da pesquisa (grupos focais e
entrevistas em profundidade) e a interpretação em zonas de conflito.
Uma coisa é certa, no entanto. A história mostra que enquanto houver
comunicação entre diferentes povos, entre diferentes línguas, haverá
necessidade de interpretação. As formas e meios de comunicação através dos
quais a comunicação acontece são mutáveis; assim como as necessidades das
partes que se comunicam. Os intérpretes e as escolas de formação mais uma
vez terão que se adaptar aos novos tempos. É este seu desafio para o futuro.
Neste capítulo discorremos sobre a história da interpretação e traçamos
alguns dos desafios da profissão para o futuro. No próximo capítulo,
analisaremos a produção de pesquisas sobre a avaliação da qualidade na
interpretação e discutiremos os principais resultados obtidos até hoje.
32
Capitulo 2 - Avaliação de Qualidade na Interpretação
“Uma das características essenciais da Interpretação Simultânea é a
necessidade de interpretar um discurso proferido por um palestrante
sem limitações em nenhum dos códigos empregados (verbal e não
verbal), com um código verbal fortemente restringido, desaparecendo as
possibilidades corporais e faciais, e ficando unicamente a voz do
intérprete, limitada, por sua vez, por condicionantes socioculturais. Para
tal, a voz do intérprete de IS deve concentrar toda a responsabilidade de
uma interpretação integral”.6 (COLLADOS AÍS, 1998, p. 4)
Neste capítulo discutiremos as principais pesquisas na área da
avaliação de qualidade na interpretação e traçaremos uma comparação entre
os achados mais importantes.
Como podemos observar a partir do enunciado acima, a tarefa de
comunicação na interpretação simultânea depende só e unicamente da fala do
intérprete. No entanto, como veremos a seguir, pesquisas sobre qualidade em
interpretação desenvolvidas a partir de 1986 mostram que embora uma fala
expressiva seja característica desejável na produção do intérprete, as questões
prosódicas assumem papel secundário na avaliação de qualidade que
intérpretes e ouvintes têm do trabalho de interpretação.
Sabemos que a avaliação de qualidade de uma interpretação é afetada
por muitos fatores subjetivos, incluindo a expectativa, formação e papel de
cada agente em uma situação de interpretação (palestrantes, público,
organizadores e intérpretes) (HARTLEY, 2003). Ademais, precisamos levar em
6 “Una de las características esenciales de la IS es la necesidad de interpretar un discurso presentado por un ponente sin limitaciones en ninguno de los códigos empleados (verbal y no verbal) con el código no verbal fuertemente restringido, desapareciendo las posibilidades corporales y faciales, quedando únicamente la voz del intérprete, limitada a su vez, por condicionantes socioculturales. Por tanto, en la voz del intérprete de IS la que debe concentrar toda la responsabilidad de una interpretación integral.’
33
conta a situação onde acontece a interpretação. Variáveis como o tamanho do
evento, nível de formalidade e/ou técnico e nível de integração entre os
participantes, entre outros, também podem afetar a avaliação de qualidade da
interpretação (KAHANE, 2000). Pouquíssimos estudos sobre a avaliação de
qualidade na interpretação simultânea abordam tais variáveis, motivo pelo qual
seus resultados não podem ser considerados absolutos. Isso, no entanto, não
diminui a importância de conhecermos as pesquisas desenvolvidas na área até
hoje e sua evolução ao longo do tempo.
O primeiro estudo sobre qualidade na interpretação foi conduzido por
Hildegund Bühler (1986). Baseou-se em um questionário de avaliação a ser
respondido pelos membros da Associação Internacional de Intérpretes de
Conferência (AIIC) que objetivava levantar os critérios utilizados por estes para
avaliar a qualidade de uma interpretação. Foram incluídos 17 parâmetros, que
deveriam ser classificados em ordem de importância em uma escala de 1 a 4
(irrelevante/muito importante) – sotaque nativo; voz agradável; fluência de
discurso; coesão lógica do enunciado; consistência de sentido com a
mensagem original; transmissão completa da mensagem original da
interpretação; correção gramatical; utilização de terminologia correta; utilização
de estilo apropriada; preparação meticulosa do material da conferência;
resiliência na interpretação; postura; aparência agradável; confiabilidade;
capacidade de trabalhar em equipe; retorno positivo dos participantes da
conferência; outros. É interessante observar que os nove primeiros critérios se
referem à qualidade da interpretação em si, enquanto os seis restantes fazem
mais referência ao trabalho de preparação do intérprete ou, como coloca
Collados (1998, p.37) “ao processo de como alcançar qualidade7”.
Pouco se conhece a respeito do perfil dos intérpretes que responderam
ao questionário, distribuído em uma reunião de membros da AIIC, à exceção
do número total de respondentes, quarenta e sete, incluindo aí sete membros
da CACL – Comissão de Admissão e Classificação Linguística, em teoria,
7 “...al processo de como alcanzar la calidad”.
34
intérpretes mais experientes no processo de avaliação de qualidade de
interpretação. No entanto, o trabalho de Bühler é seminal. Além de ter sido o
primeiro, muitos de seus parâmetros, nomeadamente aqueles mais voltados à
avaliação de qualidade da produção do intérprete em si, foram reproduzidos
em estudos posteriores, o que nos permite comparar a importância atribuída a
cada item ao longo do tempo e por públicos diferentes. Isso nos parece
fundamental porque, como afirma Seleskovitch (2009, p.236) a interpretação
deve sempre ser avaliada da perspectiva do ouvinte alvo e nunca como um fim
em si mesmo, afinal, “a cadeia da comunicação não termina na cabine”.
A primeira oportunidade para tal aconteceu em 1989, com a pesquisa de
Ingrid Kurz, que utilizou oito dos critérios de Bühler e os aplicou em um
questionário a ser respondido, desta vez, por 47 usuários dos serviços de
interpretação, no caso, participantes de um congresso médico, com achados
bastante consistentes com a pesquisa original. Para ainda verificar se
diferentes públicos reagiriam de forma diferente aos mesmos critérios ou se
mudariam sua ordem de importância, Kurz voltou a aplicar a mesma pesquisa
em 1993, primeiro a um grupo de 29 participantes de um congresso sobre
Controle de Qualidade e posteriormente a 48 participantes de uma reunião do
Conselho da Europa.
A Figura 1 mostra os resultados acumulados das três pesquisas de Kurz
em comparação aos achados de Bühler, listados em ordem de importância.
Dois pontos chamam imediatamente nossa atenção nos resultados. O primeiro
é que os intérpretes sistematicamente atribuem maior pontuação (e
consequentemente, maior importância) a cada critério questionado, levando a
crer que os intérpretes têm um nível de exigência em relação ao processo de
interpretação superior às expectativas de seu próprio público alvo. O segundo
é que, independentemente dos tipos de respondente da pesquisa – sejam eles
de diferentes públicos ou intérpretes – a ordem de importância dos critérios é
exatamente a mesma, com a consistência de sentido com a mensagem original
sendo o parâmetro mais valorizado, seguido por coesão lógica (muito
importantes). Aspectos mais ligados à fala em si, como sotaque nativo e voz
agradável, aparecem em último lugar em ambas as listas.
35
Figura 1 – Avaliação dos critérios de qualidade para a interpretação simultânea de acordo com intérpretes e participantes de conferência.
Na mesma época em que Kurz desenvolvia sua pesquisa entre
diferentes públicos, temos o questionário de qualidade de Daniel Gile, aplicado
em 1990 em um congresso de Oftalmologia, com interpretação para o inglês e
o francês. Também trabalhando com a percepção de usuários, desta feita em
um ambiente real de conferência, Gile elenca seis critérios a serem pontuados
pelos usuários do serviço de interpretação em uma escala de 1 a 5 (muito ruim
a muito bom): qualidade global da interpretação, qualidade linguística,
qualidade terminológica, fidelidade e voz, ritmo e entoação. Dois outros pontos
são adicionados, principais defeitos da interpretação e outros comentários, que
devem ser preenchidos de forma eletiva pelos participantes. Vinte e três
participantes respondem ao questionário, dezoito ouvintes do inglês para o
francês e cinco do francês para o inglês.
Os resultados da pesquisa de Gile foram bastante homogêneos, com os
ouvintes da interpretação para o inglês atribuindo pontuações maiores aos
intérpretes em todos os quesitos. Entre os que ouviram a interpretação para o
francês, as menores notas como um todo foram atribuídas à voz, ritmo e
entoação, incluindo três comentários eletivos de interpretação ‘monotônica’.
Apesar disso, a impressão geral da qualidade da interpretação não foi afetada
adversamente por este parâmetro (GILE, 1990). A hipótese de Gile para este
resultado é que, para um público mais técnico-científico, as questões de voz
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
Consistência de sentido
Coesão lógica
Terminologia
Transmissão completa da mensagem
Fluência
Correção gramatical
Voz
Sotaque
Qualidade na Interpretação - Kurz X Bühler
Kurz – Participantes N = 124 Bühler – Intérpretes N = 47
36
assumam menor importância, “é possível formular a hipótese de que o público
mais científico (e técnico) é menos sensível à qualidade de voz, ritmo e
entoação da interpretação que outros públicos, que lhe podem atribuir maior
importância8” (GILE, 1990, p.68). Embora aceita como hipótese possível à
época, a postulação de Gile nos parece incompleta, na medida que não leva
em consideração as expectivas a priori dos ouvintes em relação à
interpretação, sua compreensão do que deveria ser aceitável em termos de
produção ou seu nível de atenção/concentração na fala do intérprete. Também
é importante lembrarmos que as características prosódicas da fala não podem
ser consideradas meramente uma questão pessoal de maior ou menor
sensibilidade, pois sabemos que elas interferem no processamento da fala.
Entre 1993 e 1994, a pedido do Comitê de Pesquisa da AIIC, Jennifer
Mackintosh lidera um estudo para entender as expectativas de qualidade de
diferentes usuários (MOSER, 1995). Uma equipe de 94 intérpretes entrevistou
mais de 200 participantes em 84 conferências diferentes realizadas no mundo
todo. Praticamente metade dos entrevistados participava apenas como ouvinte
das mencionadas conferências (50,5%), enquanto a outra metade participava
como ouvinte e palestrante (49,5%). Apenas 9% utilizavam os serviços de
interpretação pela primeira vez, com 60% tendo participação frequente em
conferências multilíngues com interpretação. Novamente, os resultados
seguem a mesma tendência de estudos anteriores, com maior importância
sendo atribuída aos critérios relacionados ao conteúdo do que à forma,
independentemente do tipo de conferência. O critério fidelidade da
interpretação ao sentido original foi o parâmetro mencionado mais vezes
espontaneamente pelos participantes, com 45% o julgando o mais importante.
No entanto, questões tais como fala vivaz e não monótona, pronúncia clara e
‘uma voz que soa natural’ foram mencionadas por 66 dos participantes como
algo que um bom intérprete deve produzir. Em contrapartida, oito participantes
criticaram a entoação exagerada e fala histriônica dos intérpretes. De fato, o
8 “Il est possible tout de même de formuler l’hypothèse selon laeulle les scientifiques (et techniciens) seraient moins sensibles à la qualité de la voix, du rythme et de l’entonation de l’interprétation que l’autres publics, pour qui ele a peut-être une plus grande importance”.
37
desejo de ouvir uma fala mais neutra em relação à mensagem sendo
interpretada é verbalizado por 21 participantes.
Outro fator relacionado às questões da fala criticado adversamente por
30 participantes é o mau uso do microfone aberto, com vazamento de barulhos
da cabine, incluindo tosse, cochichos entre intérpretes, risadas, papéis sendo
folheados, batuque de caneta ou lápis na mesa ou microfone entre outros.
Finalmente, quando submetida aos participantes uma lista de possíveis fontes
de irritação, as longas pausas silenciosas ou pausas preenchidas e atraso na
fala do intérprete em relação ao discurso original (falta de sincronia) aparecem
em primeiro lugar, com mais de 70% dos participantes classificando-os como
irritantes ou muito irritantes.
Em 1995, Kurz e Pöchhacker repetem os mesmos 8 critérios baseados
em Bühler para investigar um novo público ouvinte – desta vez um grupo de
representantes de TV da Alemanha e Áustria – e verificar se os critérios em
relação à forma e expressão do discurso do intérprete teriam o mesmo peso e
grau de importância que os públicos anteriores (COLLADOS, 1998). Embora
mais uma vez a consistência de sentido com a mensagem original e coesão
lógica fossem os parâmetros mais valorizados, os resultados mostraram que
esse público era particularmente sensível a critérios relacionados à voz, ao
sotaque e à fluência.
Em 1998, Collados decide explorar mais a fundo as questões da fala do
intérprete, conduzindo um estudo laboratorial controlado comparando
interpretações monotônicas com versão mais ‘vivazes’ do mesmo discurso.
Foram elaboradas três versões a serem avaliadas: versão monotônica sem
falhas de conteúdo, versão vivaz com falhas de conteúdo, versão vivaz sem
falhas de conteúdo (COLLADOS, 1998). Sistematicamente, as interpretações
com uma fala mais vivaz, independentemente da presença de alguns erros,
foram consideradas superiores em comparação àquela mais monotônica,
38
mesmo que essa apresentasse uma transmissão completa da mensagem
original da interpretação, sem falhas de conteúdo. As versões foram testadas
em estudos e públicos diferentes, com resultados bastante consistentes, o que
nos leva a crer que, apesar de atribuírem, em teoria, maior importância a
aspectos mais relacionados ao conteúdo da interpretação, quando os usuários
têm a chance de ouvir versões orais de uma interpretação com conteúdo
melódico mais ou menos monótono, estes tendem a atribuir maior qualidade
àquelas versões menos monótonas, sugerindo que talvez alguns elementos
prosódicos sejam importantes na avaliação de qualidade da interpretação.
A partir do ano 2000, uma nova leva de estudos é produzida a fim de
definir qualidade na interpretação. Um dos primeiros a ter destaque no novo
milênio é o estudo de Chiaro e Nocella, de 2004. Similarmente a outros
estudos aqui descritos, Chiaro e Nocella conduzem um estudo empírico da
avaliação de qualidade na interpretação com base nos critérios de Bühler,
trabalhando aqui com o mesmo público alvo do referido estudo, ou seja,
intérpretes profissionais de conferência. Com uma amostra de 286
respondentes de um universo de 1000 questionários enviados, o estudo
conseguiu atrair participantes de todo o mundo (embora com grande
concentração na Europa e Américas, 44% e 46%, respectivamente) e foi
completamente conduzido online.
Com base em uma escala multidimencional, os pesquisadores
conseguiram produzir um mapa perceptivo com base nos resultados de como
os intérpretes classificavam uma lista de critérios linguísticos e não linguísticos
de acordo com sua percepção de importância. Mostra-se aqui a maior
diferença entre este e o estudo de Bülher. A tarefa dos intérpretes desta feita
era a de simplesmente classificar os critérios listados em uma ordem do mais
ao menos importante, em vez de simplesmente classificá-los como importantes
ou não como havia sido feito no estudo conduzido por Bühler.
39
Apesar de diferenças em alguns quesitos, os resultados são bastantes
simétricos no geral, ressaltando as questões linguísticas ligadas à precisão
terminológica. A Tabela 1 compara os resultados de Chiaro e Nocella com
aqueles de Bühler com bases nas porcentagens de “muito importante” e
“importante” do estudo original.
Tabela 1: Comparação da classificação dos critérios de qualidade de acordo com Chiaro e Nocella (2004) e Bühler (1986) (Pochhacker, 2013).
Chiaro e Nocella 2004 Bühler 1986
1. Consistência de sentido 1. Consistência de sentido
2. Transmissão completa da informação 2. Coesão lógica
3. Coesão lógica 3. Terminologia
4. Fluência 4. Fluência
5. Correção gramatical 5. Correção gramatical
6. Terminologia 6. Transmissão completa da mensagem
7. Estilo apropriado 7. Voz agradável
8. Voz agradável 8. Sotaque
9. Sotaque 9. Estilo apropriado
Ainda seguindo os critérios de escala de classificação de importância de
Bühler, Zwischenberger & Pöchhacker (PÖCHHACKER e
ZWISCHENBERGER, 2010) conduzem um novo estudo online com intérpretes
membros da AAIC. Os critérios linguísticos, ligados a fatores sintático-
semânticos, são mantidos como no estudo original, mas alguns critérios
prosódicos são adicionados já levando em consideração os resultados obtidos
por Moser (1996) e Collados (1998)
“Observando as pesquisas sobre as expectativas de qualidade
publicadas ao longo dos anos, aumentamos a lista de critérios originais
para incluir “entoação vivaz”, como particularmente estudado por Ángela
40
Collados Aís na Universidade de Granada, e “sincronia”, que aparece
como uma característica esperada na interpretação simultânea pelos
respondentes participantes da pesquisa de expectativas dos usuários
patrocinada pela AIIC e realizada por Moser9. (POCHHACKER, 2013)
Desta feita, participam da pesquisa 704 intérpretes membros da AIIC em
todo o mundo. Os resultados são muito próximos aos de Bühler, com
consistência de sentido em primeiro lugar, seguido de coesão lógica.
Deparamo-nos novamente com os critérios voz agradável e sotaque avaliados
como menos importantes. Além disso, apesar de considerados importantes em
estudos anteriores, os critérios adicionados ao estudo, entoação e
sincronicidade, ficam muito próximos a ambos, recebendo nível baixo de
importância.
Ainda em 2010, dois estudos da Universidade de Viena são publicados
com foco na investigação da avaliação de qualidade da interpretação e
compreensão da fala do intérprete aliada à sua produção vocal. O primeiro
(HOLUB, 2010), traz a comparação de uma fala interpretada e esta mesma fala
manipulada no software Praat para se tornar monotônica. Apresentada em uma
configuração que mimetizava uma conferência, o estudo contava com um vídeo
sendo apresentado a 63 ouvintes alunos de marketing da instituição que eram
randomizados em dois grupos, cada um ouvindo uma das versões e com a
tarefa de completar um questionário de compreensão e avaliação do
desempenho de interpretes. Embora não estatisticamente diferente, os
resultados mostraram que a interpretação monotônica dificultou a
compreensão. A análise mostrou correlação entre vivacidade da interpretação
e a avaliação do desempenho do intérprete como um todo. Os dados dessa
pesquisa sugerem que a fala dita monotônica tem impacto negativo na
9 “Taking note of research on quality expectations published over the years, we extended the original list of criteria to include “lively intonation”, as studied in particular by Ángela Collados Aís (1998) at the University of Granada, and “synchronicity”, which had emerged as a feature expected of simultaneous interpreting by respondents in the AIIC-sponsored user expectation survey carried out by Moser (1996).”
41
avaliação de qualidade da interpretação e pode ter impacto negativo para a
compreensão do ouvinte.
No segundo, conduzido por RENNERT (2010), um intérprete profissional
produz várias versões de interpretação de discurso do inglês para o alemão,
com diferentes níveis de fluência. A versão mais fluente é escolhida como base
para análise no software Praat e identificação de suas características.
Novamente, consoante aos achados de Schlensinger, a produção da
interpretação traz uma maior quantidade de pausas, alongamento de vogais e
consonantes, respiração audível e outras características consideradas como
“disfluências” pela autora. A partir dessa análise, duas novas versões foram
produzidas pela pesquisadora no Praat – uma eliminando completamente
quaisquer disfluências e outra dando maior relevância a elas. As versões mais
e menos fluentes foram testadas em questionários de compreensão e análise
subjetiva, incluindo questões sobre idade, sexo, avaliação da familiaridade dos
intérpretes com o tópico e outros.
Os resultados do estudo de RENNERT (2010) demonstraram que uma
maior fluência está atrelada a uma maior percepção de correção na
interpretação e consequentemente associada a melhor compreensão. A
conclusão de Rennert é a de que fluência não é só uma questão de estilo e
pode impactar a opinião do ouvinte na qualidade da interpretação em termos
de desempenho do intérprete e qualidade da interpretação.
Ainda mais recentemente, LENGLET (2015) investiga se a entoação
típica dos intérpretes pode reduzir a compreensão e qualidade percebida da
fala interpretada.
Em um estudo piloto, são submetidas à avaliação perceptiva duas
versões de uma interpretação simultânea para o francês. Ambas as versões
trazem o mesmo conteúdo, mas uma é a interpretação real do discurso e a
42
outra apenas um shadowing da primeira, ou seja, uma versão no mesmo
idioma, com o intérprete repetindo exatamente as mesmas palavras e ordem
da primeira versão. Setenta e nove juízes, sendo 49 estudantes de economia e
30 estudantes de tradução ouvem ambas as versões e respondem um teste de
compreensibilidade e um questionário de avaliação de qualidade. A versão em
shadowing é percebida como significativamente mais fluente do que a versão
interpretada, mas não há diferença significativa entre a interpretação e o
shadowing em relação à compreensibilidade da mensagem.
Embora um avanço importante na pesquisa sobre a qualidade na
interpretação, os estudos mais recentes estão focados na comparação da fala
do intérprete com falas manipuladas, quer através da substração/adição de
fluência/entoação, comparação da fala interpretada com leitura ou comparação
fala interpretada com shadowing. Ainda não temos estudos que se concentrem
unicamente na fala do intérprete para investigar a influência dos fatores
prosódicos na avaliação de qualidade e compreensão da fala interpretada. A
base da interpretação é a fala do intérprete. A fala não transmite apenas o
conteúdo informativo das sentenças, mas também veicula outras informações,
tais como a expressão de atitudes e emoções do falante. A expressividade da
fala de um intérprete pode influenciar a maneira com que esse é avaliado por
seu público em termos de agradabilidade, credibilidade, assertividade ou nível
de conhecimento. Passar a mensagem com elementos prosódicos adequados,
incluindo tom de voz, entoação e acento, é crucial para o sucesso da
interpretação e da compreensão do que se fala. É, portanto, fundamental
investigarmos essa fala a fundo, incluindo parâmetros como taxa de elocução,
pausas, padrões entoacionais e outros para podermos entender e conscientizar
os intérpretes em questões como percepção de qualidade e compreensão de
seu trabalho. Talvez aí possamos discutir as bases para futuras pesquisas na
área.
Neste capítulo discutimos as principais pesquisas na área da avaliação
de qualidade na interpretação e traçamos uma comparação entre os achados
43
mais importantes. No próximo capítulo, usaremos a fundamentação teórica
para discutir e analisar a importância desses parâmetros.
44
Capítulo 3 - Fundamentação Teórica
‘Toda fala é expressiva, no sentido de que alguma forma de atitude, emoção,
crença, estado físico ou condição social é veiculada por meio da fonação e da
articulação dos sons... Essa potencialidade da fala para expressar sentidos a
torna um meio eficaz para a comunicação. Por meio da fala veiculamos
informações, mas também expressamos nossas atitudes, emoções e crenças e
sinalizamos nossas posições em relação ao discurso...O falante é capaz de
materializar em som suas ideias, atitudes e sentimentos para comunicar ao
ouvinte a impressão que intenta”
MADUREIRA (2004)
Neste capítulo, investigaremos a fala do intérprete e suas características
mais marcantes, como a formação de grupos entoacionais, o número e
distribuição de pausas, e pitch intensidade médios e taxa de elocução, e
traçaremos uma comparação entre essas características na interpretação e na
fala espontânea. Para tal, nos apoiaremos na literatura para descrição das
características muito particulares da fala do intérprete, nomeadamente
utilizando o trabalho de descrição da fala do intérprete desenvolvido por
Schlesinger em 1994. A seguir, levantaremos na literatura a definição de cada
um destes elementos prosódicos e sua importância na construção de sentido
na fala.
Diferente da tradução, a interpretação é um processo exclusivamente
oral, desde sua origem (fala original) até seu produto final (fala do intérprete). A
interpretação simultânea com equipamento, objeto de nosso estudo, difere
ainda mais da tradução na medida em que está comprimida em um espaço de
tempo. Poderíamos dizer que a interpretação simultânea é uma resposta oral
única e imediata a um estímulo oral também único e imediato. Além disso, de
acordo com Seleskovitch (1978) durante uma jornada de trabalho normal,
dependendo da taxa de elocução da fala original, o intérprete de conferência
45
processa e articula aproximadamente 20000 (vinte mil) palavras, enquanto os
tradutores traduzem entre 2000 e 3000 (vinte a trinta mil) palavras ao dia
(produção média diária da União Europeia e Nações Unidas). Isto significa que
em um dia um intérprete processa dez vezes mais palavras que um tradutor. É
exatamente este volume fenomenal de informação a ser processada em um
espaço tão pequeno de tempo, e não simplesmente o fato de o intérprete ouvir
uma língua e produzir outra, que faz com que a interpretação simultânea (IS)
traga desafios que podem vir a afetar a fala do intérprete. Na IS, os aspectos
da fala adquirem um papel vital, não só pela sua característica intrínseca de
oralidade, mas porque o intérprete, pressionado por uma sobrecarga na sua
capacidade de processamento e uma limitação de tempo, acaba por produzir
uma fala que é muito específica e característica e que não pode nem ser
chamada de espontânea (porque depende da fala do outro) nem de laboratorial
(porque o intérprete opta, dentre um leque de escolhas, pela maneira como irá
verbalizar o sentido).
3.1 O Modelo dos Esforços e a Fala do Intérprete
“Para interpretar, o intérprete deve primeiro entender” (Seleskowitch
1978, p. 11). Como iremos verificar, a interpretação não é um processo
mecânico, mas sim “uma operação cognitiva altamente complexa” (Kurz 2008:
180) em que os intérpretes, primeiro devem entender a mensagem que
recebem para depois verbalizá-la no idioma alvo. Essa complexidade de
processamento mental é muito bem descrita no modelo teórico de Daniel Gile
(1995), que explica como o trabalho do intérprete simultâneo deve equilibrar
diferentes esforços – de Audição e Análise (Listening and Analysis), de
Memória (Memory), de Produção (Production) e de Coordenação destes
esforços (Coordenation) (GILE, 1995)– de forma a chegar a um resultado final
satisfatório, uma tarefa que Gile compara àquela de um malabarista em sua
“Hipótese da Corda Bamba” (Tightrope Hypothesis):
“A Hipótese da Corda Bamba preconiza que na maior parte do tempo os
intérpretes trabalham próximo ao ponto de saturação, seja em termos de
46
requisitos de capacidade de processamento mental como um todo, seja
em relação a Esforços individuais, devido à alta exigência de um esforço
em particular e/ou uma alocação subotimizada dos recursos a cada um
dos esforços”.
(GILE, 1995)
Como podemos perceber, a fala do intérprete está comprimida entre
todos os outros esforços necessários para a execução da atividade como um
todo, e obviamente não passa incólume por tal compressão. Ela não pode ser
chamada de espontânea nem tampouco guiada ou laboratorial, o que a torna
absolutamente singular. Apesar de escolher suas palavras, o intérprete precisa
esperar o discurso original para compreender seu significado, lógica e registro.
Só a partir de então poderá construir sua fala – que compreenderá vocabulário,
estrutura gramatical, entoação, posicionamento de adjetivos e advérbios,
registro de formalidade, etc. – e que poderá ser parecida, ou completamente
diferente, da estrutura que usaria fora da cabine de interpretação.
Embora tão notavelmente específica, ainda há poucos estudos que
investigam a fala do intérprete. Já existe evidência, no entanto, de que essa
pressão de processamento mental interfere na produção verbal do intérprete,
afetando sua produção prosódica (SCHLESINGER:1994, COLLADOS: 1998,
2001, HOLUB: 2010, RENNERT: 2010). O primeiro estudo com dados sobre as
características específicas da fala do intérprete foi desenvolvido por Miriam
Schlesinger (1994). Para investigar o papel da entoação na produção e
percepção da interpretação simultânea, Schlesinger analisou a produção
simultânea de oito intérpretes de conferência trabalhando do inglês para
hebreu e do hebreu para o inglês, isolando dez extratos de aproximadamente
90 segundos, escolhidos aleatoriamente (6 extratos do inglês para hebreu) e (4
extratos do hebreu para o inglês).
Os resultados da análise de Schlesinger mostram um conjunto de
características na fala do intérprete que trazem diferenças marcantes da fala
espontânea. A primeira delas é a utilização de pausas e consequente
distribuição do enunciado em unidades de informação (grupos entoacionais).
47
Os dados parecem indicar que pausas no meio de estruturas gramaticais são
um dos aspectos mais salientes da interpretação, ou seja, os intérpretes
tendem a introduzir um número desproporcional de pausas em posições
consideradas não “naturais”, quebrando as unidades de sentido dentro de um
mesmo grupo entoacional. Também há um uso característico das
proeminências, com sílabas “inesperadas” carregando o pitch accent, ou valor
de pitch máximo, em cada grupo entoacional. Outro aspecto de destaque é a
marcação do pitch final de fronteira, com uma tendência de os intérpretes
terminarem suas frases com um pitch elevado, não concludente. O último
aspecto investigado por Schlesinger foram as questões de duração e taxa de
elocução, com a produção dos intérpretes sendo geralmente sem ritmo regular,
com alterações fora do padrão tanto em duração quanto em taxa de elocução.
Esses resultados são importantes porque nos apontam as principais
direções para investigação da prosódia na fala do intérprete, fatores os quais
podem vir a atrapalhar a avaliação de qualidade e compreensibilidade desta
fala e porquê. Para tanto, precisamos nos embasar na literatura para entender
qual o papel de cada um destes aspectos prosódicos na produção da fala.
3.2 Prosódia
O termo prosódia apresenta definições diversas na literatura fonética.
Em nosso trabalho, definiremos a prosódia como um termo geral que
compreende elementos como a entoação, a acentuação, a qualidade de voz, o
ritmo, a taxa de elocução e a pausa. Esses elementos implicam em correlatos
acústicos, perceptivos e fisiológicos. Na figura a seguir, mostramos os padrões
perceptivos de pitch, loudness e duração da fala. Cada um desses padrões
está associado a um correlato acústico e a um correlato fisiológico, como
retirado de (GRICE, BAUMAN, 2007). As correlações existentes entre os
planos da percepção, da acústica e da produção podem ser observadas
abaixo:
48
Figura 2 - Padrões perceptivos de pitch, loudness e duração da fala e seus correlatos acústico e fisiológico.
A entoação, ou melodia da fala, envolve a ocorrência de padrões de
pitch em palavras ou grupo de palavras. O principal correlato acústico da
entoação é a frequência fundamental (f0), que está relacionada em nível de
produção à taxa de vibração das pregas vocais e em nível de percepção ao
pitch. A f0 pode ser medida em Hz e corresponde a grosso modo, em nível
fisiológico, ao número de vibrações das pregas vocais por segundo. No nível
auditivo, a f0 corresponde à sensação de altura do tom de voz (tom grave
(baixo) ou tom agudo (alto)).
O acento refere-se à proeminência. O acento pode ser frasal (acento da
frase) ou lexical (acento da palavra). No português, o principal correlato do
acento lexical é a duração (MIGLIORINI e MASSINI-CAGLIARI, 2010;
BARBOSA, 2010).
A vogal tônica apresenta maior duração e a pós-tônica menor duração e
intensidade. A duração dos segmentos fônicos pode ser medida em um
software de análise de fala no espectrograma de banda larga. O
espectrograma de banda larga, gerado a partir de filtros acústicos mais largos
49
(acima de 150Hz) do que os de banda estreita, é um gráfico que apresenta a
frequência na ordenada, o tempo na abscissa e a intensidade no contraste de
cor (quando o espectrograma é apresentado em preto e branco, quanto mais
escura a região de frequência, maior a intensidade).
Pelo espectrograma de banda larga, podemos identificar os formantes
(manchas escuras) que correspondem às ressonâncias do trato e permitem a
partir de sua leitura inferir o posicionamento dos órgãos articuladores. A seguir,
a Figura 3 em que a vogal tônica da palavra “fogo” pode ser contrastada com a
vogal pós-tônica em termos de duração.
Figura 3 – Forma da onda, espectrograma de banda larga de emissão da palavra “fogo” e camada com a segmentação dos segmentos consonantais e vocálicos.
O acento frasal realiza-se por um movimento mais amplo de f0 e recai
sobre a sílaba da palavra que na frase veicula a informação mais importante.
O ritmo refere-se às regularidades percebidas nas unidades
proeminentes da fala (entre sílabas acentuadas e não acentuadas ou entre
sílabas breves e longas), o que lhe confere uma certa estruturação. O
parâmetro acústico principal do ritmo de línguas de ritmo silábico ou misto,
como o Português Brasileiro, é a duração, como postulado por BARBOSA
(2000; p.374): “Nessas línguas, a duração é o principal ou um dos parâmetros
50
acústicos principais para assinalar o acento, desviando, portanto, a sílaba
acentuada da suposta constância de duração em relação às outras sílabas”.
A taxa de elocução refere-se à percepção de a fala de uma pessoa ser
rápida, lenta ou normal. Pode ser medida em número de sílabas ou palavras
por tempo de elocução. As variações na taxa de elocução afetam tanto a
duração quanto a qualidade dos segmentos.
O termo pausa é utilizado tanto para se referir à pausa silenciosa
(silêncio utilizado pelo falante para respirar ou planejar o discurso), quanto à
pausa preenchida (uso de expressões como né, tá, ahn,) ou à sensação de
interrupção no fluxo da fala causada por alterações de pitch, duração e
loudness que estão correlacionadas, respectivamente, à elevação ou
diminuição de F0, maior ou menor duração de sílabas e à maior ou menor
intensidade.
.
A qualidade de voz refere-se aos ajustes fonatórios e articulatórios e de
tensão que acompanham dois ou mais segmentos de fala, enunciados ou a
fala de um indivíduo como um todo. De acordo com LAVER (1980), esses
ajustes podem estar relacionados à configuração fisioanatômica do aparelho
fonador, mas também a ajustes ou parâmetros musculares de curto prazo
usadas pelo falante com uma finalidade lingüística e paralinguística específica.
Complementarmente, na definição de CHUN (2002, p. 3) “prosódia é um
contínuo de funções e efeitos, que abrangem características não linguísticas e
extralinguísticas por um lado, até características paralinguísticas e mesmo
essencialmente linguísticas10”. Os elementos extralinguísticos e
paralinguísticos de um determinado estilo de fala podem ser evidenciados tanto
pela fisiologia ou anatomia do falante quanto causados por “...um esforço
consciente e deliberado (e consequentemente comunicativo) deste para
transmitir uma certa personalidade, emoção ou atitude11” (CHUN, 2002, p.3).
10 (Prosody) “is a continuum of functions and effects, ranging from the nonlinguistic or extralinguistic at one end, through the paralinguistic, to the essentially linguistic.” 11 “...a conscious and deliberate (and therefore communicative) effort by the speaker to convey
51
Assim, um mesmo elemento prosódico pode sinalizar uma função
linguística, paralinguística ou extralinguística. A qualidade de voz, por exemplo,
pode ser utilizada para expressar funções linguísticas (delimitação de
enunciados), paralinguísticas (expressão de emoções) e extralinguísticas
(gênero e grupo social) do falante.
Seja através de elementos mais ou menos concretos, a importância da
prosódia na fala é fundamental para muitos autores estudados. Para Gumperz
(1982, p. 107) “A prosódia permite com que os interlocutores dividam o fluxo da
fala em unidades de mensagem básicas que tanto possibilitam a interpretação
da mensagem quanto controlam as estratégias de mudança de interlocutor que
são essenciais para a manutenção de um envolvimento conversacional12”.
Como atividade comunicadora, a interpretação se utiliza de
elementos prosódicos da fala, mas de uma maneira diferente da fala
espontânea. Se, de acordo com Rilliard et al (2012), as modificações
prosódicas (no discurso) afetam o registro médio, pitch range e ritmo do
discurso, então movimentos prosódicos ‘não convencionais’ na fala do
intérprete podem afetar a compreensibilidade ou percepção da mensagem por
parte dos ouvintes.
Analisemos então cada um destes elementos em separado em
comparação com sua descrição na literatura.
3.3 Pausa
A pausa, identificada por Schlesinger (1994) como a caraterística mais
marcante da fala do intérprete. O intérprete tende a produzir um número maior
a certain personality, affect, or attitude” 12 “Prosody enables conversationalists to chunk the stream of talk into basic message units which both underlie interpretation and control the turn taking or speaker change strategies that are essential to the maintenance of conversational involvement.”
52
de pausas e em posições consideradas não ‘naturais’. O que seria, no entanto,
a descrição do uso de pausas na fala espontânea?
De acordo com Cruttenden (1986) as pausas tipicamente ocorrem em locais
distintos em um enunciado:
1) Em um componente de fronteira importante (principalmente entre
cláusulas e entre sujeito e predicado). Existe uma correlação entre o tipo de
componente de fronteira e o tamanho da pausa, ou seja, quanto mais
importante a fronteira, maior a pausa. Além disso as pausas tendem a ser mais
longas onde os componentes de fronteira (neste caso geralmente fronteiras de
sentença) envolvem um novo tópico. As pausas deste tipo são tipicamente
silenciosas, mas podem ser preenchidas como ferramenta do discurso, ou seja,
para evitar que outra pessoa interrompa o falante atual;
2) Antes de palavras de alto conteúdo léxico ou, colocando em termos da
teoria da informação, em pontos de baixa probabilidade transacional. Assim, as
palavras precedidas por uma pausa são geralmente difíceis de serem
adivinhadas por antecipação. Este tipo de pausa geralmente ocorre antes de
um componente de fronteira menor, frequentemente dentro de uma oração
substantiva, oração verbal ou oração adverbial, isto é, entre um substantivo
principal e um determinante;
3) Após a primeira palavra em um grupo entoacional. Esta é uma posição
típica por outros ´erros de desempenho´, por exemplo, correções de um falso
início e repetições. Tanto a pausa do tipo 2 quanto a pausa do tipo 3 podem
ser consideradas fenômenos de hesitação. As do tipo 2 indicam dificuldades
em se encontrar a palavra adequada; as do tipo 3 parecem ter uma função de
planejamento, isto é, servem essencialmente como uma operação de espera,
enquanto o falante planeja o restante do enunciado.
Ao introduzir um número superior ou inferior de pausas em sua fala, em
posições talvez diferentes do esperado em uma fala espontânea, o intérprete
pode dificultar a compreensão de sua mensagem. Foram estes os achados de
53
Kurz (2008) no estudo referido acima. Ao comparar a compreensão de um
segmento primeiramente interpretado e depois lido pelos mesmos intérpretes, a
autora identifica uma diferença significativa no nível de compreensibilidade da
mensagem por parte dos ouvintes em detrimento da interpretação.
3.4 Entoaçâo
Outro ponto apontado por Schlesinger (1994) como marcante na fala do
intérprete é a entoação, com destaque para a marcação do pitch final de
fronteira, com uma tendência de os intérpretes terminarem suas frases com um
pitch elevado, não concludente.
Sabemos que o padrão entoacional de um falante é utilizado para
diferenciar uma modalidade de discurso de outra (MADUREIRA, 1999), e que
diferentes padrões entoacionais sugerirão modalidades diferentes, sejam elas
imperativa, declarativa ou interrogativa. A pista entoacional é importante para
decodificarmos também a estrutura gramatical da fala, mas não só. Afinal,
como afirma Bolinger (1958, p. 338) “A entoação é importante para quem está
falando, para quem falará em seguida, para como o ato será compreendido
(uma explicação, um pedido de desculpas, um questionamento), para como o
falante será avaliado (como indivíduo, como falante nativo, como membro de
uma classe social) – apenas para mencionar alguns elementos que afetam
nosso papel como Falantes e Ouvintes13“.
Chun (2002) define quatro funções principais para a entoação:
gramatical, atitudinal, de discurso e sociolinguística.
As funções gramaticais são aquelas que guardam uma maior
aproximação com o nível sintático do discurso, ou seja, como já comentado
anteriormente, a curva entoacional varia conforme a modalidade da oração
(afirmativa, interrogativa, imperativa etc.). No entanto, como destaca Bolinger
13 “Intonation is important for who is speaking, for who will be taking the next turn, for how the act is to be understood (explanation, apology, challenge) for how the speaker will be evaluated (as an individual, as a native speaker, as a member of a social class) – to mention only a few things that affect our roles as Speakers or Listeners”.
54
(1958), a relação entre gramática e entoação é casual e não causal. Existe
uma certa escolha que vai depender de considerações pragmáticas. Isto leva
Chun (2002) a subdividir a categoria de funções gramaticais em duas, onde
uma concentra-se no alinhamento e associação de tons com estruturas
sintáticas em particular (modalidades) e a outra na compartimentação do fluxo
do discurso em várias unidades, ou seja, como função de segmentação da
informação, que está associada a regularidade da fala.
As funções atitudinais são aquelas que ligam a entoação à expressão de
emoções e atitudes. Brown et at (2001) sugerem que pode haver um pequeno
número de padrões entoacionais que estão convencionalmente relacionados a
uma série de atitudes. No inglês, por exemplo, um tom de fronteira final
ascendente (na avaliação de Schlesinger (1994) não concludente no discurso
do intérprete), poderá ser avaliado como característico de um falante que
deseja ser agradável e encorajar o seu interlocutor a participar no diálogo.
As funções de discurso vão além do nível da oração e destinam-se a
constituir coerência e continuidade com o discurso como um todo,
independentemente de seu tamanho ou duração. São destinadas a marcar
proeminências e fronteiras entre orações, parágrafos, tópicos a fim de dar
continuação a um tópico estabelecido ou sinalizar um novo tópico a ser
introduzido. Também evidenciam as pistas ao interlocutor, no caso de diálogo,
de que é agora sua vez de falar.
As funções sociolinguísticas revelam diferenças na entoação de acordo
com o grupo social a que o falante pertence, incluindo aí diferenças de gênero,
idade, características socioeconômicas, geográficas e/ou ocupacionais. Através
da fala, o intérprete revela informações sobre o grupo em que está inserido.
Mais uma vez, mudanças entoacionais na fala do intérprete podem levar a uma
percepção por parte do ouvinte de que o intérprete pertence a um contexto
sociolinguístico diferente do seu.
55
3.5 Pitch Accent
Sabemos que o intérprete faz um uso característico das proeminências,
com sílabas ‘inesperadas’ carregando o pitch accent, ou seja, a sinalização de
uma proeminência acentual por alteração de pitch.
De acordo com LAVER (1994) uma das funções da entoação é sinalizar
que algumas partes de uma estrutura entoacional são, de alguma forma, mais
essenciais para a interpretação do sentido da mensagem do que outras partes,
que vão necessariamente aparecer como menos proeminentes na fala. A
gradiência da proeminência também sinaliza uma coordenação com a
organização métrica de acento e ritmo de fala, imprimindo a esta uma
regularidade que é importante para identificar ao ouvinte os blocos de
informação que estão sendo produzidos. Orações sintaticamente idênticas com
diferentes focos de pitch máximo vão transmitir ao ouvinte pistas de informação
diferentes, e levarão, consequentemente, a diferentes interpretações da
mensagem. Estas diferenças de interpretação de acordo com o ponto em que
se percebe o pitch máximo (proeminência) da fala sugerem que a entoação
pode ser tratada como uma forma de comportamento linguístico.
Cruttenden (1986) identifica que o pitch accent depende de algum tipo
de obstrução do pitch no ponto do acento a partir do pitch das sílabas
circunvizinhas. Isto significa dizer que o pitch accent sempre aparece em
comparação a um grupo entoacional como um todo e identifica um movimento
de fala não isolado. Assim, o pitch accent depende de um movimento que vem
ou se direciona às sílabas adjacentes e pode ser configurado como um
patamar acima, um patamar abaixo, uma movimentação de baixo para cima ou
uma movimentação de cima para baixo. Cada um desses movimentos e/ou
troca de patamar leva a uma pista entoacional diferente, pois a marcação de
proeminência (e, portanto, sinalização de importância da informação) irá variar
de acordo com o local onde está o pitch accent.
Ao situar o pitch accent em um ponto de sua fala, o intérprete está
necessariamente trazendo este ponto como informação mais importante de um
dado segmento. Pitch accent inesperados podem levar à confusão por parte do
56
ouvinte, pois interferem na regularidade da fala e deslocam o foco de atenção
para estruturas sintáticas supostamente menos providas de sentido dentro de
um grupo entoacional.
Um dos objetivos deste estudo é investigar se as características
descritas por Schlesinger também estão presentes na produção de intérpretes
trabalhando do Inglês para o Português Brasileiro e verificarmos se estas
podem de fato afetar a avaliação de qualidade e compreensão da fala
interpretada.
Neste capítulo, discutimos as características mais marcantes da fala do
intérprete de uma perspectiva teórica, mostrando as correlações da fala nos
níveis perceptivo, acústico e fisiológico. Também descrevemos as implicações
que as mudanças nos elementos prosódicos podem trazer ao nível do sentido.
O próximo capítulo discorrerá sobre a metodologia utilizada neste estudo
para analisar e caracterizar a fala do intérprete acústica e perceptivamente
como base para refletirmos sobre o impacto da prosódia na avaliação de
qualidade e compreensão e compreensibilidade da fala do intérprete.
57
Capítulo 4 - Metodologia
Neste capítulo descreveremos a metodologia adotada em nosso estudo,
baseado em um corpus composto de falas semiespontâneas e interpretadas de
um grupo de intérpretes.
4.1 Participantes Sujeitos da Pesquisa
Doze intérpretes profissionais do sexo feminino participaram de nosso
estudo. Todas as participantes são nativas de PB e possuem afiliação em uma
ou mais entidades profissionais, nomeadamente AIIC (Associação Internacional
de Intérpretes de Conferência), APIC (Associação Profissional de Intérpretes
de Conferência) ou ATA (American Translators Association). O tempo médio de
exercício na profissão das intérpretes é de 15 anos (mínimo 6 e máximo 20) e
idade entre 41 e 53 anos, assim distribuídos:
Tabela 2. Intérpretes sujeitos da pesquisa, com respectivas idades e tempo de exercício da profissão.
Sujeito Idade Tempo de profissão
1. S1 45 6
2. S2 46 16
3. S3 53 18
4. S4 52 13
5. S5 44 15
6. S6 48 19
7. S7 48 19
8. S8 51 20
9. S9 47 12
10. S10 45 15
11. S11 50 17
12. S12 41 11
Média 15
58
4.2 Procedimentos metodológicos
4.2.1 Seleção e descrição da fala a ser interpretada
A fala utilizada para o exercício de interpretação foi uma palestra
intitulada Don´t Insist on English (Não Insistam no Inglês), proferida por Patricia
Ryan, de origem britânica, professora de inglês da Universidade de Zayed em
Dubai. A palestra foi filmada em dezembro de 2010 no evento TEDxDubai e
está disponível para download no acervo do TED TALKS, no endereço
http://www.ted.com/search?q=patricia+ryan. A duração total da palestra é de
10:35 minutos. Se desconsiderarmos a vinheta de introdução e finalização do
arquivo sonoro, assim como as pausas cedidas para aplauso ou manifestação
da plateia superiores a 2 segundos, o tempo total de fala é de 9:86 minutos,
com produção de 1370 palavras. A transcrição do discurso original encontra-se
no Anexo 1.
4.2.2 Coleta do corpus
As intérpretes foram audiogravadas através do equipamento Sanako Lab
100, disponibilizado pela Associação Alumni, em quatro sessões consecutivas
no dia 19 de agosto de 2013. Cada profissional trouxe seu próprio laptop e fone
de ouvido para a sessão de gravação, para que a versão a ser interpretada
fosse baixada em seu equipamento. Foram utilizadas entre três e quatro
cabines de interpretação em cada sessão, com ocupação de uma intérprete
por cabine. A ordem de gravação obedeceu a ordem de chegada das
profissionais à Associação Alumni.
Nas cabines, as intérpretes foram instruídas a postar o microfone da
cabine em volta do pescoço, a aproximadamente 7 centímetros de distância da
boca para sua primeira tarefa – falar sobre um tema de sua livre escolha por
aproximadamente um minuto e meio (fala semiespontânea). O objetivo desta
primeira tarefa era ter um registro inicial da fala de cada profissional fora da
tarefa de interpretação, para posterior análise e comparação com a fala
59
interpretada em termos de taxa de elocução, distribuição e número de grupos
entoacionais e pausas e frequência fundamental (f0).
Na sequência, as intérpretes iniciaram a gravação da interpretação em
si. Através de seus fones de ouvido conectados aos laptops, as profissionais
tinham acesso ao áudio e ao vídeo da palestra, assim reproduzindo de maneira
bastante fidedigna um ambiente típico de trabalho, pois podiam acompanhar a
palestrante visualmente enquanto esta proferia sua palestra. Mais uma vez, a
gravação da interpretação foi feita através do microfone da cabine, posicionado
em volta do pescoço de cada intérprete, a aproximadamente 7 centímetros de
distância da boca. Porque as intérpretes utilizavam seus próprios fones de
ouvido como fonte de entrada de áudio e os microfones na cabine como fonte
de saída de áudio, não houve interferência do áudio original no canal de
gravação das intérpretes.
A gravação foi feita na extensão .mp3 e posteriormente convertida
para .wav, canal mono, para análise de fala pelo PRAAT, um software livre
desenvolvido por Paul Boersma e David Weenink, do Instituto de Ciências
Fonéticas de Amsterdam, disponível para download no site www.praat.org.
(BOERSMA, 2002).
4.2.3 Análise Acústica dos Extratos de Áudio
Findo o trabalho de coleta, os áudios completos de cada intérprete foram
abertos no software Praat. Através das ferramentas de edição, o extrato de fala
semiespontânea foi separado da fala interpretada e analisado. Na fala
interpretada, três extratos representativos do discurso foram selecionados para
análise e avaliação – um inicial, na abertura da palestra (com tempo de fala
total, descontados os períodos de aplauso, de 34 seg), um medial, produzido
no meio da palestra, a partir do minuto 5:42 (tempo de fala total, 34 seg) e um
final, na conclusão da palestra (tempo de fala total, 25 seg). Três segmentos
adicionais foram também selecionados para serem posteriormente
incorporados na tarefa de avaliação perceptiva com o objetivo de verificarmos a
60
uniformidade das respostas entre os três grupos de juízes que responderam à
pesquisa. As transcrições dos extratos escolhidos encontram-se no Anexo 2.
Dentro do segmento inicial, havia dois períodos de aplauso no discurso
original, com duração de aproximadamente 5,5 e 2,5 segundos
respectivamente. Na fala das intérpretes, esse tempo de espera se traduzia em
pausas silenciosas, mas com durações diferentes, dependendo da distância de
cada intérprete em relação à fala original. Para deixar as gravações mais
uniformes, optou-se por editar as pausas silenciosas nesses dois pontos,
eliminando qualquer período, nestes dois pontos especificamente, superior a 1
segundo. O mesmo foi feito com a fala original em inglês, para maior
homogeneidade na comparação dos resultados. Os outros extratos não
apresentaram dificuldades e não foram editados.
Os segmentos extraídos da fala de cada intérprete, juntamente com os
segmentos originais em inglês, foram analisados no software Praat. No total, 55
segmentos foram analisados: 12 segmentos contendo a fala semi0espontânea
das intérpretes, 4 segmentos originais (inicial, medial, final e adicional), 12
segmentos contendo os extratos iniciais de cada interpretação, 12 segmentos
contendo os extratos mediais, 12 segmentos contendo os extratos finais, e 3
segmentos contendo os extratos adicionais. Os extratos foram analisados
quanto à quantidade e à distribuição de grupos entoacionais (GE), quantidade
e distribuição de pausas (P), e quantidade e distribuição de alongamentos
vocálicos (AV). Também foram tomadas as medidas de frequência fundamental
(em Hz) média, mínima e máxima de cada extrato.
A Figura 4, a seguir mostra como cada segmento foi analisado
acusticamente. As diferentes camadas mostram a divisão em grupos
entoacionais (GE), incidência de pausas (P) e alongamentos vocálicos (AV). A
segmentação desses elementos foi realizada com base no espectrograma de
banda larga com referência à forma de onda. Como mencionamos
anteriormente, o espectrograma de banda larga é um gráfico que apresenta a
frequência na ordenada, o tempo na abscissa e a intensidade no contraste de
cor (quando o espectrograma é apresentado em tons de cinza, quanto mais
61
escura a região de frequência, maior a intensidade). Os números no eixo
vertical do espectrograma de banda larga mostram a faixa de frequência em
Hz.
Figura 4 – Extrato de segmento analisado, contendo, de cima para baixo, as camadas de: forma de onda com as demarcações dos pulsos glotais em azul, espectrograma de banda larga com traçados de frequência fundamental (em azul) e intensidade (em amarelo) superpostos, camada com identificação dos Grupos Entoacionais, da Pausa e dos Alongamentos Vocálicos percebidos.
4.2.4 Avaliação Perceptiva da Qualidade da Produção Oral dos
Intérpretes
Os extratos foram então submetidos à avaliação de um grupo de 90
juízes, todos cursando ou recém-formados de cursos de Tradução ou
Interpretação, com idade entre 18 e 60 anos. Os juízes foram divididos em três
grupos para analisar 15 extratos de fala. Cada grupo analisou 12 extratos de
fala diferentes (4 iniciais, 4 mediais e 4 finais). Como mencionado 3 extratos
(os extratos adicionais) foram incorporados em todas as versões para
verificação de uniformidade no comportamento de avaliação dos juízes de cada
grupo. Cada versão trazia uma produção de cada uma das intérpretes, de
maneira que todos os 90 juízes avaliaram pelo menos uma fala de cada
intérprete. A distribuição das diferentes versões pode ser visualizada no Anexo
3.
62
A tarefa dos juízes era responder um questionário baseado na Escala de
Likert para verificação de avaliação de qualidade e grau de compreensibilidade.
Este método de avaliação mede uma resposta positiva ou negativa a um
determinado parâmetro de avaliação e é geralmente aplicado em uma escala
de 5 a 7 pontos. Neste estudo, a tarefa dos respondentes era especificar seu
nível de concordância com cada afirmação, dentro de uma escala de cinco
pontos onde 1 significava que o extrato de áudio não atendia em nada o
quesito avaliado, e 5 significava que o extrato atendia extremamente o quesito
avaliado. No total, sete parâmetros foram avaliados, a saber: Agradabilidade
(nada agradável/extremamente agradável), Credibilidade (nada
confiável/extremamente confiável), Naturalidade (nada natural/extremamente
natural), Fluidez (nada fluida/extremamente fluida), Segurança (nada
segura/extremamente segura), Profissionalismo (nada
profissional/extremamente profissional) e Compreensibilidade (nada fácil de
entender/extremamente fácil de entender) (Anexo 4).
A plataforma utilizada foi a Survey Gizmo http://www.surveygizmo.com/,
uma ferramenta de pesquisas online. Cada juiz recebeu um link via email ou
Facebook para identificação e ativação do questionário. Somente os juízes
convidados poderiam responder as perguntas. O questionário foi montado de
forma a considerar apenas válidas as respostas completas; todas as perguntas
eram mandatórias, ou seja, todos os resultados válidos contemplavam 100%
das perguntas respondidas.
4.2.5 Avaliação da qualidade da interpretação em relação ao
discurso interpretado em termos de conteúdo semântico-discursivo
A transcrição das falas foi também submetida à avaliação de conteúdo
por três profissionais com experiência na formação de intérpretes. Os
avaliadores eram intérpretes profissionais, membros das associações AIIC,
APIC e ATA, com idade entre 45 e 51 anos, tempo médio de profissão de 11 a
15 anos e experiência na formação de intérpretes de 3 a 8 anos:
63
Tabela 3. Juízes Avaliadores, com respectivas idades, anos de exercício da profissão e anos de experiência na formação de intérpretes.
Avaliador Idade Experiência em
interpretação
Experiência em formação
(anos)
1 51 anos 15 anos 8 anos
2. 45 anos 11 anos 3 anos
3. 50 Anos 20 anos 12 anos
A tarefa dos juízes avaliadores era analisar cada extrato isoladamente
em comparação ao original (Anexo 5). Consoante com o estudo realizado por
Daniel Gile em 1999, os avaliadores deveriam se concentrar no número de
erros (E), número de omissões (O) e manutenção do sentido original (S) para a
avaliação da qualidade da interpretação, atribuindo uma nota final (T) de 0 a 5
(onde 0 seria considerado insuficiente e 5, excelente) a cada extrato. As notas
de cada intérprete por extrato foram somadas, e cada intérprete recebeu uma
pontuação final cumulativa de 0 a 15. Essa pontuação final foi então dividida
por três para termos uma média final possível entre 0 e 5 para cada intérprete.
4.2.6 Tratamento Estatístico
Os resultados foram armazenados em planilhas Excel da Microsoft,
normalizados com o z-score, que é um método de medição estatística usado
para comparar médias de conjuntos de dados diferentes homogeneamente
distribuídos, e submetidos à Análise Exploratória de Variáveis Múltiplas – MFA
(Multiple Factor Analysis). Por combinar métodos de componentes principais,
agrupamentos hierárquicos e particionamentos, a Análise Exploratória de
Variáveis Múltiplas possibilita destacar as semelhanças e diferenças entre os
estímulos (HUSSON et al, 2013).
Para verificar a semelhança entre os grupos de variáveis, que no nosso
estudo são em número de três: (Gc1, as variáveis acústicas; Gc2, as do
diferencial semântico e Gc 3, as do julgamento da transcrição), utilizamos o
coeficiente Lg dado pela fórmula de Pearson. Além do Lg, outro coeficiente de
correlação de grupos de variáveis é o RV, que mede a proximidade de dois
64
conjuntos de pontos que podem ser representados por uma matriz. O RV = Lg
normalizado representa, em estatística multivariada, o quadrado do coeficiente
de Pearson. Seus valores variam entre 0 e 1.
4.2.7 Comitê de Ética
O protocolo da presente Pesquisa foi submetido ao Comitê de Ética da
Pontifícia Universidade Católica de São Paulo e recebeu aprovação, com
CAAE: 44465314.0.0000.5482.
Neste capítulo descrevemos as diferentes fases da metodologia utilizada
para esta dissertação. No próximo capítulo analisaremos os principais
resultados encontrados.
65
Capítulo 5 - Resultados
Neste capitulo, abordaremos os resultados da pesquisa, iniciando com a
inspeção acústica das falas semiespontânea e interpretada de cada intérprete.
A seguir descreveremos os resultados da análise perceptiva e avaliação do
conteúdo semântico-discursivo das falas interpretadas, fechando o capítulo
com uma comparação entre ambos.
Na exposição dos resultados, determinados procedimentos
metodológicos são retomados para facilitar o acompanhamento do que é
exposto.
5.1 Fala Semiespontânea
A fala semiespontânea das intérpretes foi coletada antes da fala
interpretada em um contínuo de gravação. Finalizada a coleta dos áudios, os
arquivos sonoros foram abertos no software Praat para inspeção das
características acústicas, análise e medição em cada trecho de fala da duração
de pausas silenciosas, grupos entoacionais, alongamentos vocálicos, e das
produções de fala em ms e dos valores máximos e mínimos de f0 em Hz. Uma
primeira janela foi aberta para podermos visualizar os dois momentos da
gravação (Figura 5). O primeiro bloco de ondas sonoras indica a fala
semiespontânea e o segundo bloco a fala interpretada.
Figura 5 – Forma de onda do corpus de gravação completo, incluindo no primeiro bloco (à esquerda) a fala semiespontânea das intérpretes e, no segundo bloco (à direita), sua fala interpretada.
66
Como podemos deduzir a partir da figura acima, pelas diferenças de
amplitude das ondas sonoras, algumas intérpretes variaram a intensidade entre
a fala semiespontânea e a fala interpretada. Perceptivamente, também
observamos essa discrepância em termos de loudness alto e baixo. Entretanto,
a medição da intensidade exigiria além do controle da distância do microfone, o
qual efetuamos, a realização de calibração com um Medidor de Nível de
Pressão Sonora (MNPS), também conhecido por decibelímetro em níveis com
diferença de 20dB entre os canais direito e esquerdo de um gravador
esterefônico a partir da referência de um sinal de frequência em 1000 Hz. No
entanto, como a gravação de ambas as falas foi realizada em um contínuo,
dentro dos mesmos ajustes de gravação, podemos apontar a diferença na
amplitude da forma da onda entre os dois momentos de fala e as diferenças
auditivas de loudness percebidas. Com exceção de uma intérprete, S9, todas
as variações de loudness foram para maior na fala interpretada. Os registros
das ondas sonoras completos relativos às falas de cada intérprete podem ser
visualizados no Anexo 6.
A fala semiespontânea foi então isolada do todo para análise, levando
em consideração o número de grupos entoacionais, o número e a distribuição
de pausas silenciosas, respiratórias ou vocais (através da utilização de ums,
ahns e outros), a presença de alongamentos vocálicos, a taxa de elocução e os
valores de frequência fundamental (mínimos e máximos) como podemos
observar na Figura 6.
67
Figura 6 – Forma de onda, espectrograma de banda larga com superposição do traçado de frequência fundamental, camada de divisão dos grupos entoacionais (GE), camada com as delimitações das pausas silenciosas e camada com as delimitações dos alongamentos vocálicos (AV) na fala semiespontânea do S2.
A fala espontânea teve duração de 83,52 a 106,87 segundos. As
intérpretes apresentaram frequência fundamental média nos segmentos entre
175,68 e 237,84 hertz, consoante aos dados encontrados na literatura que
indicam uma frequência fundamental média de 204 Hz (BARALDI, 2007) para
mulheres adultas (entre 18 e 45 anos) falantes do Português Brasileiro. A
frequência fundamental mínima e máxima foi medida posicionando o cursor
nos valores mínimo e máximo de f0 em cada trecho de fala no traçado gerado
por meio da função show pitch do Praat. Erros de registro de f0 foram
descartados. Com as medidas de frequência fundamental mínima e máxima
coletadas para cada segmento, as configurações de pitch (pitch settings) foram
alteradas, de maneira que o campo de frequência a ser computado ficasse
entre os valores mínimo e máximo identificados para cada extrato. A partir daí,
utilizamos a função get pitch para obter a frequência fundamental média de
cada segmento. O procedimento foi repetido para cada extrato analisado
(inicial, medial, final e adicional original e interpretado).
A taxa de elocução na fala de livre escolha (semi-espontânea) variou de
1,81 a 2,92 palavras por segundo, valores correspondentes a uma variação de
68
108,6 a 175,2 palavras por minuto, achados também consoantes com a
literatura (ZACKIEWICS e ANDRADE, 2000).
A frequência de pausas foi de uma pausa a cada 2,52 a uma pausa a
cada 3,87 segundos, com número de pausas total entre 22 e 36. No geral, a
distribuição de pausas acompanhou a distribuição dos grupos entoacionais (de
23 a 37 grupos entoacionais em cada trecho de fala. Pausas de hesitação no
meio de um grupo entoacional foram achados infrequentes.
5.2 Extratos Originais do Discurso em Inglês
Descontados os intervalos para aplauso, especialmente contidos no
segmento inicial da palestra, os quatro extratos originais do discurso utilizados
nesta pesquisa totalizaram respectivamente 2,49 palavras por segundo; 2,53
palavras por segundo; 1,83 palavras por segundo e 2,31 palavras por segundo.
Se convertermos esses números para palavras por minuto teremos 149,4
palavras por minuto para o segmento inicial, 151,8 para o segmento medial,
109,8 para o segmento final e 138,72 para o segmento adicional. De acordo
com a tabela desenvolvida por Tauroza e Allison para o inglês britânico (1990,
pg 102), essa média revela uma taxa de elocução considerada de normal a
moderadamente lenta para fala em palestra, como observado abaixo:
Tabela 4: Taxa de Elocução média em palavras por minuto verificada em diferentes modos de fala para o Inglês Britânico.
Rádio Palestra Entrevista Conversação
Acima do normal 190 185 250 260
Moderadamente rápido 170 – 190 160 – 185 210 – 250 230 – 260
Normal 150 – 170 125 – 160 160 – 210 190 – 230
Moderadamente lenta 130 – 150 100 – 125 120 – 160 160 – 190
Abaixo do normal 130 100 120 160
A frequência média observada nos segmentos inicial, medial, final e
adicional originais foi de 219,32 hz, com a média de frequência mais alta sendo
69
verificada no primeiro segmento (239,89h). A distribuição e número de grupos
entoacionais e pausas apresentou o mesmo padrão que a fala semiespontânea
das intérpretes, com uma frequência de uma pausa a cada 2,71 segundos, em
média.
5.3 Fala Interpretada
A taxa de elocução das falas interpretadas apresentou grande
variabilidade, com algumas intérpretes se aproximando mais da taxa original e
outras utilizando taxas mais lentas ou mais rápidas, sem um padrão
estabelecido. No entanto, entre as 12 intérpretes gravadas, dez diminuíram sua
taxa de elocução ao iniciar a interpretação, mantendo no geral uma taxa
consistentemente inferior à taxa da fala semiespontânea, independentemente
da taxa de elocução da fala original. A Tabela 5 traz uma comparação do
número de palavras por minuto entre as diferentes falas.
Tabela 5 – Número de palavras por minuto produzidas por cada um dos Sujeitos e Palestrante, contemplando: Fala Original (O), nas posições Inicial (I), medial (M) e Final (F); Fala Semiespontânea (SE); e Segmentos Interpretados de cada intérprete nas posições Inicial (I), Medial (M) e Final (F).
O S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12
SE 171,6 160,8 108,6 162 175,2 135,6 141,6 141 164,4 142,2 138 153
I 149,4 148,8 139,8 103,2 132 133,8 121,2 133,8 115,2 136,8 151,2 129 156
M 151,8 127,2 143,4 102,6 120 127,8 146,4 132 123,6 155,4 151,2 147 132
F 109,8 124,8 121,1 103,2 120 135,6 133,8 126,6 112,8 111,6 135,6 141 122,4
Em relação à distribuição e número de grupos entoacionais e pausas, as
falas interpretadas apresentaram mais frequentemente um número de pausas
superior ao número de grupos entoacionais, indicando a utilização de pausas
silenciosas, respiratórias ou vocais (através da utilização de ums, ahns e
outros) não só entre grupos entoacionais, mas também intragrupos. Esses
achados são consoantes aos de Scheslinger (1994), com as intérpretes
introduzindo um número maior de pausas em posições consideradas não
“naturais”, quebrando assim as unidades de sentido dentro de um mesmo
grupo entoacional e produzindo sensação de hesitação.
70
Todas as intérpretes registraram aumento na frequência fundamental
média na fala interpretada em comparação à fala semi-espontânea. No geral, o
segmento inicial foi o que apresentou os maiores picos de frequência,
registrando variação entre 194,66 e 267,95 hz, comparados aos valores entre
175,68 e 237,84 hz da fala semi-espontânea. É interessante observar que o
segmento inicial foi também o segmento com registro de maior frequência na
fala original.
A Tabela 6 traz a compilação da duração total dos segmentos de fala
analisados, bem como os dados relativos ao número de palavras por segundo
e por minuto, ao número de grupos entoacionais, ao número de pausas total,
ao número de pausas por segundo, ao número de alongamentos vocálicos
percebidos e às medições de frequência fundamental (média, valor mínimo e
valor máximo) de todos os extratos analisados.
Tabela 6 – Resultados obtidos com o levantamento de ocorrências e medições de parâmetros acústicos. Da esquerda para a direita: tipos de segmentos de fala analisados, sua duração total, número de palavras por segundo e por minuto, número de grupos entoacionais, número de pausas total, número de pausas por segundo, número de alongamentos vocálicos percebidos e valores de frequência fundamental (média, valor mínimo e valor máximo).
S1 Tempo TXE TXE GE P P AV f0 f0min f0max
seg pal/s pal/m no. no. p/s no. hz hz Hz
Livre Escolha 85,01 2,86 171,6 29 30 2,83 3 195,28 80,13 372,2
Seg_inicial 35,39 2,48 148,8 13 15 2,35 10 211 119,8 373
Seg_medial 32,91 2,12 127,2 11 13 2,53 1 199,75 120,8 341,6
Seg_final 25,41 2,08 124,8 11 11 2,31 0 180,7 120,1 258,4
S2
Livre Escolha 88,67 2,68 160,8 24 23 3,85 5 211,79 142,9 467,3
Seg_inicial 2,73 2,33 139,8 13 13 2,8 4 249,37 141,2 463,8
Seg_medial 32,21 2,39 143,4 9 9 3,57 2 236,53 147,8 459,4
Seg_final 26,72 2,02 121,2 12 13 2,05 1 236,14 168,6 402,6
S3
Livre Escolha 106,87 1,81 108,6 29 28 3,81 1 207,02 173,7 444
Seg_inicial 24,66 1,72 103,2 9 10 2,46 1 230,5 142,2 407,8
71
Seg_medial 32,6 1,71 102,6 8 13 2,5 1 237,13 77,32 398,9
Seg_final 25,46 1,72 103,2 6 5 5,09 0 223,74 139,3 388,4
S4
Livre Escolha 88,97 2,7 162 24 23 3,86 1 197,96 122,3 394,8
Seg_inicial 38,99 2,2 132 15 17 2,29 4 250,13 138,3 495,4
Seg_medial 33,34 2 120 8 11 3,03 2 236,54 138,8 372,2
Seg_final 25,39 2 120 9 9 2,82 4 231,32 139,9 410,2
S5
Livre Escolha 85,85 2,92 175,2 35 34 2,52 4 191,17 110,2 475
Seg_inicial 36,22 2,23 133,8 12 14 2,58 4 214,11 138,2 458
Seg_medial 31,81 2,13 127,8 7 11 2,89 3 222,97 80,91 473,7
Seg_final 25,21 2,26 135,6 7 8 2,95 2 215,91 155,5 358,2
Adicional 34,63 2,16 129,6 9 10 3,46 2 204,87 74,59 393,3
S6
Livre Escolha 104,36 2,26 135,6 37 36 2,89 5 210 155,8 371,5
Seg_inicial 29,14 2,02 121,2 13 13 2,24 2 238,49 155,3 469,6
Seg_medial 31,5 2,44 146,4 11 14 2,62 0 243,32 173,6 412,7
Seg_final 26 2,23 133,8 9 8 3,25 0 243,31 165,7 417,9
S7
Livre Escolha 93,56 2,36 141,6 26 25 3,74 5 179,34 64,71 288,7
Seg_inicial 39,42 2,23 133,8 12 13 3,03 6 258,6 151,9 481,2
Seg_medial 34,86 2,2 132 8 9 3,87 2 267,95 75,75 465,3
Seg_final 23,62 2,11 126,6 8 7 3,37 1 234,72 142,7 466,9
Adicional 36,68 1,88 112,8 7 9 4,58 2 253,92 144,3 486,3
S8
Livre Escolha 83,52 2,35 141 24 23 3,63 0 175,68 83,32 324,4
Seg_inicial 37,83 1,92 115,2 11 10 3,78 5 194,66 100,8 343,4
Seg_medial 32,41 2,06 123,6 9 11 2,94 1 203,87 143,3 315,7
Seg_final 24,43 1,88 112,8 8 8 3,05 1 206,35 85,3 303,8
S9
Livre Escolha 84,9 2,74 164,4 28 27 3,14 5 183,8 84,06 356,4
Seg_inicial 35,45 2,28 136,8 10 12 2,95 2 222,47 95,32 441,5
Seg_medial 31,58 2,59 155,4 8 12 2,63 1 194,27 87,05 463,1
72
Seg_final 25,18 1,86 111,6 10 11 2,28 0 185,39 129,5 332,5
S10
Livre Escolha 87,76 2,37 142,2 23 22 3,98 0 178,52 129,8 354,4
Seg_inicial 36,15 2,52 151,2 11 13 2,78 3 221,15 143,5 459,5
Seg_medial 31,74 2,52 151,2 8 9 3,52 0 208,43 76,34 374,4
Seg_final 25,19 2,26 135,6 7 8 3,14 3 193,83 140,4 306,2
S11
Livre Escolha 88,65 2,3 138 25 24 3,56 33 166,24 91,14 273,9
Seg_inicial 37,51 2,15 129 11 13 2,88 4 200,02 126,3 332
Seg_medial 34,32 2,45 147 13 14 2,45 2 196,58 115,9 410,4
Seg_final 24,61 2,35 141 12 10 2,46 1 178,59 119,3 305,6
S12
Livre Escolha 94,35 2,55 153 30 29 3,25 8 237,84 140,1 458
Seg_inicial 38,73 2,6 156 11 16 2,42 1 240,87 111,5 481,5
Seg_medial 33,59 2,2 132 6 10 3,35 0 240,4 100 371,4
Seg_final 24,96 2,04 122,4 9 11 2,26 1 231,34 95,5 348,1
Adicional 33,04 2,17 130,2 8 11 3 1 252,65 98,63 447,1
Original
Seg_inicial 34,49 2,49 149,4 11 10 3,49 0 239,89 121 401,7
Seg_medial 32,79 2,53 151,8 10 10 3,27 0 205,97 123,8 386,3
Seg_final 24,55 1,83 109,8 12 12 2,04 0 218,52 132,3 398,4
Adicional 32,87 2,31 138,6 14 16 2,05 1 212,91 68,74 427,3
5. 4 Avaliação Perceptiva da Qualidade da Produção Oral dos
Intérpretes
Noventa juízes entre 18 e 60 anos participaram da pesquisa, com um
total de 21 juízes da área de tradução (23,3%) e 69 da área de interpretação
(76,5%). Vinte e cinco juízes (27,78%) haviam concluído seu curso nos últimos
dois anos, com o restante 65 juízes (72,2%) ainda matriculados nos seus
respectivos cursos de tradução ou interpretação da Pontifícia Universidade
Católica (Curso de Graduação em Tradução e Curso Sequencial de
Interpretação). Os juízes foram divididos em grupos de trinta para a avaliação
73
das três versões. O perfil dos juízes de cada versão pode ser observado na
Tabela abaixo:
Tabela 7 – Perfil dos juízes em cada versão da avaliação perceptiva, V1, V2 e V3, mostrando números percentuais e absolutos de participantes em cursos de Tradução ou de Interpretação e se foram concluídos ou estão em andamento.
V1
V2
V3
Curso Percentual No. Percentual No. Percentual No.
Tradução 10.0% 3 33.3% 10 26.7% 8
Interpretação 90.0% 27 66.7% 20 73.3% 22
Concluído 50.0% 15 10.0% 3 23.3% 7
Não concluído 50.0% 15 90.0% 27 76.7% 23
Como mostrado no Anexo 3, cada versão de avaliação contava com 4
segmentos iniciais, 4 segmentos mediais, 4 segmentos finais e 4 segmentos
adicionais, de forma que cada juiz tivesse a oportunidade de ouvir cada
intérprete pelo menos uma vez. Os três segmentos adicionais foram repetidos
em todas as versões para verificação da uniformidade no julgamento das falas
dos intérpretes.
Cada extrato foi avaliado através de uma Escala de Likert de 5 pontos. A
tarefa dos juízes era a de escolher para cada extrato ouvido se o áudio não
atendia em nada o quesito avaliado, se atendia pouco o quesito avaliado, se
não atendia nem muito nem pouco o quesito avaliado, se atendia muito o
quesito avaliado ou se atendia extremamente o quesito avaliado. Os resultados
foram então ponderados para atribuição de nota, com “Nada” recebendo peso
1, “Pouco” recebendo peso 2, “Nem Muito nem Pouco” recebendo peso 3,
“Muito” recebendo peso 4 e “Extremamente” recebendo peso 5. As notas
atribuídas a cada extrato foram então multiplicadas por seu peso ponderado,
somadas e divididas pelo número de juízes, para chegarmos a uma média final
por extrato. Os dados individualizados médios ponderados de cada extrato da
avaliação perceptiva da fala interpretada podem ser encontrados no Anexo 7.
A seguir, os resultados médios ponderados das avaliações dos
segmentos adicionais.
74
Tabela 8 – Resultados médios ponderados da avaliação dos segmentos adicionais em cada Versão (V1, V2 e V3).
S5 V1 V2 V3
Agradabilidade 3,53 3,76 3,8
Confiabilidade 3,53 3,56 3,53
Naturalidade 3,76 3,46 3,56
Fluidez 3,8 3,43 3,5
Segurança 3,53 3,53 3,46
Profissionalismo 3,73 3,63 3,63
Compreensibilidade 3,46 3,43 3,53
Média 3,62 3,54 3,57
S7 V1 V2 V3
Agradabilidade 2,1 1,53 1,5
Confiabilidade 2,6 2,23 2,56
Naturalidade 2,06 1,73 1,93
Fluidez 2,16 2,13 2,26
Segurança 2,56 2,46 2,96
Profissionalismo 2,3 2,1 2,26
Compreensibilidade 2,56 2,63 2,8
Média 2,33 2,11 2,32
S12 V1 V2 V3
Agradabilidade 3,26 3,13 3,1
Confiabilidade 3,5 3,13 3,06
Naturalidade 3,13 3,06 2,83
Fluidez 3,33 3,1 2,9
Segurança 3,23 3,36 3,1
Profissionalismo 3,26 3,36 2,96
Compreensibilidade 3,46 3 2,86
Média 3,31 3,16 2,97
Apesar de diferenças em números absolutos, os três grupos chegaram a
um mesmo resultado em termos de classificação dos extratos, com o S5
75
recebendo as maiores pontuações, S12 em segundo lugar e S7 em terceiro
lugar.
A Tabela 9 abaixo traz os resultados médios ponderados obtidos nas
avaliações das Versões 1, 2 e 3 em relação a cada Sujeito, nos segmentos
inicial (I), medial (M) e final (F).
Tabela 9 – Resultados médios ponderados finais da avaliação de cada intérprete nos extratos interpretados, por segmento Inicial (I), Medial (M) e Final (F).
Agrad Conf Nat Flu Seg Prof Comp
S1
I 3,33 3,5 3,4 3,4 3,5 3,2 3,5
M 3,93 3,96 3,96 3,86 4,03 3,9 3,86
F 2,7 3,36 2,96 3,3 3,26 3,33 3,26
S2
I 3,33 3,7 3,2 3,56 3,83 3,8 3,7
M 4,36 4,36 4,36 4,33 4,36 4,36 4,16
F 4,2 4,16 4,16 4,23 4,16 4,2 4,26
S3
I 2,86 2,6 2,5 2,36 2,53 2,76 2,53
M 2,36 2,4 2,23 2,3 2,33 2,63 2,23
F 2,8 2,53 2,56 2,3 2,4 2,46 2,4
S4
I 3,73 3,83 3,83 3,96 4 3,9 4,06
M 4,2 3,86 3,76 3,66 3,76 3,76 3,8
F 3,5 3,73 3,53 3,7 3,46 3,56 3,86
S5
I 3,46 3,46 3,13 3,13 3,33 3,56 3,63
M 4,3 4,2 3,93 3,86 3,96 4 3,73
F 4,4 4,46 4,36 4,5 4,6 4,46 4,56
S6
I 3,13 3,3 3,23 3,06 3,2 3,2 3,6
M 3,66 3,6 3,56 3,6 3,5 3,6 3,6
76
F 3,86 3,76 3,83 3,8 3,63 3,7 3,83
S7
I 2,53 3,16 2,6 3,03 3,13 3 3,5
M 2,46 3,16 2,73 2,86 3,3 3,03 3,26
F 1,73 3,13 2,13 3,16 3,63 3 3,2
S8
I 2,2 2,96 2,73 2,73 2,96 3,03 3,66
M 1,9 3,03 2,63 2,83 3,23 3,06 2,73
F 2,4 2,8 2,76 2,5 2,83 2,83 2,86
S9
I 2,1 2,36 2,46 2,2 2,23 2,46 2,86
M 3,03 3,1 2,96 2,8 2,8 3,13 3,16
F 3,23 2,76 2,56 2,4 2,86 2,7 2,73
S10
I 2,23 3,26 3,13 3,56 3,66 3,5 3,63
M 2,03 2,93 2,26 2,63 3,13 2,9 2,63
F 2,46 3,13 2,96 3,36 3,6 3,3 3,23
S11
I 2,76 3,2 2,76 2,96 3,13 3,16 3,5
M 3,56 4,16 3,86 4,1 4,3 4,16 4,26
F 2,23 3,03 3,1 3,1 3,8 3,26 3,66
S12
I 3,13 2,86 2,8 2,7 2,63 2,8 3,03
M 2,93 3,06 3,06 2,93 3 3,13 3,13
F 3,5 3,76 3,6 3,8 3,73 3,6 3,86
A média final de cada intérprete na avaliação da fala interpretada pode
ser encontrada na Tabela 10. Os quesitos em que as intérpretes apresentaram
as menores notas foram Agradabilidade, Naturalidade, Fluidez e Segurança
(nesta ordem).
Na média, nenhuma intérprete teve avaliação abaixo de 2 nem atingiu a
marca de 5. As médias finais das intérpretes estão na última coluna à direita.
77
Tabela 10 - Média ponderada final de cada quesito por sujeito (compilação dos segmentos inicial, medial e final).
Média Agrad Conf Nat Flu Seg Prof Compr MF
S1 3,32 3,6 3,44 3,52 3,59 3,47 3,54 3,49
S2 3,96 4,07 3,9 4,04 4,11 4,12 4,04 4,03
S3 2,67 2,51 2,43 2,32 2,42 2,61 2,38 2,47
S4 3,81 3,8 3,7 3,77 3,74 3,74 3,9 3,78
S5 4,05 4,04 3,8 3,83 3,96 4 3,97 3,94
S6 3,55 3,55 3,54 3,48 3,44 3,5 3,67 3,52
S7 2,24 3,15 2,48 3,01 3,35 3,01 3,32 2,93
S8 2,1 2,93 2,7 2,68 3 2,97 3,08 2,79
S9 2,78 2,74 2,66 2,46 2,63 2,76 2,91 2,7
S10 2,24 3,1 2,78 3,18 3,46 3,23 3,16 3,02
S11 2,85 3,46 3,24 3,38 3,74 3,52 3,8 3,42
S12 3,18 3,22 3,15 3,14 3,12 3,17 3,34 3,19
5.5 Avaliação da qualidade da interpretação em relação ao discurso
interpretado em termos de conteúdo semântico-discursivo
Foram calculadas as médias a partir das notas atríbuídas aos quesitos
avaliados em relação à performance de cada intérprete em cada extrato de fala
e atribuída a cada intérprete uma pontuação final. Os resultados das
avaliações de conteúdo de cada avaliador foram então comparados para
verificação de uniformidade na ordem de classificação dos sujeitos. Quando as
médias finais eram as mesmas, o primeiro critério de desempate utilizado foi
contabilizar as maiores notas no nível dos segmentos, primeiramente
considerando a incidência total da nota mais alta, depois a incidência total da
segunda nota mais alta e assim por diante. Só foi considerado empate
pontuações com exatamente a mesma composição de notas, o que aconteceu
duas vezes. Neste caso, a posição imediatamente abaixo ficou vaga. As
avaliações completas de cada avaliador por sujeito e por segmento podem ser
78
visualizadas no Anexo 8. A tabela abaixo mostra a classificação dos Sujeitos
de acordo com cada Avaliador.
Tabela 11 – Classificação final de cada sujeito por avaliador (compilação dos segmentos inicial, medial e final).
Avaliador 1 Avaliador 2 Avaliador 3
1º lugar S2 S5 S2 S5
2º lugar S1 S1
3º lugar S10 S10 S2
4º lugar S4 S1 S7
5º lugar S7 S7 S11
6º lugar S5 S12 S9 S10
7º lugar S12 S8
8º lugar S11 S11 S4
9º lugar S9 S6 S8
10º lugar S8 S4 S6
11º lugar S6 S9 S12
12º lugar S3 S3 S3
Cinco sujeitos, S1, S2, S5, S7 e S10 apareceram nas primeiras seis
posições nas avaliações dos três juízes. Três sujeitos, S3, S6 e S8 apareceram
nas seis últimas posições. Os sujeitos S4, S9, S11 e S12 aparecem uma vez
entre os seis primeiros e duas vezes entre os seis últimos colocados.
A Tabela abaixo traz a média e classificação final de cada Sujeito.
Tabela 12 – Nota final atribuída a cada sujeito por avaliador, média dos três avaliadores e classificação dos sujeitos.
Avaliador
1
Avaliador
2
Avaliador
3
MÉDIA Classif.
S1 4 4,83 4,67 4,5 3º
S2 4,33 4,93 4,67 4,64 1º
S3 1,00 1,83 2,33 1,72 12º
S4 3,67 4,53 4,33 4,17 6º
79
S5 3,67 4,93 5,00 4,53 2º
S6 2,00 4,53 3,67 3,4 11º
S7 3,67 4,77 4,67 4,37 4º
S8 2,33 4,60 4,00 3,64 10º
S9 2,67 4,43 4,33 3,81 9º
S10 3,67 4,87 4,33 4,29 5º
S11 3,00 4,60 4,67 4,09 7º
S12 3,33 4,77 3,67 3,92 8º
5.6 Comparação das análises perceptiva e de conteúdo semântico-
discursivo
De um modo geral, as médias finais de avaliação do conteúdo da fala
interpretada mostraram um espectro de pontuação mais amplo que o da
análise perceptiva, com a média mais baixa sendo 1,72 e a mais alta 4,64 para
a primeira contra 2,47 e 4,03 para a segunda. Abaixo podemos ver uma
comparação das avaliações. As diferentes cores sinalizam a classificação das
intérpretes. Em azul, resultados iguais ou com apenas uma posição de
diferença. Em verde, duas posições de diferença. Em vermelho, três posições
de diferença e em destaque os dois sujeitos que apresentaram diferença de
cinco posições.
Tabela 13 - Comparação das médias finais ponderadas das avaliações das transcrições e dos arquivos sonoros.
Intérprete Média
Transcrições
Classificação Média
Arquivos
Sonoros
Classificação
Sujeito 1 4,5 3º 3,49 5º
Sujeito 2 4,6433 1º 4,03 1º
Sujeito 3 1,72 12º 2,47 12º
Sujeito 4 4,1767 6º 3,78 3º
Sujeito 5 4,5333 2º 3,94 2º
Sujeito 6 3,4 11º 3,52 4º
80
Sujeito 7 4,37 4º 2,93 9º
Sujeito 8 3,6433 10º 2,79 10º
Sujeito 9 3,81 9º 2,7 11º
Sujeito 10 4,29 5º 3,02 8º
Sujeito 11 4,09 7º 3,42 6º
Sujeito 12 3,9233 8º 3,19 7º
Seis sujeitos da pesquisa tiveram exatamente a mesma classificação
nas duas avaliações; Sujeito 2 – 1ª posição; Sujeito 5 – 2ª posição; Sujeito 11 –
7ª posição; Sujeito 12 – 8ª posição; Sujeito 8 – 10ª posição e Sujeito 3 – 12ª
posição.
Os Sujeitos 2 e 5 receberam as melhores pontuações em ambas as
avaliações. Se observarmos a análise acústica da produção da interpretação,
veremos que as duas intérpretes apresentaram pouca variabilidade entre a
produção semi-espontânea e a produção interpretada em relação à intensidade
(análise perceptiva, vide Anexo 6), número e distribuição de pausas e grupos
entoacionais e alongamentos vocálicos. As variações de taxa de elocução e de
frequência média foram inferiores a 20%, a primeira a menor na fala
interpretada, e a segunda a maior na fala interpretada. Os quesitos com maior
pontuação na análise perceptiva foram o de Profissionalismo (Sujeito 2) e
Agradabilidade da voz (Sujeito 5). Os quesitos mais adversos foram
Naturalidade (Sujeito 2) e Fluidez (Sujeito 5).
Os Sujeitos 11, 12, 8 e 3 aparecem entre os seis piores classificados em
ambas as avaliações. Os Sujeitos 8 e 3 apresentam a menor taxa de elocução
do grupo, com produção média de taxa de elocução na fala interpretada de
117,2 palavras por minuto e 103 palavras por minuto, respectivamente,
comparados a média de 137,4 do discurso original e 133,88 do restante das
intérpretes, uma diferença de aproximadamente 20%. O Sujeito 3 tem Fluidez
com a pior pontuação e Agradabilidade da voz como o quesito melhor avaliado,
enquanto para o Sujeito 8 este é o parâmetro com pior avaliação.
Compreensibilidade é a melhor pontuação do Sujeito 8.
81
O Sujeito 12 apresenta a maior incidência de pausas interrompendo
unidades de sentido (grupos entoacionais) e a maior frequência fundamental
média. O Sujeito 11 apresenta a menor frequência fundamental média. Os
quesitos com pior avaliação foram Segurança (Sujeito 12) e Agradabilidade de
voz (Sujeito 11). O mais bem avaliado foi Compreensibilidade para ambos.
Os Sujeitos 1 e 9 apresentaram diferenças de duas posições entre a
avaliação semântica-discursiva e a avaliação perceptiva da fala, a menor para
a segunda, com o Sujeito 1 passando da 3ª para a 5ª posição e o Sujeito 9 da
9ª para a 11ª posição.
O Sujeito 4 e o Sujeito 10 registraram uma diferença de 3 posições
cada, com o Sujeito 4 passando da 6ª para a 3ª posição e o Sujeito 10 da 5ª
para a 8ª posição. As melhores avaliações ficaram em Compreensibilidade
(Sujeito 4) e Segurança (Sujeito 10) e as piores Naturalidade (Sujeito 4) e
Agradabilidade de voz (Sujeito 10).
Agradabilidade de voz foi o quesito com menor pontuação para 5 das 12
intérpretes e com a maior pontuação para duas delas, talvez sugerindo que a
qualidade vocal da intérprete pode ter um papel importante na percepção da
qualidade de seu trabalho. No entanto, a agradabilidade da voz não apresentou
impacto na avaliação de compreensibilidade da interpretação, uma vez que
esses dois descritores tiveram, no geral, avaliação diretamente oposta, com
agradabilidade de voz tendo a pior avaliação no cômputo de todas as
intérpretes (média geral de 3,06) e compreensibilidadeimpa maior (média geral
de 3,42).
Efetivamente, a maior diferença encontrada entre as avaliações ficou
com os Sujeitos 6 e 7. O Sujeito 6 passou da 11ª posição em conteúdo para 4ª
posição na análise perceptiva da fala. Em movimento contrário, o Sujeito 7
passou da 4ª posição em conteúdo para 9ª posição na análise perceptiva.
Enquanto o Sujeito 6 registra na análise acústica padrão semelhante aos
sujeitos melhor avaliados na análise perceptiva (pouca variabilidade entre a
produção semi-espontânea e a produção interpretada em relação à
intensidade, número e distribuição de pausas e grupos entoacionais e
alongamentos vocálicos e taxa de elocução e de frequência média com
82
diferença inferior a 20%, o Sujeito 7 apresenta a maior variabilidade entre falas,
com grande aumento de intensidade e aumento de frequência fundamental
superior a 30%. O pior quesito para o Sujeito 7 foi agradabilidade de voz, como
o quesito melhor avaliado sendo Segurança. A percepção de segurança está
relacionada na literatura sobre expressividade com f0 abaixado. O Sujeito 7
está no grupo dos sujeitos que têm o f0 mais baixo.
Apesar de posições diferentes, esta combinação de Agradabilidade de
Voz com a pontuação mais baixa e Segurança como quesito melhor avaliado
se repete para três das doze intérpretes. O segundo quesito com pior avaliação
entre as intérpretes é Naturalidade, com 3 intérpretes registrando menor
pontuação neste parâmetro.
Dada a destacada importância da compreensibilidade na tarefa de
interpretação, consideraremos, a seguir, as porcentagens obtidas na avaliação
desse descritor em grau alto (muito e extremamente) nos extratos de fala
analisados e discutiremos o impacto dos fatores prosódicos em relação aos
resultados obtidos. A compreensibilidade baixa remete ao nada ou pouco
compreensível e a compreensibilidade média a nem muito nem pouco no teste
de diferencial semânico aplicado.
A Tabela 14 apresenta os resultados da avaliação da fala de cada
intérprete em relação aos três trechos (inicial, medial e final) de fala
interpretada.
Tabela 14 - Compreensibilidade atribuida a cada sujeito por extrato (Inicial, Medial e Final), totalizando as porcentagens de compreensibilidade alta (muito e extremamente), media (nem muito nem pouco) e baixa (pouco e nada).
Sujeito Compreensibilidade Inicial Medial Final
S1 Baixa 13,30% 13,30% 20,00%
Média 40,00% 16,70% 33,30%
Alta 46,70% 70,00% 46,60%
S2 Baixa 13,30% 6,60% 0,00%
Média 26,70% 6,70% 10,00%
Alta 60,00% 86,70% 90,00%
S3 Baixa 56,60% 63,30% 43,40%
Média 20,00% 26,70% 46,70%
Alta 23,30% 10,00% 10,00%
83
S4 Baixa 0,00% 16,70% 6,70%
Média 23,30% 13,30% 16,70%
Alta 76,70% 70,00% 76,70%
S5 Baixa 10,00% 3,30% 0,00%
Média 30,00% 20,00% 6,70%
Alta 60,00% 76,60% 93,30%
S6 Baixa 6,60% 16,60% 3,30%
Média 33,30% 10,00% 33,30%
Alta 60,00% 73,40% 63,30%
S7 Baixa 16,70% 23,30% 26,60%
Média 33,30% 33,30% 30,00%
Alta 50,00% 43,40% 43,40%
S8 Baixa 23,30% 36,70% 33,30%
Média 36,70% 46,70% 40,00%
Alta 40,00% 16,70% 26,70%
S9 Baixa 33,30% 23,30% 40,00%
Média 46,70% 40,00% 40,00%
Alta 20,00% 36,70% 20,00%
S10 Baixa 10,00% 43,40% 16,60%
Média 30,00% 36,70% 50,00%
Alta 60,00% 20,00% 33,30%
S11 Baixa 6,70% 3,30% 3,30%
Média 50,00% 6,70% 36,70%
Alta 43,30% 90,00% 60,00%
S12 Baixa 30,00% 20,00% 13,30%
Média 36,70% 50,00% 16,70%
Alta 33,30% 30,00% 70,00%
Como podemos observar, somente os sujeitos 2, 4, 5 e 6 alcançaram
porcentagens acima de 60% na avaliação dos três trechos de fala interpretada.
O sujeito 11 obteve porcentagem inferior a 50% em um dos extratos
(inicial). Se compararmos a produção desse extrato com os extratos medial e
final, que pontuaram maior compreensibilidade, podemos ver que o extrato
inicial é o que apresenta a maior quantidade de pausas não naturais (de um
total de 13 pausas, 3 pausas (20%) foram encontradas, interferindo na
formação dos grupos entoacionais) e também o maior número de
alongamentos vocálicos, como podemos ver na tabela abaixo:
84
Tabela 15 – Resultados do Sujeito 11 por extrato (Inicial, Medial e Final), mostrando o número de Grupos Entoacionais (GE), Número de Pausas (P) e Número de Alongamentos Vocálicos (AV).
S11 GE P AV
Seg_inicial 11 13 4
Seg_medial 13 14 2
Seg_final 12 10 1
Os sujeitos 1, 7, 10 e 12 foram avaliados com porcentagens abaixo de
50% em dois dos extratos e os sujeitos 3, 8 e 9, nos 3 extratos. Vale lembrar
que os sujeitos 1 e 7 tiveram média na avaliação das transcrições superior a 4
(Sujeito 1 = 4,5 e Sujeito 7 = 4,37), ou seja, o conteúdo estava presente em
suas falas, mas a maneira de expressá-lo trouxe dificuldades de compreensão.
Esses resultados indicam que a compreensibilidade da fala do intérprete é
afetada pelas características prosódicas.
5.7 Análise Estatística
Os dados quantitativos foram normalizados usando o z-score. Como
podemos verificar no dendograma da Figura 7 abaixo, formaram-se dois
clusters principais, um englobando os sujeitos 1, 11, 5, 4, 2 e o outro os demais
sujeitos. Dentro desses clusters apresentam-se mais próximos os sujeitos: 1 e
11; 12 e 6; 10, 8 e 9; 5, 4 e 2. O Sujeito 3 é o mais afastado do grupo. Esse foi
o sujeito que obteve as piores avaliações em termos de avaliação da
transcrição e de expressividade oral. Um outro sujeito mais afastado dos
demais no grupo é o Sujeito 7, que embora muito bem avaliado na avaliação
de transcrição, foi mal avaliado quanto à expressão oral.
85
Figura 7: Dendograma com a distribuição dos sujeitos em clusters.
Ainda sobre a distribuição dos sujeitos, considerando-se as Dimensões
1 e 2 (Dim1 e Dim 2), que apresentam melhor projeção no espaço vetorial,
verificamos que, se compararmos com a ordem de classificação obtida a partir
da avaliação pelos juízes dos arquivos sonoros, a distribuição dos sujeitos é
fortemente influenciada pelos fatores prosódicos. Os agrupamentos nos
quadrantes das Dimensões 1 e 2 do gráfico da Figura 8 demonstram o impacto
dos fatores relativos à expressão oral na ordenação dos posicionamentos em
termos das distâncias entre os sujeitos. Se compararmos a sequência de
ordenação dos posicionamentos em relação à correção que apresentamos no
Tabela 13 temos, em relação à avaliação da transcrição 2, 5, 1, 7, 10, 4, 11,
86
12, 10, 7, 8, 6 e 3 e, em relação à expressão oral; 2, 5, 4, 6, 1, 11, 12, 10, 7, 8,
9 e 3. Verificamos que os agrupamentos seguem a sequência relativa à
ordenação segundo à expressão oral. Na Figura 8 a seguir, podemos observar
em no quadrante superior direito, os sujeitos 2, 5 e 4, no inferior direito, sujeitos
6,1 e 11, no inferior esquerdo o 8 e o 9 e no superior direito mo ais próximos a
linha média horizontal, o os sujeitos 12 e 10 e mais afastados o 7 e o 3.
Figura 8 - Distribuição dos sujeitos de acordo com as Dimensões 1 e 2 (Dim 1 e Dim 2) do espaço vetorial.
Pela aplicação da MFA, verificamos, também, que os estilos se
separaram. Na Figura 9, verificamos nos quadrantes do lado esquerdo a
distribuição no estílo de Fala Interpretada (I) e nos do lado direito a de fala
semiespontânea (SE). Isso siginifica que todos os sujeitos se diferenciaram
quanto ao estilo.
87
Figura 9 – Distribuição dos sujeitos de acordo com o estilo de fala interpretada (I) e de fala semiespontânea (E).
Foram as variáveis da DIM 1, a Z.VarF0 (z-score da variação de f0) e a
AZ.F0MED (z-score da média de F0) que tiveram uma grande influência nesse
arranjo dos estímulos e provocaram a separação entre os estímulos I e SE. Os
sujeitos 7, 11 e 1 são os que tiveram maior variação entre a fala interpretada e
a semiespontânea; os demais apresentaram menor variação, estando os
Sujeitos 2 e 4 entre os menores.
Pelos valores de Lg, que podem ser visualizados na Tabela 16, o grupo
de variáveis com maior força é o Gc1, ou seja, o dos correlatos acústicos da
prosódia. Pelos valores do RV, que pode ser visualizado na Tabela 17, o grupo
88
que melhor se aproxima dos demais é o Gc2, ou seja o do diferencial
semântico. O Gc1 apresenta mais representatividade em maior número de
dimensões (Dim 2, 3, 4 e 5), como podemos observar na Tabela 18.
Tabela 16- Valores de LG em relação a cada grupo de variáveis: Gc1 (acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição).
Gc1 Gc2 Gc3 MFA
Gc1 1,3646 0,3227 0,2805 0,9174
Gc2 0,3227 1,0047 0,6046 0,9008
Gc3 0,2805 0,6046 1 0,8789
MFA 0,9174 0,9008 0,8789 1,2575
Tabela 17 - Valores de RV em relação a cada grupo de variáveis: Gc1 (acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição.
Gc1 Gc2 Gc3 MFA
Gc1 1 0,2756 0,2401 0,7004
Gc2 0,2756 1 0,6032 0,8014
Gc3 0,2401 0,6032 1 0,7838
MFA 0,7004 0,8014 0,7838 1
Tabela 18 - Representatividade dos grupos nas 5 Dimensões (Dim 1,2,3,4 e 5) Gc1 (acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição).
Dim,1 Dim,2 Dim,3 Dim,4
Gc1 20,518 92,4724 68,3569 71,6509
Gc2 40,4239 1,1177 17,0447 24,5882
R 39,0581 6,4099 14,5984 3,7609
A relevância dos grupos pode ser visualizada na Figura 10 a seguir.
89
Figura 10 – Relevância dos grupos de vriaáveis de maior para menor: Gc1 (acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição).
Se considerarmos apenas as variáveis do Gc1 (acústico) verificamos
que entre os correlatos acústicos, a variabilidade de F0 foi a variante mais
relevante e a menos importante a de Pausas por Segundo. As demais variáveis
apresentaram semelhança em termos de relevância. Na Figura 11, observamos
a distribuição das variáveis nas Dimensões 1 e 2 (Dim 1 e Dim 2) e a
relevãncia delas demonstrada pela extensão das flechas.
90
Figura 11 - Distribuição das variáveis nas Dimensões 1 e 2 (Dim1 e Dim2).
Se considerarmos todas as variáveis dos três grupos (Gc1, Gc2 e Gc3)
em conjunto, verificamos que o número de pausas e de pausas por segundo
aparecem diametralmente opostos. Também verificamos haver maior dispersão
entre as variáveis do Gc1 e o agrupamento entre as variáveis do Gc2 e do Gc3,
o que indica que Gc2 e Gc3 são redundantes para expressar os fenômenos em
estudo, já as variáveis Gc1, por conta do espalhamento, são melhores para
representar todo o espaço vetorial, ou seja, para representar e expressar os
fenômenos em estudo. Na Figura 12, a seguir, podemos verificar esses fatos.
91
Figura 12 – Distribuição de todas as variáveis dos três grupos: Gc1 (acústico), Gc2 (diferencial semântico) e Gc3 (julgamento da transcrição) nas Dimensões 1 e 2 (Dim,1 e Dim,2).
As variáveis que influenciam no arranjo da distribuição dos pontos no
eixo horizontal (DIM 1) são as variáveis relacionadas na Tabela 19 a seguir.
92
Tabela 19 - Variáveis da Dimensão 1 (Dim, 1).
Verifica-se na Dim1 que há forte correlação entre Z.S (Segurança) e
Z.Compr (Compreensibilidade) e um pouco menos com Z.C e Z.P e Z.F e
Z.Ptrad.
As variáveis que influenciam no arranjo da distribuição dos pontos no
eixo vertical (DIM 2) são as variáveis quantitativas relacionadas na Tabela 20 a
seguir.
Tabela 20 - Variáveis da Dimensão 2 (Dim, 2).
Verifica-se na Dim, 2 que há uma forte correlação entre Z.f0MED e
Z.VarF0 com Z.PS e uma correlação negativa (ou inversa) com Z.GE e Z.NP, o
que pode ser interpretado como co-ocorrência de extensa variabilidade do F0 e
de número de Pausas por Segundo e como evidência de quanto mais longos
os grupos entoacionais, menor incidência de pausas ou vice-versa.
Neste capítulo analisamos os resultados das diferentes avaliações e
análises a que as falas semi-espontânea e interpretada dos Sujeitos da
pesquisa foram submetidas e apontamos as similaridades e diferenças que
93
foram encontradas. O próximo capítulo conclui esta dissertação e aponta
caminho para futuras investigações na área.
94
Capítulo 6 - Conclusão
O objetivo deste estudo foi verificar as características prosódicas da fala
da fala interpretada de um grupo de intérpretes, tendo como contraponto a sua
fala semi-espontânea e analisar como tais características poderiam influenciar
a avaliação de qualidade e compreensão da mensagem produzida pelo
intérprete.
Como já mencionamos na introdução desta dissertação, os critérios de
avaliação de qualidade na interpretação estão sempre sujeitos a uma avaliação
subjetiva, que irá variar de acordo com quem está avaliando o trabalho e seu
papel no processo de interpretação, seja ele o de ouvinte, cliente ou colega
intérprete, monolíngue ou com conhecimento dos dois idiomas de trabalho,
com ou sem experiência no processo de interpretação.
No nosso caso, mesmo os juízes que avaliaram estritamente os
conteúdos das transcrições, se pautando teoricamente em critérios ditos mais
“objetivos” (tais como presença e número de erros e omissões, correção e
outros), não puderam deixar de lado uma abordagem mais subjetiva.
Como destaca Daniel Gile (1999) em relação ao critério de omissões e
erros utilizado para avaliação: “Este método não é isento de falhas, tanto por
causa de uma grande variabilidade entre os examinadores do que pode ou não
ser considerado erro ou omissão e também porque o que pode ser identificado
como erro ou omissão em uma transcrição pode ser considerado uma
produção aceitável em uma apresentação oral do discurso14”.
Nossos juízes avaliadores do conteúdo semântico ainda apontaram mais
um elemento dificultador na tarefa de avaliação – a falta de um critério que
14 “This method is not without pitfalls, both because of high inter-rater variability in the
perception of what is and what is not an error or omission and because what may be
identified as an error or omission in a transcript may be an acceptable rendition in an
oral presentation of the speech”
95
pudesse incorporar o estilo da fala de cada intérprete. Ao somente julgar as
falas transcritas por sua quantidade de erros, omissões e transmissão completa
do sentido, eles se sentiram incapazes de atribuir um peso às diferentes
escolhas semânticas feitas pelos intérpretes quando estas não interferiam
diretamente nos quesitos determinados, muito embora percebessem diferenças
em escolhas mais ricas ou mais pobres de vocabulário e na construção
semântica entre as falas interpretadas.
De uma maneira geral, no entanto, o trabalho nos trouxe elementos
importantes no caminho da pesquisa do trabalho de interpretação simultânea.
Pudemos ver pelos resultados que a fala interpretada para o português
brasileiro mostra padrão muito similar às falas interpretadas para o inglês e o
hebreu estudadas por SCHLESINGER (1994). Também no PB, foram
encontradas pausas no meio de estruturas gramaticais, uso característico das
proeminências, com sílabas “inesperadas” carregando o pitch accent, ou valor
de pitch máximo, marcação do pitch final de fronteira, com tendência de os
intérpretes concluírem suas frases com um pitch elevado, não concludente, e
produção sem ritmo regular, com alterações fora do padrão tanto em duração
quanto em taxa de elocução.
Isso demonstra que a fala interpretada é uma fala característica por si
só, diferente de outras modalidades de fala, seja ela espontânea,
semiespontânea, fala em leitura ou fala em shadowing. Nesta dissertação, os
dados estatísticos comprovaram que os dois estilos analisados, o semi-
espontâneo e o interpretado, são estilos diferenciados. Por esta razão, além de
compararmos a avaliação da fala interpretada com outras modalidades de fala,
como tem sido feito nos estudos mais recentes de qualidade na interpretação
(HOLUB, 2010; RENNERT, 2010; LENGLET, 2015), é também fundamental
entendermos como a prosódia afeta a avaliação de qualidade da interpretação.
É isso que tentamos desenvolver neste trabalho e os resultados
demonstram, em termos de classificação geral das intérpretes, haver certa
compatibilidade entre a avaliação da transcrição da produção dos sujeitos e a
avaliação das características da fala. As intérpretes que tiveram a melhor e pior
96
avaliação nas duas instâncias (Sujeitos 2 e 3, respectivamente) foram
exatamente as mesmas. Além disso, 6 das doze intérpretes mantiveram
resultados iguais ou com apenas uma posição de diferença nas duas
avaliações.
No entanto, equivalência em termos de sentido não é garantia de uma
melhor ou pior avaliação da qualidade da interpretação. Além de 10 das 12
intérpretes registrarem notas consistentemente mais baixas em produção oral,
vimos que a própria ordem de classificação geral das intérpretes também foi
alterada. Duas intérpretes caíram duas posições (Sujeitos 1 e 9), com médias
passando de 4,5 e 3,81 para 3,48 e 2,7, respectivamente. Na escala de 5
pontos, isto significa que ambas as intérpretes perderam mais de um ponto na
nota (20%), passando de uma avaliação entre muito boa e ótima (Sujeito 1)
para entre regular e muito boa e de uma avaliação entre regular e muito boa
(Sujeito 9) para uma entre pouco boa e regular.
Diferença ainda maior em número de posições foi encontrada nos
Sujeitos 4 e 10. O Sujeito 4 apresenta ganho de três posições, aproximando-se
mais das intérpretes mais bem avaliadas, S2 e S5, como evidenciado no
dendograma da Figura 7. Na avaliação da transcrição, a diferença do Sujeito 4
para o Sujeito 2 é de 0,5 ponto e para o Sujeito 5 é de 0,36 ponto; na avaliação
de fala, a diferença S4-S2 cai para 0,25 ponto e S4-S5 para 0,16 ponto.
Caminho contrário traça o Sujeito 10, com queda de 3 posições e média
passando de 4,29 (entre muito bom e ótimo) para 3,02 (regular).
Diferenças ainda mais marcantes são encontradas nos Sujeitos 7 e 6. O
Sujeito 7 apresenta perda de 5 posições e média indo de 4,37 para 2,93 (um
total de 1,44 pontos), ou seja, passando de uma interpretação avaliada como
entre muito boa e ótima para abaixo de regular.
Os Sujeitos 7 e 10 mostram similaridades na avaliação da fala. Ambos
trazem a Agradabildade como o quesito com menor avaliação (2,24 para
97
ambos – abaixo de regular) e Segurança com a maior avaliação (3,35 e 3,46,
respectivamente). Em relação à pontuação recebida pelos outros sujeitos em
relação a esses quesitos e aos demais avaliados, suas performances em
termos de expressão oral não foram bem avaliadas. Na análise do pitch,
observamos com apoio na inspeção do traçado de f0 e na medição de valores
de f0, que ambas as intérpretes lançam mão de modulações abruptas, referida
pelos ouvintes no estudo de MOSER (1995) como uma entoação exagerada e
característica de fala histriônica.
Finalmente, o Sujeito 6 ganha 7 posições, indo da 11ª para 4ª posição,
apresentando notas altas todos os quesitos – Agradabilidade (4ª melhor nota,
com 3,55); Confiabilidade (4ª melhor nota, com 3,55); Naturalidade (4ª melhor
nota, com 3,54); Fluidez (4ª melhor nota, com 3,48); Segurança (5ª melhor
nota, com 3,44); Profissionalismo (5ª melhor nota, com 3,5) e
Compreensibilidade (4ª melhor nota, com 3,67). Todas os quesitos de
avaliação de fala ultrapassam a média de 3,4 registrada pelo Sujeito 6 na
avaliação do conteúdo da transcrição, novamente comprovando o papel da
prosódia na avaliação do trabalho do intérprete.
Com base nos resultados, podemos afirmar que as intérpretes que mais
aproximaram as características prosódicas da fala interpretada de sua fala
semi-espontânea tenderam a receber uma melhor avaliação de qualidade e
compreensibilidade da interpretação. Aquelas que mais se afastaram das
características prosódicas identificadas na fala semiespontânea tenderam a ser
pior avaliadas.
Assim, embora a fala interpretada evidencie características singulares,
pudemos verificar uma variabilidade prosódica entre as intérpretes na produção
dessa fala. Isso indica que há espaço para se trabalhar a fala interpretada na
formação do intérprete. A incorporação de softwares de análise acústica como
o Praat, utilizado como ferramenta deste estudo, poderá permitir que
instrutores e alunos visualizem melhor essa fala e os diferentes elementos a
98
serem trabalhados (frequência fundamental, taxa de elocução, variação de
pitch etc.).
Ainda precisamos caminhar muito na compreensão de como a fala
interpretada pode ser avaliada, mas aprendemos através deste estudo que as
questões prosódicas tëm papel importante na avaliação de qualidade e
compreensão e compreensibilidade da fala interpretada. Como vimos na
Tabela 14, das doze intérpretes aqui avaliadas, apenas 3 atingiram mais de
60% em alta compreensibilidade. Isso é muito pouco. Precisamos utilizar nosso
conhecimento para fornecer programas de formação para intérpretes que
englobem as questões prosódicas, tão fundamentais para nossa profissão.
Como destacamos na introdução desse trabalho, a interpretação é uma
atividade completamente baseada na fala, tanto como fonte quanto como
resultado final. É preciso dar mais atenção às características prosódicas da fala
do intérprete, pois estas afetam a maneira pela qual tanto a qualidade do
trabalho é percebida quanto a mensagem interpretada é compreendida.
Este trabalho dá um primeiro passo nesta direção, na certeza de que
outros virão para enriquecer uma área ainda tão carente de pesquisa.
Precisamos desenvolver mais estudos na área e as possibilidades para tanto
são muitas, desde o desenvolvimento de experimentos de manipulação
prosódica e verificação dos seus efeitos até comparações entre grupos de
interpretes com e sem treinamento em questões de prosódia.
Em um futuro cada vez mais desafiador para a profissão de intérprete,
uma maior compreensão da fala interpretada será uma ferramenta importante
na formação de novos e melhores profissionais.
99
Referências Blibliográficas
BAIGORRI JALÓN, J. From Paris to Nuremberg: The Birth of Conference
Interpreting, Benjamins Translation Library, 2014
BAIGORRI JALÓN, J. Interpreting Vol. 4(1), 29–40, John Benjamins Publishing
Co, 1999, disponível em http://www.researchschool.org/intranets/baigorri_1.pdf.
Último acesso em 09/07/2015.
BARALDI, G. et al. Estudo da freqüência fundamental da voz de idosas
portadoras de diferentes graus de perda auditiva. Rev. Bras.
Otorrinolaringologia, São Paulo, v.73, n.3, p. 378-383, 2007, disponível em
http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-
72992007000300013&lng=en&nrm=iso. Último acesso em 09/07/2015.
BARBOSA, P. Syllable-Timing in Brazilian Portuguese": Uma Crítica a Roy
Major. DELTA, vol. 16 no. 2. São Paulo, 2000, disponível em
http://dx.doi.org/10.1590/S0102-44502000000200006. Último acesso em
09/07/2015.
BARBOSA, P. Prosódia: uma entrevista com Plínio A. Barbosa. ReVEL, v. 8, n.
15, 2010, disponível em
http://www.revel.inf.br/files/entrevistas/revel_15_entrevista_plinio.pdf. Último
acesso em 09/07/2015.
BOERSMA, P, WEENINK, D. Praat: doing phonetics by computer. In:
http://www.fon.hum.uva.nl/praat/. Amsterdan, 2002.
BOLINGER, D. Intonation and Grammar. Language Learning 8, 31-117, 1958.
BROWN, G., CURRIE, K., KENWORTHY, J. Questions of Intonation. Croom-
Helm, London, 1980 Cauldwell, R. Streaming Speech. Speech in Action, UK,
2001.
BUHLER, H. Linguistic (semantic) and extra-linguistic (pragmatic) criteria for the
evaluation of conference interpretation and interpreters. Multilingua, 5 (4): 231-
235, 1986.
100
CHIARO, D. & NOCELLA, G. Interpreters’ perception of linguistic and non-
linguistic factors affecting quality: A survey through the World Wide Web, 2004,
disponível em https://www.erudit.org/revue/meta/2004/v49/n2/009351ar.pdf.
Último acesso em 09/07/2015.
CHUN, D.M. Discourse Intonation in L2: From theory and research to practice,
Benjamins Publishing Company, 2002
COLLADOS AÍS, A. La evaluación de la calidad em interpretación simultânea.
La impostancia de la comunicación no verbal. Granada: Comares, 1998.
CRUTTENDEN, A. Intonation, Cambridge Textbooks in Linguistics, 1986
FERRARI, M. Simultaneous Consecutive Revisited, 2007, disponível em
https://iacovoni.files.wordpress.com/2009/01/simultaneousconsecutive-2.pdf.
Último acesso em 09/07/2015.
FLEROV, C. On Comintern and Hush-a-Phone: Early history of simultaneous
interpretation equipment, 2013, disponível em http://aiic.net/page/6625/on-
comintern-and-hush-a-phone-early-history-of-simultaneous-interpretation-
equipment/lang/1. Último acesso em 09/07/2015
GILE, D. L’évaluation de la qualité de l’interprétation ales délégués: une étude
de cas, 1990, disponível em
http://www.openstarts.units.it/dspace/handle/10077/2156. Último acesso em
09/07/2015.
GILE, D. Basic Concepts and Models for Interpreter and Translator Training,
Benjamins Translation Library, 1995
GILE, D. Testing the Effort Models’ tightrope hypothesis in simultaneous
interpreting – A contribution, Hermes, Journal of Linguistics no. 23, 1999 –
disponível em http://download2.hermes.asb.dk/archive/FreeH/H23_09.pdf.
Último acesso em 09/07/2015.
GRICE, M. / BAUMANN, S. An Introduction to Intonation – Functions and
Models, 2007, disponível em http://www.gtobi.uni-koeln.de/lit/grice-baumann-
int-func-models-revised-1107.pdf. Último acesso em 09/07/2015.
GUMPERZ, J. Discourse Strategies, Cambridge University Press, 1982,
disponível em http://catdir.loc.gov/catdir/samples/cam031/81020627.pdf. Último
acesso em 09/07/2015.
101
HARTLEY, A; MASON, I; PENG, G. PEREZ, IA; Peer- and Self-Assessment in
Conference Interpreting Training. Research output: Book/Report ›
Commissioned report, 2003.
HOLUB, E. "Does Intonation Matter? The impact of monotony on listener
comprehension", in: The Interpreters' Newsletter, 15, pp. 117-126, 2010.
HUSSON, F.; JOSSE J.; LÊ S.& MAZET, J. (2013). FactoMineR: Multivariate
Exploratory Data Analysis and Data Mining with R. R package version 1.25,
disponível em http://cran.r-project.org/web/packages/FactoMineR/index.html.
Último acesso em 09/07/2015.
KAHANE, E. Thoughts on the quality of interpretation, 2000, disponível em
http://aiic.net/page/197/thoughts-on-the-quality-of-interpretation/lang/1. Último
acesso em 09/07/2015.
KURZ, I. Conference Interpreting—User Expectations, Coming of Age.
Proceedings of the 30th Annual Conference of the American Translators
Association (D. L. Hammond, ed.), Medford (NJ), Learned Information, 1989
KURZ I. / PÖCHHACKER F. Quality in TV interpreting, Translatio – Nouvelles
de la FIT – FIT Newsletter XIV 3:4, 350-358, 1995
KURZ, I. Quality and role: The Professionals' view, 2008. Disponível em
http://aiic.net/page/3044/quality-and-role-the-professionals-view/lang/1. Último
acesso em 09/07/2015.
KURZ, I. The Impact of non-native English on students’ interpreting
performance, em Efforts and Models in Interpreting and Translation Research,
2008. Benjamins Translation Library.
LAVER, J. The Phonetic Description of Voice Quality. Cambridge University
Press, 1980
LAVER, J. Principles of Phonetics, Cambridge Textbooks in Linguistics, 1994.
LENGLET, C. The impact of prosody on the Comprehensibility and quality of
simultaneous interpreting: A pilot study, Translation and Comprehensibility,
2015, disponível em http://di.umons.ac.be/details.aspx?pub=74a252b8-ede5-
4c1e-93d9-af4c2c9f0974. Último acesso em 09/07/2015.
MADUREIRA, S. Estudos de prosódia/Ester M. Scarpa, org – Campinas, SP:
Editora da Unicamp, 1999
102
MADUREIRA, S. Sobre a expressividade da Fala in Kyrillos, L. Expressivdade
Editora Revinter, 2004
MIGLIORINI, L.; MASSINI-CAGLIARI, G. Sobre o ritmo do Português Brasileiro:
evidências de um padrão acentual. REVEL v. 8, n. 15, 2010, disponível em
http://www.revel.inf.br/files/artigos/revel_15_sobre_o_ritmo.pdf. Último acesso
em 09/07/2015.
MOSER P. Survey on expectations of users of conference interpretation, 1995,
disponível em http://aiic.net/page/736/survey-on-expectations-of-users-of-
conference-interpretation/lang/1. Último acesso em 09/07/2015.
MOSER P., ‘Expectations of Users of Conference Interpretation’. Interpreting,
1(2), 145-178, 1996.
MUNDAY, J. Translation theory before the twentieth century”. In: Introducing
Translation Studies. London: Routledge, p. 19, 2005
PÖCHHACKER, F, Interpreting quality: global professional standards? 2013,
disponível em http://lourdesderioja.com/2013/04/24/the-issue-of-quality/. Último
acesso em 09/07/2015.
PÖCHHACKER, ZWISCHENBERGER, Survey on quality and role: conference
interpreters’ expectations and self-perceptions, 2010, disponível em
http://aiic.net/page/3405/survey-on-quality-and-role-conference-interpreters-
expectations-and-self-perceptions/lang/1. Último acesso em 09/07/2015.
RAMLER, S. Nurember and Beyond. The Memoirs of Siegfried Ramler, Ahuna
Press, 2008
RENNERT, S. The impact of fluency on the subjective assessment of
interpreting quality", in: The Interpreters' Newsletter, 15, pp. 101-115, 2010
RILLIARD, A et at, Proceedings of the VIIth GSCP International Conference.
Speech and Corpora, edited by di Mello, Heliana, Pettorino, Massimo, Raso,
Tommaso Firenze University Press, 2012.
ROLAND, R. Interpreters as diplomats: a diplomatic history of the role of
interpreters in world politics, pg 20, 1922.
SCHLESINGER, M. Intonation in the production of and perception of
simultaneous interpretation, In Lambert and Moser-Mercer (Eds.) Bridging the
Gap. Empirical Research in Simultaneous Interpretation. Benjamins, 1994.
103
SELESKOVITCH, D., English, Interpreting For International Conferences,
Washington, DC: Pen and Booth, 1978.
SELESKOVITCH, D. Who should assess an interpreter’s performance in
Multilingua - Journal of Cross-Cultural and Interlanguage Communication,
Volume 5, Issue 4, Pages 236–236, ISSN (Online) 1613-3684, ISSN (Print)
0167-8507, DOI: 10.1515/mult.1986.5.4.236, 2009.
TAUROZA & ALLISON, Applied Linguistics (1990) 11 (1): 90-105, 1990.
VANDER ELST, P. The Nuremberg Trial, 2000. Disponível em
http://aiic.ca/page/983/the-nuremberg-trial/lang/1. Último acesso em
09/07/2015.
WEBER W.K., Improved Ways of Teaching Consecutive Interpretation in The
Theoretical and Practical Aspects of Teaching Conference Interpretation. Ed. by
L. Gran and J. Dodds, Udine, Campanotto Editore, pp. 161-166, 1989.
ZACKIEWICS, D.V. e ANDRADE, C.F. Seis parâmetros de fluência. Revista da
Sociedade Brasileira de Fonoaudiologia: 5(7), 59-64, 2000.
104
ANEXO 1 - Transcrição da Palestra Original
I know what you’re thinking. You think I’ve lost my way, and somebody’s going
to come on the stage in a minute and guide me gently back to my seat. I get
that all the time in Dubai. “Here on holiday are you, dear?” “Come to visit the
children? How long are you staying?”
Well actually, I hope for a while longer yet. I have been living and teaching in
the Gulf for over 30 years. And in that time, I have seen a lot of changes. Now
that statistic is quite shocking. And I want to talk to you today about language
loss and the globalization of English. I want to tell you about my friend who was
teaching English to adults in Abu Dhabi. And one fine day, she decided to take
them into the garden to teach them some nature vocabulary. But it was she who
ended up learning all the Arabic words for the local plants, as well as their uses
– medicinal uses, cosmetics, cooking, herbal. How did those students get all
that knowledge? Of course, from their grandparents and even their great-
grandparents. It’s not necessary to tell you how important it is to be able to
communicate across generations.
But sadly, today, languages are dying at an unprecedented rate. A language
dies every 14 days. Now, at the same time, English is the undisputed global
language. Could there be a connection? Well I don’t know. But I do know that
I’ve seen a lot of changes. When I first came out to the Gulf, I came to Kuwait in
the days when it was still a hardship post. Actually, not that long ago. That is a
little bit too early. But nevertheless, I was recruited by the British Council, along
with about 25 other teachers. And we were the first non-Muslims to teach in the
state schools there in Kuwait. We were brought to teach English because the
government wanted to modernize the country and to empower the citizens
through education. And of course, the U.K. benefited from some of that lovely
oil wealth.
Okay. Now this is the major change that I’ve seen – how teaching English has
morphed from being a mutually beneficial practice to becoming a massive
international business that it is today. No longer just a foreign language on the
school curriculum, and no longer the sole domain of mother England, it has
105
become a bandwagon for every English-speaking nation on earth. And why
not? After all, the best education – according to the latest World University
Rankings – is to be found in the universities of the U.K. and the U.S. So
everybody wants to have an English education, naturally. But if you’re not a
native speaker, you have to pass a test.
Now can it be right to reject a student on linguistic ability alone? Perhaps you
have a computer scientist who’s a genius. Would he need the same language
as a lawyer, for example? Well, I don’t think so. We English teachers reject
them all the time. We put a stop sign, and we stop them in their tracks. They
can’t pursue their dream any longer, ‘til they get English. Now let me put it this
way: if I met a monolingual Dutch speaker who had the cure for cancer, would I
stop him from entering my British University? I don’t think so. But indeed, that is
exactly what we do. We English teachers are the gatekeepers. And you have to
satisfy us first that your English is good enough. Now it can be dangerous to
give too much power to a narrow segment of society. Maybe the barrier would
be too universal.
Okay. “But,” I hear you say, “what about the research? It’s all in English”. So the
books are in English, the journals are done in English, but that is a self-fulfilling
prophecy. It feeds the English requirement. And so it goes on. I ask you, what
happened to translation? If you think about the Islamic Golden Age, there was
lots of translation then. They translated from Latin and Greek into Arabic, into
Persian, and then it was translated on into the Germanic languages of Europe
and the Romance languages. And so light shone upon the Dark Ages of
Europe. Now don’t get me wrong; I am not against teaching English, all you
English teachers out there. I love it that we have a global language. We need
one today more than ever. But I am against using it as a barrier. Do we really
want to end up with 600 languages and the main one being English, or
Chinese? We need more than that. Where do we draw the line? This system
equates intelligence with a knowledge of English, which is quite arbitrary.
And I want to remind you that the giants upon whose shoulders today’s
intelligentsia stand did not have to have English, they didn’t have to pass an
English test. Case in point, Einstein. He, by the way, was considered remedial
106
at school because he was, in fact, dyslexic. But fortunately for the world, he did
not have to pass an English test. Because they didn’t start until 1964 with
TOEFL, the American test of English. Now it’s exploded. There are lots and lots
of tests of English. And millions and millions of students take these tests every
year. Now you might think, you and me, “Those fees aren’t bad, they’re okay,”
but they are prohibitive to so many millions of poor people. So immediately,
we’re rejecting them.
It brings to mind a headline I saw recently: “Education: The Great Divide”. Now I
get it, I understand why people would want to focus on English. They want to
give their children the best chance in life. And to do that, they need a Western
education. Because, of course, the best jobs go to people out of the Western
Universities, that I put on earlier. It’s a circular thing.
Okay. Let me tell you a story about two scientists, two English scientists. They
were doing an experiment to do with genetics and the forelimbs and the hind
limbs of animals. But they couldn’t get the results they wanted. They really
didn’t know what to do, until along came a German scientist who realized that
they were using two words for forelimb and hind limb, whereas genetics does
not differentiate and neither does German. So bingo, problem solved. If you
can’t think a thought, you are stuck. But if another language can think that
thought, then, by cooperating, we can achieve and learn so much more.
My daughter came to England from Kuwait. She had studied science and
mathematics in Arabic. It’s an Arabic medium school. She had to translate it into
English at her grammar school. And she was the best in the class at those
subjects. Which tells us that when students come to us from abroad, we may
not be giving them enough credit for what they know, and they know it in their
own language. When a language dies, we don’t know what we lose with that
language.
This is – I don’t know if you saw it on CNN recently – they gave the Heroes
Award to a young Kenyan shepherd boy who couldn’t study at night in his
village, like all the village children, because the kerosene lamp, it had smoke
and it damaged his eyes. And anyway, there was never enough kerosene,
107
because what does a dollar a day buy for you? So he invented a cost-free solar
lamp. And now the children in his village get the same grades at school as the
children who have electricity at home. When he received his award, he said
these lovely words: “The children can lead Africa from what it is today, a dark
continent, to a light continent”. A simple idea, but it could have such far-
reaching consequences.
People who have no light, whether it’s physical or metaphorical, cannot pass
our exams, and we can never know what they know. Let us not keep them and
ourselves in the dark. Let us celebrate diversity. Mind your language. Use it to
spread great ideas.
Thank you very much.
Sukran
108
ANEXO 2 - Extratos Segmentos Inicial, Medial, Final e
Adicional
Segmento Inicial
I know what you’re thinking… You think I’ve lost my way and
somebody’s going to come on the stage in a minute and guide me
gently back to my seat. I get that all the time in Dubai. Here on holiday,
are you dear? Come to visit the children? How long are you staying?
Well, actually I hope for a while longer yet. I have been living and
teaching in the Gulf for over 30 years. And in that time I have seen a lot
of changes.
S1 – Eu sei que cês tão pensando…cês tão pensando que eu me perdi…e
aí…me perdi e alguém vai vir aqui e vai me retirar do palco, me levar de volta
pro meu assento daqui a pouco, né? Isso acontece comigo o tempo inteiro,
em Dubai. Ah, você está de férias… Vem ver as crianças… Quanto tempo cê
vai ficar? Bom, na verdade, eu espero que ainda por um bom tempo. Eu vivo
e trabalho no Golfo há mais de 30 anos. E nesse tempo, eu já vi muitas
mudanças.
S2 – Eu sei que vocês tão pensando. Vocês estão pensando que eu me
perdi e que logo, logo vem alguém e que vai me levar de volta para o meu
assento. O tempo inteiro isso acontece aqui em Dubai. Ah, você está de
férias querida? Veio visitar os filhos? Quanto tempo você vai ficar? Bom, na
verdade, eu esperei que eu pudesse ficar um pouquinho. Eu já sou
professora há 30 anos! Moro aqui no Golfo há 30 anos. E nesse período, eu
vi muitas mudanças.
S3 – Bem, eu volto toda vez. Bem... venha visitar as crianças… Quanto
tempo você vai ficar? Bem, na verdade, eu espero um pouquinho e eu estou
feliz e vivi, muito feliz, ensinando no Golfo e pilos últimos 30 anos…e naquele
momento vi muitas mudanças.
S4 – Eu sei o que vocês estão pensando…tão pensando… bem parece que
outra coisa vai acontecer, alguém vai pegar e vai levar ela embora de volta
109
pro meu assento, não é? É isso que vocês estão pensando. Isso me
acontece o tempo todo em Dubai. Ah, a senhora está aqui de férias? Ah, veio
visitar os netinhos? Quanto tempo vai ficar? Bem, na verdade, eu já estou
aqui no Golfo por mais de 30 anos, não só morando, mas também
ensinando. E nesse período observei muitas mudanças.
S5 – Eu sei o que cês estão pensando. Devem ter pensado…acho que ela
errou o caminho, daqui a pouco alguém vem e leva ela de volta lá pro lugar
dela, onde ela tava sentada. Isso acontece muito em Dubai. Ah, querida, está
de férias? Oh, veio visitar os netos? Vai ficar quanto tempo? Mas na verdade,
eu já moro e es...dou aulas aqui no Golfo já há mais de 30 anos. E durante
esse período de tempo, eu já observei muitas mudanças.
S6 – (...) Ah, toda hora me perguntam isso, em Dubai. Você está aqui em
férias, querida? Venha visitar as crianças… Por quanto tempo você vai ficar
aqui? Bem, na verdade eu achava…gostaria de ficar mais tempo. Eu estou
há mais de 30 anos vivendo e dando aulas no Golfo. E naquela época, e
nesse, perdão, nesse período, eu vi muitas mudanças.
S7 – Eu sei o que vocês estão pensando… Vocês acham que eu errei e
alguém vai chegar aqui, eu me perdi, alguém vai vir no palco e me levar de
volta pra meu assento? As pessoas me dizem isso o tempo todo lá em
Dubai. Tá aqui de férias querida? Vem visitar as crianças? Quanto tempo
você vai ficar? Bom, na verdade, ainda vou ficar mais um tempo. Eu já moro
e dou aulas na área do Golfo há muitos anos e neste tempo, eu já vi muitas
mudanças.
S8 – Eu sei o que que vocês tão pensando, achando que eu não…estou aqui
meio perdida e alguém vai gentilmente me levar pro meu lugar. Eu sei que é
assim aqui no Dubai. Você está de férias, querida? Veio visitar os filhos?
Quanto tempo vai ficar aqui? Mas na verdade, eu já estou vivendo e dando
aulas aqui no Golfo há mais de 30 anos. E durante esse tempo todo, eu vi
várias mudanças.
S9 – Eu sei o que cês tão pensando. Que eu…não estou no lugar certo, que
alguém vai subir aqui e me levar de volta pro meu lugar na plateia. Eu ouço
isso o tempo todo em Dubai. Vocês estão aqui de férias? Vem visitar as
crianças… Quanto tempo cê vai ficar? Bom, na verdade, eu ainda vou ficar
110
aqui um bom tempo. Eu já moro aqui no Golfo pra mais de 30 anos. E
durante esse tempo, eu já vi muitas mudanças.
S10 – Eu sei o que vocês tão pensando…tão pensando que na verdade, eu
não sei o que fazer, pra onde ir, e que alguém vai vir aqui daqui a pouco no
palco e me conduzir de volta ao meu assento. Me acontece o tempo todo
isso. E…você tá aqui, de férias, querida, em Dubai? Veio visitar as crianças?
Quando tempo você vai ficar? Bom, na verdade, eu espero que por um bom
tempo ainda. Eu moro aqui na região do Golfo já há 30 anos. Durante esse
período, eu vi muitas mudanças acontecerem.
S11 – Eu sei o que vocês estão pensando, estão pensendo que eu me perdi
e que alguém irá subir nesse palco e vão me levar de volta para o meu
assento. Isso sempre acontece em Dubai. Aqui, vamos ver o que vai
acontecer… Venham visitar as crianças… Quanto tempo a senhora vai ficar?
Bom, na verdade, eu moro e dou aula nessa região do Golfo já há mais de 30
anos! E durante esse período eu observei, vivenciei uma série de mudanças.
S12 – Bom, eu já sei o que vocês estão pensando, vocês pensaram que eu
me perdi, que alguém subirá no palco daqui a pouco e irá me levar de volta
ao meu assento!?! Eu ouço isso o tempo inteiro lá em Dubai. Ah, senhora,
como você está hoje? Cê veio visitar as crianças? Quanto tempo você irá
ficar aqui? Bom, na verdade, é... eu espero ficar um pouco mais tempo ainda.
Eu fico muito feliz já ah…lecionando e vivendo no Golfo já há mais de 30
anos. E naquela época e, oh, desculpe, durante todo esse momento, eu já vi
várias mudanças.
111
Segmento Medial
Now, don’t get me wrong; I am not against teaching English, all you
English teachers out there. I love it that we have a global language.
We need one today more than ever. But I am against using it as a
barrier. Do we really want to end up with 600 languages, and the
main one being English or Chinese? We need more than that! Where
do we draw the line? This system equates intelligence with a
knowledge of English…which is quite arbitrary!
S1 – Mas vejam bem, eu não contra o ensino de inglês; eu adoro que nós
tenhamos uma. Um idioma global, nós precisamos mais do que nunca.
Mas eu contra usá-lo como uma barreira. Nós realmente queremos
acabar com 600 línguas e a principal sendo inglês ou chinês? Nós
precisamos mais disso. Onde está aí o limite? Esse sistema, ele equaliza
a inteligência com o conhecimento de inglês, que é muito arbitrário!
S2 – Eu não sou contra, não, ensinar inglês. Eu adoro! Adoro que nós
tenhamos uma linguagem global e nós precisamos muito dela, mais do
que qualquer modelo ou de qualquer época. Mas eu não concordo em
usá-la como uma barreira...Nós queremos ter só 600 idiomas e a principal
ser inglês ou chinês? Nós precisamos mais do que isso! Como
estabelecer limites? Este é um sistema que limita a inteligência com o
conhecimento de inglês, que é arbitrário, não?
S3 – Bem, mas eu não acredito que devemos não ter um idioma global.
Acredito que isso seja. Mas eu acho que não deve funcionar como uma
barreira. Ou devemos ter 600 idiomas e uma seria inglês e ... chinês?
Bem, onde delimitamos essa linha? Nós temos ah...não podemos
controlar a inteligência a partir do conhecimento de inglês.
S4 – Veja, eu amo e adoro o fato de termos um idioma global; eu acho
que nós precisamos disso mais do que nunca. Mas sou contra usarmos a
língua como a barreira. Será que nós queremos também ter 600 idiomas
e uma delas ser inglês ou chinês? Não, nós precisamos encontrar
uma...algo que nos atenda, mas o sistema precisa ser inteligente; é
bastante arbitrário. Por que o inglês?
112
S5 – É claro que eu não sou contra ensinar inglês; eu adoro, eu acho
ótimo termos uma língua global; precisamos disso mais do que nunca.
Mas eu sou contra usar a língua como uma barreira. Nós queremos ter
600 idiomas e a principal ser simplesmente inglês ou chinês? Nós
precisamos de algo mais. Esse sistema diz que é igual, inteligência e
conhecimento de inglês! É um sistema muito arbitrário!
S6 – Não me interpretem errado. Eu não sou contra o ensino do inglês,
eu acho ótimo que seja uma língua global, um idioma. E ele é muito
necessário hoje, mais do que nunco. Mas eu acho que nós podemos
olhar como uma barreira. Será que nós queremos 600 línguas e a
principal sendo inglês ou chinês? Nós precisamos mais do que isso.
Aonde estabelecer um limite? Esse sistema que cria inteligência com o
conhecimento do inglês...é muito arbitrário.
S7 – Por favor, não me entendam mal. Eu não sou contra o ensino do
inglês. Eu adoro...eu adoro que nós temos uma. Um idioma global. Nós
precisamos disso hoje, mais que nunca. Mas eu sou contra usá-lo como
barreira. Nós precisamos terminar com as 600 com 600 idiomas e termos
apenas uma língua, o inglês? Aonde é que vamos traçar a linha? O
sistema, ele...faz coincidir inteligência com o conhecimento do inglês, o
que é uma coisa arbitrária.
S8 – Não pensem que eu sou contra ensinar inglês. Eu adoro ter um
idioma global. Nós precisamos hoje mais do que nunca. Mas eu não
quero usar como uma barreira. Nós temos que ter 600 idiomas e depois
ter só inglês ou chinês? Precisamos mais do que isso. Então como nós
vamos demarcar? É um sistema que precisa de inteligência para
conhecimento de inglês. E isso é arbitrário.
S9 – Eu não sou contra dar aulas de inglês, eu adoro que nós temos uma
língua global. Nós usamos hoje uma mais do que sempre. Mas eu estou
contra usá-la como uma barreira. Será que nós queremos mesmo ter 600
línguas e a principal vai ser inglês ou chinês? Não, nós precisamos de
mais do que isso. Quando é o ponto de que não tem mais volta? É
preciso de inteligência com o conhecimento de inglês, o que é uma coisa
bem arbitrária.
113
S10 – Não me entendam mal, não sou contra os professores de inglês, é
ótimo que exista um idioma global. Ele é mais preciso do que nunca hoje;
porém eu sou contra usar esse idioma como uma barreira. Será que nós
realmente queremos terminar com 600 idiomas, sendo que o principal
será o inglês ou o chinês? Precisamos ir além disso. Onde é que vamos
estabelecer o limite? Este sistema requer inteligência, de grande
inteligência, do conhecimento de inglês. Bastante arbitrário, não?
S11 – Por favor, não me entendam mal, eu não estou contra as
instituições que ensinam inglês, é necessário um idioma global. E
precisamos hoje mais do que nunca. Mas o que eu sou contra é contra o
uso como barreira. Realmente vocês querem acabar tendo 600 línguas e
uma delas ser o inglês ou o chinês? Não. Precisamos mais do que isso,
aonde traçar o limite? Esse sistema ele exige inteligência com o
conhecimento do inglês, o que é um pouco arbitrário, não é mesmo?
S12 – Agora, deixa eu explicar melhor, não é que eu est....quero só
ensinar inglês. Eu adoro ter um idioma global, mais do que nunca. Mas o
que eu sou contra é que seja uma barreira. Nós realmente queremos ter
600 idiomas e o principal ser inglês ou chinês? Nós precisamos mais do
que isso, onde que a gente estabelece um limite? Esse sistema ele cria
inteligência, com um conhecimento de inglês, que é bastante arbitrário.
114
Segmento Final
People who have no light, whether it’s physical or metaphorical,
cannot pass our exams and we can never know what they know. Let
us not keep them and ourselves in the dark. Let us celebrate
diversity. Mind your language. Use it to spread great ideas.
S1 – As pessoas que não têm luz, seja física ou de forma metafórica, não
podem passar nos nossos testes. E nós não podemos saber o que eles
sabem. Não vamos afastá-los e mantê-los, a eles e a nós mesmos, no
escuro. Vamos celebrar a diversidade. Cuide de sua linguagem. Use-a
para espalhar excelentes ideias!
S2 – As pessoas que não têm luz, seja física ou metafórica, não podem
passar os nossos exames e provas. E nós nunca vamos saber o que eles
sabem. Não vamos impedi-los e impedir a nós mesmos que vejam a luz.
Vamos celebrar a diversidade. Prestem atenção, cuidem do seu idioma.
Usem pra disseminar grandes ideias!
S3 – As pessoas que não têm luz, seja física ou metafórica, não pode
passar nos nossos exames e...agora podem passar nos seus exames. E
nunca sabemos os que eles podem saber. Bem, vamos celebrar a
diversidade. Os...Aprenda o seu idioma, use-o para disseminar grandes
ideias.
S4 – As pessoas que não têm essa luz, seja ela física ou metafórica, não
vão conseguir passar nas nossas provas e nós nunca vamos entender ou
aprender o que é que eles sabem. E isso nos mantém no escuro. Vamos
celebrar a diversidade. Cuidem da sua língua! Usem-na para disseminar
ideias brilhantes.
S5 – As pessoas quando não têm luz, quer seja no ponto de vista físico
ou metafórico, não conseguem passar nos seus exames, nos seus testes.
E nós não sabemos o que eles sabem. Não vamos mantê-los, ou nos
manter, no escuro. Vamos celebrar a diversidade. Então, realmente,
cuidado com a sua língua; use-a para espalhar as grandes ideias!
S6 – As pessoas que não têm luz, seja física ou metafórica, essa luz, não
podem passar as nossas provas. São pessoas que...nós não vamos
115
saber nunca o que elas não sabem, o que elas sabem ou não. Ou seja,
não vamos nos manter no escuro. Vamos celebrar a diversidade. Importe-
se com a sua língua! Use-a para espalhar grande ideias!
S7 – As pessoas que não têm a luz, seja ela física ou metafórica, não
podem passar as nossas provas, e nós não podemos saber o que eles
sabem. Não vamos deixá-los no escuro. Nem a nós mesmos. Vamos
celebrar a diversidade. Importe-se com a sua língua! Use-a para espalhar
grandes ideias!
S8 – Às vezes as pessoas não têm uma ideia dessa luz, física ou em
termos de metáfora. E elas não podem passar nas provas. E não vamos
deixar essas pessoas no escuro. Vamos celebrar a diversidade. Pensem
no seu idioma e usem para espalhar as grandes ideias.
S9 – As pessoas que não têm luz, seja física ou metafórica, não podem
passar nossos... nossos testes. E nós nunca vamos saber o que eles
sabem. Isso não nos mantém, nem a nós, no escuro. Vamos celebrar a
diversidade. Cuide da sua língua. Use para espalhar grandes ideias.
S10 – As pessoas que não têm acesso a iluminação, seja física ou
metafórica, não conseguirão passar os nossos exames, ser aprovadas
nos nossos exames, e nós jamais saberemos o que elas sabem. Não
permitamos que elas e nós continuemos no escuro. Vamos comemorar a
diversidade. Preocupem-se com o seu idioma, usem o seu idioma para
disseminar grandes ideias.
S11 – As pessoas que não têm o luz, seja física ou metafora, de forma
metafórica, não podem passar o seu exame. E nunca vamos saber aquilo
que eles efetivamente sabem e isso vai deixar eles e a nós no escuro. Por
isso, vamos celebrar a diversidade, importe-se com o seu idioma. Use o
seu idioma para disseminar ideias maravilhosas.
S12 – As pessoas que não têm luz, seja ela física ou metafórica, não
podem passar nas nossas provas, e nós nunca saberemos o que eles
sabem. Isso nã...os impede e nos impede, ou nos deixa no escuro.
Vamos celebrar a diversidade. Preocupe-se com o seu idioma, utilize ele
para espalhar grandes ideias.
116
Segmento Adicional
Now let me put it this way. If I met a monolingual Dutch speaker who had the cure
for cancer. Would I stop him from entering my British University. I don’t think so.
But indeed. That is exactly what we do. We English teachers are the gatekeepers.
And you have to satisfy us first. That your English is good enough. Now it can be
dangerous to give too much power to a narrow segment of society.
S5. Deixa eu falar, colocar dessa forma; se eu encontrasse, por exemplo, um
holandês, que só falasse holandês, mas tivesse a cura pro câncer, eu não deixaria
essa pessoa entrar na minha universidade. Nossa, eu faria isso? É exatamente o que
fazemos. Nós, professores de inglês, fazemos o controle. A gente é que define se eu o
seu inglês é bom o suficiente. Pode ser, claro, perigoso ver tanto poder pra definir um
segmento da sociedade.
S7. Então deixa eu falar assim desse jeito, se eu encontrasse...ah, um ah...holandês,
que fala holandês, que é monolíngue, e aí...eu ia impedi-lo de vir... ah estudar na
minha universidade? Bem, na verdade é isso que nós fazemos...Nós pedimos que
você nos atenda e nos mostre que o seu inglês é bom o suficiente. E na verdade é um
pouco perigoso dar tanto poder a apenas um segmento da sociedade.
S12. Bom, deixa eu explicar da seguinte forma, se eu conhecesse uma pessoa que
falasse holandês...é ... monolíngue e que tivesse a cura do câncer, eu interromperia
ele de entrar na universidade? Não, mas é exatamente isso que nós fazemos. Somos
os cuidadores do portal e vocês precisam nos garantir que seu inglês é bom o
suficiente, antes de entrar. Agora, pode ser perigoso dar poder demais a um outro
segmento da sociedade.
117
ANEXO 3 – Distribuição dos extratos de fala em cada
versão de avaliação
V1 V2 V3
S7medial2 S2 inicial S12medial2
S1 inicial S5 inicial S3 inicial
S4 inicial S9 inicial S6 inicial
S7 inicial S12 inicial S10 inicial
S11 inicial S5medial2 S8 inicial
S5medial2 S8 medial S7medial2
S12 medial S10 medial S11 medial
S9 medial S6 medial S7 medial
S5 medial S3 medial S4 medial
S2 medial S12medial2 S1 medial
S12medial2 S7 final S5medial2
S10 final S1 final S9 final
S3 final S11 final S2 final
S8 final S4 final S12 final
S6 final S7medial2 S5 final
118
ANEXO 4 - Instruções para Avaliação dos Extratos de
Fala
Iniciais do nome:________________
Idade:________________
Data:________________
Curso (assinale a alternativa aplicável):
Tradução:________________ Interpretação________________
Concluído sim__ não___ Se sim, em
________________
Instruções para análise:
Você vai ouvir 15 extratos da interpretação de uma palestra do inglês para o
português. Ouça cada extrato e então escolha assinale a opção de 1 a 5 que
melhor descreve sua impressão em relação ao extrato ouvido. Responda todas
as perguntas. Você poderá ouvir cada extrato apenas uma vez. Por favor,
apenas se concentre na impressão que o sujeito lhe passa através de sua fala,
ou seja, com o sujeito lhe soa. Cada extrato deve ser avaliado como único. Por
favor, não faça nenhuma comparação entre eles.
119
Extrato:________________
1. Agradabilidade
O quão agradável lhe parece a voz da intérprete?
1 - Nada
agradável
2 – Pouco
agradável
3 – Nem
muito nem
pouco
agradável
4 – Muito
agradável
5 –
Extremamente
agradável
2. Credibilidade
Você acha que pode confiar nesta intérprete para passar a mensagem da
palestrante?
1 - Nada
confiável
2 – Pouco
confiável
3 – Nem
muito nem
pouco
confiável
4 – Muito
confiável
5 –
Extremamente
confiável
3. Naturalidade
Você acha que a fala da intérprete soa natural?
1 - Nada
natural
2 – Pouco
natural
3 – Nem
muito nem
pouco
natural
4 – Muito
natural
5 –
Extremamente
natural
4. Segurança
Esta intérprete lhe soa segura?
1 - Nada
segura
2 – Pouco
segura
3 – Nem
muito nem
4 – Muito
segura
5 –
Extremamente
120
pouco
segura
segura
5. Profissionalismo
Esta intérprete lhe soa profissional?
1 - Nada
profissional
2 – Pouco
profissional
3 – Nem
muito nem
pouco
profissional
4 – Muito
profissional
5 –
Extremamente
profissional
6. Compreensibilidade
É fácil entender a mensagem que intérprete está passando?
1 - Nada fácil
entender
2 – Pouco
fácil
entender
3 – Nem
muito nem
pouco fácil
entender
4 – Muito
fácil
entender
5 –
Extremamente
fácil entender
121
ANEXO 5 – Instruções para Avaliação das Transcrições
Iniciais Avaliador: __________
Data:_____________
Prezado Avaliador
Você está recebendo a transcrição de três extratos da interpretação de um
discurso original produzidos por 12 intérpretes diferentes. Os segmentos foram
extraídos das partes inicial, medial e final do discurso, e totalizam em média 35
segundos. Sua tarefa será analisar cada extrato de transcrição isoladamente
em comparação ao original, levando em consideração o número de erros (E),
número de omissões (O) e manutenção do sentido original (S) e então atribuir
uma nota para cada quesito em uma escala de 0 a 5 (onde 0 é insuficiente e 5,
excelente). Ao final, por favor atribua uma nota final (T) para cada extrato como
um todo. Considere que cada transcrição é uma tentativa de reproduzir o mais
fielmente possível a fala do intérprete. Não existem erros de tipografia no
material transcrito; quaisquer erros ortográficos são reprodução intencional da
fala do intérprete. O mesmo vale para a pontuação, utilizada para se aproximar
o máximo possível da entoação produzida pelo intérprete. Os extratos
deverão ser sempre analisados em relação ao discurso original e não em
comparação uns com os outros.
122
ANEXO 6 – Forma de Onda do Corpus de Gravação
Completo – Fala Semi-espontânea + Fala Interpretada
de Cada Intérprete
S1
S2
S3
S4
123
S5
S6
S7
S8
124
S9
S10
S11
S12
125
ANEXO 7 – Resultados Ponderados Médios Finais da
Análise Perceptiva por Extrato – Versões 1, 2 e 3
V1
Extrato S7 adicional
Agradabilidade 2,1
Confiabilidade 2,6
Naturalidade 2,06
Fluidez 2,16
Segurança 2,56
Profissionalismo 2,3
Compreensibilidade 2,56
Média 2,33
Extrato S1 inicial
Agradabilidade 3,33
Confiabilidade 3,5
Naturalidade 3,4
Fluidez 3,4
Segurança 3,5
Profissionalismo 3,2
Compreensibilidade 3,5
Média 3,4
126
Extrato S4 inicial
Agradabilidade 3,73
Confiabilidade 3,83
Naturalidade 3,83
Fluidez 3,96
Segurança 4,0
Profissionalismo 3,9
Compreensibilidade 4,06
Média 3,90
Extrato S7 inicial
Agradabilidade 2,53
Confiabilidade 3,16
Naturalidade 2,6
Fluidez 3,03
Segurança 3,13
Profissionalismo 3
Compreensibilidade 3,5
Média 2,99
127
Extrato S11 inicial
Agradabilidade 2,76
Confiabilidade 3,2
Naturalidade 2,76
Fluidez 2,96
Segurança 3,13
Profissionalismo 3,16
Compreensibilidade 3.5
Média 3,06
Extrato S5 adicional
Agradabilidade 3,53
Confiabilidade 3,53
Naturalidade 3,76
Fluidez 3,8
Segurança 3,53
Profissionalismo 3,73
Compreensibilidade 3,46
Média 3,62
128
Extrato S12 medial
Agradabilidade 2,93
Confiabilidade 3,06
Naturalidade 3,06
Fluidez 2,93
Segurança 3,0
Profissionalismo 3,13
Compreensibilidade 3,13
Média 3,03
Extrato S9 medial
Agradabilidade 3,03
Confiabilidade 3,1
Naturalidade 2,96
Fluidez 2,8
Segurança 2,8
Profissionalismo 3,13
Compreensibilidade 3,16
Média 2,99
129
Extrato S5 medial
Agradabilidade 4,3
Confiabilidade 4,1
Naturalidade 3,93
Fluidez 3,86
Segurança 3,96
Profissionalismo 4,0
Compreensibilidade 3,73
Média 3,98
Extrato S2 medial
Agradabilidade 4,36
Confiabilidade 4,36
Naturalidade 4,36
Fluidez 4,33
Segurança 4,36
Profissionalismo 4,36
Compreensibilidade 4,16
Média 4,32
130
Extrato S12 adicional
Agradabilidade 3,26
Confiabilidade 3,5
Naturalidade 3,13
Fluidez 3,33
Segurança 3,23
Profissionalismo 3,26
Compreensibilidade 3,46
Média 3,31
Extrato S10 final
Agradabilidade 2,46
Confiabilidade 3,13
Naturalidade 2,96
Fluidez 3,36
Segurança 3,6
Profissionalismo 3,3
Compreensibilidade 3,23
Média 3,14
131
Extrato S3 final
Agradabilidade 2,8
Confiabilidade 2,53
Naturalidade 2,56
Fluidez 2,3
Segurança 2,4
Profissionalismo 2,46
Compreensibilidade 2,4
Média 2,49
Extrato S8 final
Agradabilidade 2,4
Confiabilidade 2,8
Naturalidade 2,76
Fluidez 2,5
Segurança 2,83
Profissionalismo 2,83
Compreensibilidade 2,86
Média 2,71
132
Extrato S6 final
Agradabilidade 3,86
Confiabilidade 3,76
Naturalidade 3,83
Fluidez 3,80
Segurança 3,63
Profissionalismo 3,7
Compreensibilidade 3,83
Média 3,76
133
V2
Extrato S2 inicial
Agradabilidade 3,33
Confiabilidade 3,7
Naturalidade 3,2
Fluidez 3,56
Segurança 3,83
Profissionalismo 3,8
Compreensibilidade 3,7
Média 3,58
Extrato S5 inicial
Agradabilidade 3,46
Confiabilidade 3,46
Naturalidade 3,13
Fluidez 3,13
Segurança 3,33
Profissionalismo 3,56
Compreensibilidade 3,63
Média 3,38
134
Extrato S9 inicial
Agradabilidade 2,1
Confiabilidade 2,36
Naturalidade 2,46
Fluidez 2,2
Segurança 2,23
Profissionalismo 2,46
Compreensibilidade 2,86
Média 2,38
Extrato S12 inicial
Agradabilidade 3,13
Confiabilidade 2,86
Naturalidade 2,8
Fluidez 2,7
Segurança 2,63
Profissionalismo 2,8
Compreensibilidade 3,03
Média 2,85
135
Extrato S5 adicional
Agradabilidade 3,76
Confiabilidade 3,56
Naturalidade 3,46
Fluidez 3,43
Segurança 3,53
Profissionalismo 3,63
Compreensibilidade 3,43
Média 3,54
Extrato S8 medial
Agradabilidade 1,9
Confiabilidade 3,03
Naturalidade 2,63
Fluidez 2,83
Segurança 3,23
Profissionalismo 3,06
Compreensibilidade 2,73
Média 2,77
136
Extrato S10 medial
Agradabilidade 2,03
Confiabilidade 2,93
Naturalidade 2,26
Fluidez 2,63
Segurança 3,13
Profissionalismo 2,9
Compreensibilidade 2,63
Média 2,64
Extrato S6 medial
Agradabilidade 3,66
Confiabilidade 3,6
Naturalidade 3,56
Fluidez 3,6
Segurança 3,5
Profissionalismo 3,6
Compreensibilidade 3,6
Média 3,58
137
Extrato S3 medial
Agradabilidade 2,36
Confiabilidade 2,4
Naturalidade 2,13
Fluidez 2,3
Segurança 2,33
Profissionalismo 2,63
Compreensibilidade 2,23
Média 2,34
Extrato S12 adicional
Agradabilidade 3,13
Confiabilidade 3,13
Naturalidade 3,06
Fluidez 3,1
Segurança 3,36
Profissionalismo 3,36
Compreensibilidade 3
Média 3,16
138
Extrato S7 final
Agradabilidade 1,73
Confiabilidade 3,13
Naturalidade 2,13
Fluidez 3,16
Segurança 3,63
Profissionalismo 3
Compreensibilidade 3,2
Média 2,85
Extrato S1 final
Agradabilidade 2,7
Confiabilidade 3,36
Naturalidade 2,96
Fluidez 3,3
Segurança 3,26
Profissionalismo 3,33
Compreensibilidade 3,26
Média 3,16
139
Extrato S11 final
Agradabilidade 2,23
Confiabilidade 3,03
Naturalidade 3,1
Fluidez 3,1
Segurança 3,8
Profissionalismo 3,26
Compreensibilidade 3,66
Média 3,16
Extrato S4 final
Agradabilidade 3,5
Confiabilidade 3,73
Naturalidade 3,53
Fluidez 3,7
Segurança 3,46
Profissionalismo 3,56
Compreensibilidade 3,86
Média 3,62
140
Extrato S7adicional V2
Agradabilidade 1,53
Confiabilidade 2,23
Naturalidade 1,73
Fluidez 2,13
Segurança 2,46
Profissionalismo 2,1
Compreensibilidade 2,63
Média 2,11
141
V3
Extrato S12 adicional
Agradabilidade 3,1
Confiabilidade 3,06
Naturalidade 2,83
Fluidez 2,9
Segurança 3,1
Profissionalismo 2,96
Compreensibilidade 2,86
Média 2,97
Extrato S3 inicial
Agradabilidade 2,86
Confiabilidade 2,6
Naturalidade 2,5
Fluidez 2,36
Segurança 2,53
Profissionalismo 2,76
Compreensibilidade 2,53
Média 2,59
142
Extrato S6 inicial
Agradabilidade 3,13
Confiabilidade 3,3
Naturalidade 3,23
Fluidez 3,06
Segurança 3,2
Profissionalismo 3,2
Compreensibilidade 3,6
Média 3,24
Extrato S10 inicial
Agradabilidade 2,23
Confiabilidade 3,26
Naturalidade 3,13
Fluidez 3,56
Segurança 3,66
Profissionalismo 3,5
Compreensibilidade 3,63
Média 3,28
143
Extrato S8 inicial
Agradabilidade 2,2
Confiabilidade 2,96
Naturalidade 2,73
Fluidez 2,73
Segurança 2,96
Profissionalismo 3,03
Compreensibilidade 3,66
Média 2,89
Extrato S7 adicional
Agradabilidade 1,5
Confiabilidade 2,56
Naturalidade 1,93
Fluidez 2,26
Segurança 2,96
Profissionalismo 2,26
Compreensibilidade 2,8
Média 2,32
144
Extrato S11 medial
Agradabilidade 3,56
Confiabilidade 4,16
Naturalidade 3,86
Fluidez 4,1
Segurança 4,3
Profissionalismo 4,16
Compreensibilidade 4,26
Média 4,05
Extrato S7 medial
Agradabilidade 2,46
Confiabilidade 3,16
Naturalidade 2,73
Fluidez 2,86
Segurança 3,3
Profissionalismo 3,03
Compreensibilidade 3,26
Média 2,97
145
Extrato S4 medial
Agradabilidade 4,2
Confiabilidade 3,86
Naturalidade 3,76
Fluidez 3,66
Segurança 3,76
Profissionalismo 3,76
Compreensibilidade 3,8
Média 3,82
Extrato S1 medial
Agradabilidade 3,93
Confiabilidade 3,96
Naturalidade 3,96
Fluidez 3,86
Segurança 4,03
Profissionalismo 3,9
Compreensibilidade 3,86
Média 3,92
146
Extrato S5 adicional
Agradabilidade 3,8
Confiabilidade 3,53
Naturalidade 3,56
Fluidez 3,5
Segurança 3,46
Profissionalismo 3,63
Compreensibilidade 3,53
Média 3,57
Extrato S9 final
Agradabilidade 3,23
Confiabilidade 2,76
Naturalidade 2,56
Fluidez 2,4
Segurança 2,86
Profissionalismo 2,7
Compreensibilidade 2,73
Média 2,74
147
Extrato S2 final
Agradabilidade 4,2
Confiabilidade 4,16
Naturalidade 4,16
Fluidez 4,23
Segurança 4,16
Profissionalismo 4,2
Compreensibilidade 4,26
Média 4,19
Extrato S12 final
Agradabilidade 3,5
Confiabilidade 3,76
Naturalidade 3,6
Fluidez 3,8
Segurança 3,73
Profissionalismo 3,6
Compreensibilidade 3,86
Média 3,69
148
Extrato S5 final
Agradabilidade 4,4
Confiabilidade 4,46
Naturalidade 4,36
Fluidez 4,5
Segurança 4,6
Profissionalismo 4,46
Compreensibilidade 4,56
Média 4,47
149
ANEXO 8 – Resultados Avaliação Conteúdo Semântico-
Discursivo por Avaliador
Avaliador 1
INICIAL MEDIAL FINAL MÉDIA
E O S T E O S T E O S T
S1 5 5 5 5 2 3 2 2 5 5 5 5 4
S2 4 5 5 5 3 4 3 3 4 5 5 5 4,33
S3 1 1 1 1 1 1 0 1 2 1 1 1 1,00
S4 4 4 4 4 2 2 2 2 5 5 5 5 3,67
S5 4 3 3 3 5 5 5 5 3 4 3 3 3,67
S6 3 2 2 2 2 2 2 2 2 3 2 2 2,00
S7 4 4 3 4 3 2 2 2 5 5 5 5 3,67
S8 4 4 4 4 2 3 2 2 1 1 1 1 2,33
S9 4 4 3 4 2 3 2 2 2 2 3 2 2,67
S10 5 5 5 5 2 3 2 2 4 4 4 4 3,67
S11 4 4 5 4 3 3 2 3 2 3 2 2 3,00
S12 4 4 4 4 3 3 2 3 3 2 3 3 3,33
150
Avaliador 2
INICIAL MEDIAL FINAL MÉDIA
E O S T E O S T E O S T
S1 5 5 4,8 5 5 4,5 4,8 4,5 5 5 4,8 5 4,83
S2 5 5 4,8 5 5 4,5 5 4,8 5 5 5 5 4,93
S3 0,5 0,5 0 0 3 2 2 2,5 4 2,5 2,5 3 1,83
S4 5 4,8 4,8 4,8 4 4 4 4 5 4,5 4,5 4,8 4,53
S5 5 4,8 5 5 5 4,5 5 4,8 5 5 5 5 4,93
S6 5 4 5 4 5 4,8 4,8 4,8 5 4,5 4,5 4,8 4,53
S7 4,5 5 5 4,5 5 4,8 4,8 4,8 5 5 5 5 4,77
S8 5 4,5 5 4,8 4,5 5 4,5 4,5 4 4 4 4,5 4,60
S9 5 4,8 4,8 4,8 4,5 4,8 4,5 4,5 4,5 4,5 4 4 4,43
S10 5 4,8 4,8 4,8 4,8 4,8 4,8 4,8 5 5 5 5 4,87
S11 4 4 4,5 4,5 4,5 4,5 4,5 4,5 4,8 5 4,8 4,8 4,60
S12 5 5 5 5 4,8 4,8 4,8 4,8 4,5 5 4,5 4,5 4,77
Avaliador 3
INICIAL MEDIAL FINAL MÉDIA
E O S T E O S T E O S T
S1 4 5 5 5 4 4 5 4 4 5 5 5 4,67
S2 5 5 5 5 4 4 4 4 5 5 5 5 4,67
S3 0 0 2 2 2 2 2 2 3 4 3 3 2,33
S4 3 5 4 5 3 3 3 3 5 4 5 5 4,33
S5 4 5 5 5 5 5 5 5 4 5 5 5 5,00
S6 4 1 4 3 4 4 4 4 5 4 5 4 3,67
S7 4 4 5 5 4 4 4 4 5 5 5 5 4,67
S8 5 5 5 5 3 5 4 3 4 3 4 4 4,00
S9 5 5 5 5 4 5 4 4 4 4 4 4 4,33
S10 4 5 5 5 4 4 4 4 4 5 5 4 4,33
S11 3 5 5 4 4 5 4 5 4 5 4 5 4,67
S12 3 4 4 4 3 4 3 3 4 5 5 4 3,67