117
LINGUÍSTICA DE CORPUS E TRADUÇÃO Stella E. O. Tagnin III EBRALC - PUC - RS 6-7/10/2010

LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Embed Size (px)

Citation preview

Page 1: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

LINGUIacuteSTICA DE CORPUS E

TRADUCcedilAtildeO

Stella E O Tagnin

III EBRALC - PUC - RS

6-7102010

1 FluecircnciaNaturalidade e Convencionalidade

2 Noccedilotildees gerais sobre Linguiacutestica de Corpus

3 Como a LC pode ajudar o tradutor

bull Fonte de referecircncia ndash consulta direta aos corpora

bull Metodologia para a construccedilatildeo corpora personalizados

Resumo da oficina

Fluecircncia e Naturalidade

Eacute um dos objetivos do tradutor

De que consiste

Como alcanccedilaacute-la

Conhecendo as convenccedilotildees da liacutengua

Convencionalidade

ldquoque eacute de uso ou de praxe consolidado

pelo uso ou pela praacuteticardquo (Houaiss)

ldquoque obedece a padrotildees aceitos natildeo

original comumrdquo (Houaiss)

ldquoConsagrado ou aprovado pelo uso pela

experiecircnciardquo (Aureacutelio)

Fraseologias Convenccedilotildees

Regecircncia insist on instructor in dressed in good at

Phrasal Verbs look up get on

Colocaccedilotildees Adjetivas public television Japanese

current

Colocaccedilotildees Nominais labor pains seashore cost of

living

Verbais pay a compliment take a step

Adverbiais lavishly illustrated lie outright

Binocircmios e Multinocircmios dead or alive cats and dogs

Outras fraseologias

Expressotildees Idiomaacuteticas kick the bucket blow onersquos top

Proveacuterbios Not all that glitters is gold

Foacutermulas Situacionais Act your age It takes two to tango

E mais outras

Pelo presente contrato particular de prestaccedilatildeo de serviccedilos as partes abaixo qualificadas de comum acordo contratam entre si os serviccedilos descritos

O objetivo deste artigo eacute discutir analisar apresentar refletir (1240000 hits no Google)

Este artigo tem por objetivo apresentar discutir analisar (431000 hits no Google)

Assim

haacute muito mais expressotildees

fixas na liacutengua do que se

imagina

Como fazer para reconhececirc-

las

Eacute onde entra a Linguumliacutestica de

Corpus

Uma coletacircnea de textos em formato eletrocircnico

compilada segundo criteacuterios especiacuteficosconsiderada representativa de uma liacutengua (ou da parte que se pretende estudar)

destinada agrave pesquisa

O que eacute um corpus hoje

O que permite

examinar uma grande quantidade

de ocorrecircncias

de linguagem autecircntica

de uma soacute vez

por meio de CONCORDAcircNCIAS

E descobrir

Padrotildees lexicais

Padrotildees gramaticais

repeticcedilotildees

N Concordance

1 am na aba inferior do moacutedulo Library Com as imagens classificadas vocecirc pode acionar os f

2 ior Quando for importar uma nova leva de imagens natildeo se assuste pelo fato das fotos i

3 com as bandeirinhas volte classificando as imagens com uso dos roacutetulos colondos e das e

4 r do disco A primeira opccedilatildeo apenas retira a imagem da biblioteca A segunda apaga definit

5 iblioteca A segunda apaga definitivamente a imagem Depois da primeira passada marcand

6 do cabeccedilalho do menu Para adicionar outras imagens a uma coleccedilatildeo jaacute existente basta sel

7 do Collections tambeacutem servem para agrupar as imagens exibidas na mesa de luz No menu Key

8 a Para criar uma nova coleccedilatildeo selecione as imagens que deseja e clique no botatildeo + ao la

9 s na uacuteltima importaccedilatildeo Para controlar quais imagens vocecirc deseja exibir na biblioteca use

10 tatildeo O Lightroom permite cnar coleccedilotildees de imagens que podem ser acessadas rapidamente p

11 tl+Backspace Sempre que tentar deletar uma imagem da biblioteca do Lightroom o programa

12 apenas seratildeo gravadas na hora de exportar as imagens O menu de importaccedilatildeo traz informa

13 ormaccedilotildees essenciais para o armazenamento das imagens Se vocecirc estiver importando fotos que

14 leitor do cartatildeo) Depois de importadas as imagens ficam disponiacuteveis para vocecirc manipular

15 ftwares Assim com ele eacute possiacutevel baixar as imagens do cartatildeo organizaacute-las editaacute-las f

16 adicado em Satildeo Paulo onde manteacutem o banco de imagens Argos (wwwargosfotocombr) e minist

17 para diminuir ou apagar as luzes em volta da imagem selecionada Depois de importadas a

18 eciacuteficos No modo Grid selecione o grupo de imagens que correspondem agrave mesma situaccedilatildeo e m

19 bre a seta correspondente Para editar as imagens que vocecirc importou classificaacute-las ap

20 tidas no proacuteprio arquivo Na era digital as imagens ganham muita mobilidade e precisam se

Concordacircncia para ldquoimagerdquo

O tradutor

eacute um PRODUTOR DE TEXTOS

precisa de

EQUIVALENTE ndash traduccedilatildeo

CONTEXTO ndash exemplo de uso

CONVENCIONALIDADE ndash padrotildees linguiacutesticos e textuais

Informaccedilotildees sobre a TIPOLOGIA TEXTUAL

Especificidades da CULTURA

Linguiacutestica de Corpus

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 2: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

1 FluecircnciaNaturalidade e Convencionalidade

2 Noccedilotildees gerais sobre Linguiacutestica de Corpus

3 Como a LC pode ajudar o tradutor

bull Fonte de referecircncia ndash consulta direta aos corpora

bull Metodologia para a construccedilatildeo corpora personalizados

Resumo da oficina

Fluecircncia e Naturalidade

Eacute um dos objetivos do tradutor

De que consiste

Como alcanccedilaacute-la

Conhecendo as convenccedilotildees da liacutengua

Convencionalidade

ldquoque eacute de uso ou de praxe consolidado

pelo uso ou pela praacuteticardquo (Houaiss)

ldquoque obedece a padrotildees aceitos natildeo

original comumrdquo (Houaiss)

ldquoConsagrado ou aprovado pelo uso pela

experiecircnciardquo (Aureacutelio)

Fraseologias Convenccedilotildees

Regecircncia insist on instructor in dressed in good at

Phrasal Verbs look up get on

Colocaccedilotildees Adjetivas public television Japanese

current

Colocaccedilotildees Nominais labor pains seashore cost of

living

Verbais pay a compliment take a step

Adverbiais lavishly illustrated lie outright

Binocircmios e Multinocircmios dead or alive cats and dogs

Outras fraseologias

Expressotildees Idiomaacuteticas kick the bucket blow onersquos top

Proveacuterbios Not all that glitters is gold

Foacutermulas Situacionais Act your age It takes two to tango

E mais outras

Pelo presente contrato particular de prestaccedilatildeo de serviccedilos as partes abaixo qualificadas de comum acordo contratam entre si os serviccedilos descritos

O objetivo deste artigo eacute discutir analisar apresentar refletir (1240000 hits no Google)

Este artigo tem por objetivo apresentar discutir analisar (431000 hits no Google)

Assim

haacute muito mais expressotildees

fixas na liacutengua do que se

imagina

Como fazer para reconhececirc-

las

Eacute onde entra a Linguumliacutestica de

Corpus

Uma coletacircnea de textos em formato eletrocircnico

compilada segundo criteacuterios especiacuteficosconsiderada representativa de uma liacutengua (ou da parte que se pretende estudar)

destinada agrave pesquisa

O que eacute um corpus hoje

O que permite

examinar uma grande quantidade

de ocorrecircncias

de linguagem autecircntica

de uma soacute vez

por meio de CONCORDAcircNCIAS

E descobrir

Padrotildees lexicais

Padrotildees gramaticais

repeticcedilotildees

N Concordance

1 am na aba inferior do moacutedulo Library Com as imagens classificadas vocecirc pode acionar os f

2 ior Quando for importar uma nova leva de imagens natildeo se assuste pelo fato das fotos i

3 com as bandeirinhas volte classificando as imagens com uso dos roacutetulos colondos e das e

4 r do disco A primeira opccedilatildeo apenas retira a imagem da biblioteca A segunda apaga definit

5 iblioteca A segunda apaga definitivamente a imagem Depois da primeira passada marcand

6 do cabeccedilalho do menu Para adicionar outras imagens a uma coleccedilatildeo jaacute existente basta sel

7 do Collections tambeacutem servem para agrupar as imagens exibidas na mesa de luz No menu Key

8 a Para criar uma nova coleccedilatildeo selecione as imagens que deseja e clique no botatildeo + ao la

9 s na uacuteltima importaccedilatildeo Para controlar quais imagens vocecirc deseja exibir na biblioteca use

10 tatildeo O Lightroom permite cnar coleccedilotildees de imagens que podem ser acessadas rapidamente p

11 tl+Backspace Sempre que tentar deletar uma imagem da biblioteca do Lightroom o programa

12 apenas seratildeo gravadas na hora de exportar as imagens O menu de importaccedilatildeo traz informa

13 ormaccedilotildees essenciais para o armazenamento das imagens Se vocecirc estiver importando fotos que

14 leitor do cartatildeo) Depois de importadas as imagens ficam disponiacuteveis para vocecirc manipular

15 ftwares Assim com ele eacute possiacutevel baixar as imagens do cartatildeo organizaacute-las editaacute-las f

16 adicado em Satildeo Paulo onde manteacutem o banco de imagens Argos (wwwargosfotocombr) e minist

17 para diminuir ou apagar as luzes em volta da imagem selecionada Depois de importadas a

18 eciacuteficos No modo Grid selecione o grupo de imagens que correspondem agrave mesma situaccedilatildeo e m

19 bre a seta correspondente Para editar as imagens que vocecirc importou classificaacute-las ap

20 tidas no proacuteprio arquivo Na era digital as imagens ganham muita mobilidade e precisam se

Concordacircncia para ldquoimagerdquo

O tradutor

eacute um PRODUTOR DE TEXTOS

precisa de

EQUIVALENTE ndash traduccedilatildeo

CONTEXTO ndash exemplo de uso

CONVENCIONALIDADE ndash padrotildees linguiacutesticos e textuais

Informaccedilotildees sobre a TIPOLOGIA TEXTUAL

Especificidades da CULTURA

Linguiacutestica de Corpus

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 3: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Fluecircncia e Naturalidade

Eacute um dos objetivos do tradutor

De que consiste

Como alcanccedilaacute-la

Conhecendo as convenccedilotildees da liacutengua

Convencionalidade

ldquoque eacute de uso ou de praxe consolidado

pelo uso ou pela praacuteticardquo (Houaiss)

ldquoque obedece a padrotildees aceitos natildeo

original comumrdquo (Houaiss)

ldquoConsagrado ou aprovado pelo uso pela

experiecircnciardquo (Aureacutelio)

Fraseologias Convenccedilotildees

Regecircncia insist on instructor in dressed in good at

Phrasal Verbs look up get on

Colocaccedilotildees Adjetivas public television Japanese

current

Colocaccedilotildees Nominais labor pains seashore cost of

living

Verbais pay a compliment take a step

Adverbiais lavishly illustrated lie outright

Binocircmios e Multinocircmios dead or alive cats and dogs

Outras fraseologias

Expressotildees Idiomaacuteticas kick the bucket blow onersquos top

Proveacuterbios Not all that glitters is gold

Foacutermulas Situacionais Act your age It takes two to tango

E mais outras

Pelo presente contrato particular de prestaccedilatildeo de serviccedilos as partes abaixo qualificadas de comum acordo contratam entre si os serviccedilos descritos

O objetivo deste artigo eacute discutir analisar apresentar refletir (1240000 hits no Google)

Este artigo tem por objetivo apresentar discutir analisar (431000 hits no Google)

Assim

haacute muito mais expressotildees

fixas na liacutengua do que se

imagina

Como fazer para reconhececirc-

las

Eacute onde entra a Linguumliacutestica de

Corpus

Uma coletacircnea de textos em formato eletrocircnico

compilada segundo criteacuterios especiacuteficosconsiderada representativa de uma liacutengua (ou da parte que se pretende estudar)

destinada agrave pesquisa

O que eacute um corpus hoje

O que permite

examinar uma grande quantidade

de ocorrecircncias

de linguagem autecircntica

de uma soacute vez

por meio de CONCORDAcircNCIAS

E descobrir

Padrotildees lexicais

Padrotildees gramaticais

repeticcedilotildees

N Concordance

1 am na aba inferior do moacutedulo Library Com as imagens classificadas vocecirc pode acionar os f

2 ior Quando for importar uma nova leva de imagens natildeo se assuste pelo fato das fotos i

3 com as bandeirinhas volte classificando as imagens com uso dos roacutetulos colondos e das e

4 r do disco A primeira opccedilatildeo apenas retira a imagem da biblioteca A segunda apaga definit

5 iblioteca A segunda apaga definitivamente a imagem Depois da primeira passada marcand

6 do cabeccedilalho do menu Para adicionar outras imagens a uma coleccedilatildeo jaacute existente basta sel

7 do Collections tambeacutem servem para agrupar as imagens exibidas na mesa de luz No menu Key

8 a Para criar uma nova coleccedilatildeo selecione as imagens que deseja e clique no botatildeo + ao la

9 s na uacuteltima importaccedilatildeo Para controlar quais imagens vocecirc deseja exibir na biblioteca use

10 tatildeo O Lightroom permite cnar coleccedilotildees de imagens que podem ser acessadas rapidamente p

11 tl+Backspace Sempre que tentar deletar uma imagem da biblioteca do Lightroom o programa

12 apenas seratildeo gravadas na hora de exportar as imagens O menu de importaccedilatildeo traz informa

13 ormaccedilotildees essenciais para o armazenamento das imagens Se vocecirc estiver importando fotos que

14 leitor do cartatildeo) Depois de importadas as imagens ficam disponiacuteveis para vocecirc manipular

15 ftwares Assim com ele eacute possiacutevel baixar as imagens do cartatildeo organizaacute-las editaacute-las f

16 adicado em Satildeo Paulo onde manteacutem o banco de imagens Argos (wwwargosfotocombr) e minist

17 para diminuir ou apagar as luzes em volta da imagem selecionada Depois de importadas a

18 eciacuteficos No modo Grid selecione o grupo de imagens que correspondem agrave mesma situaccedilatildeo e m

19 bre a seta correspondente Para editar as imagens que vocecirc importou classificaacute-las ap

20 tidas no proacuteprio arquivo Na era digital as imagens ganham muita mobilidade e precisam se

Concordacircncia para ldquoimagerdquo

O tradutor

eacute um PRODUTOR DE TEXTOS

precisa de

EQUIVALENTE ndash traduccedilatildeo

CONTEXTO ndash exemplo de uso

CONVENCIONALIDADE ndash padrotildees linguiacutesticos e textuais

Informaccedilotildees sobre a TIPOLOGIA TEXTUAL

Especificidades da CULTURA

Linguiacutestica de Corpus

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 4: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Convencionalidade

ldquoque eacute de uso ou de praxe consolidado

pelo uso ou pela praacuteticardquo (Houaiss)

ldquoque obedece a padrotildees aceitos natildeo

original comumrdquo (Houaiss)

ldquoConsagrado ou aprovado pelo uso pela

experiecircnciardquo (Aureacutelio)

Fraseologias Convenccedilotildees

Regecircncia insist on instructor in dressed in good at

Phrasal Verbs look up get on

Colocaccedilotildees Adjetivas public television Japanese

current

Colocaccedilotildees Nominais labor pains seashore cost of

living

Verbais pay a compliment take a step

Adverbiais lavishly illustrated lie outright

Binocircmios e Multinocircmios dead or alive cats and dogs

Outras fraseologias

Expressotildees Idiomaacuteticas kick the bucket blow onersquos top

Proveacuterbios Not all that glitters is gold

Foacutermulas Situacionais Act your age It takes two to tango

E mais outras

Pelo presente contrato particular de prestaccedilatildeo de serviccedilos as partes abaixo qualificadas de comum acordo contratam entre si os serviccedilos descritos

O objetivo deste artigo eacute discutir analisar apresentar refletir (1240000 hits no Google)

Este artigo tem por objetivo apresentar discutir analisar (431000 hits no Google)

Assim

haacute muito mais expressotildees

fixas na liacutengua do que se

imagina

Como fazer para reconhececirc-

las

Eacute onde entra a Linguumliacutestica de

Corpus

Uma coletacircnea de textos em formato eletrocircnico

compilada segundo criteacuterios especiacuteficosconsiderada representativa de uma liacutengua (ou da parte que se pretende estudar)

destinada agrave pesquisa

O que eacute um corpus hoje

O que permite

examinar uma grande quantidade

de ocorrecircncias

de linguagem autecircntica

de uma soacute vez

por meio de CONCORDAcircNCIAS

E descobrir

Padrotildees lexicais

Padrotildees gramaticais

repeticcedilotildees

N Concordance

1 am na aba inferior do moacutedulo Library Com as imagens classificadas vocecirc pode acionar os f

2 ior Quando for importar uma nova leva de imagens natildeo se assuste pelo fato das fotos i

3 com as bandeirinhas volte classificando as imagens com uso dos roacutetulos colondos e das e

4 r do disco A primeira opccedilatildeo apenas retira a imagem da biblioteca A segunda apaga definit

5 iblioteca A segunda apaga definitivamente a imagem Depois da primeira passada marcand

6 do cabeccedilalho do menu Para adicionar outras imagens a uma coleccedilatildeo jaacute existente basta sel

7 do Collections tambeacutem servem para agrupar as imagens exibidas na mesa de luz No menu Key

8 a Para criar uma nova coleccedilatildeo selecione as imagens que deseja e clique no botatildeo + ao la

9 s na uacuteltima importaccedilatildeo Para controlar quais imagens vocecirc deseja exibir na biblioteca use

10 tatildeo O Lightroom permite cnar coleccedilotildees de imagens que podem ser acessadas rapidamente p

11 tl+Backspace Sempre que tentar deletar uma imagem da biblioteca do Lightroom o programa

12 apenas seratildeo gravadas na hora de exportar as imagens O menu de importaccedilatildeo traz informa

13 ormaccedilotildees essenciais para o armazenamento das imagens Se vocecirc estiver importando fotos que

14 leitor do cartatildeo) Depois de importadas as imagens ficam disponiacuteveis para vocecirc manipular

15 ftwares Assim com ele eacute possiacutevel baixar as imagens do cartatildeo organizaacute-las editaacute-las f

16 adicado em Satildeo Paulo onde manteacutem o banco de imagens Argos (wwwargosfotocombr) e minist

17 para diminuir ou apagar as luzes em volta da imagem selecionada Depois de importadas a

18 eciacuteficos No modo Grid selecione o grupo de imagens que correspondem agrave mesma situaccedilatildeo e m

19 bre a seta correspondente Para editar as imagens que vocecirc importou classificaacute-las ap

20 tidas no proacuteprio arquivo Na era digital as imagens ganham muita mobilidade e precisam se

Concordacircncia para ldquoimagerdquo

O tradutor

eacute um PRODUTOR DE TEXTOS

precisa de

EQUIVALENTE ndash traduccedilatildeo

CONTEXTO ndash exemplo de uso

CONVENCIONALIDADE ndash padrotildees linguiacutesticos e textuais

Informaccedilotildees sobre a TIPOLOGIA TEXTUAL

Especificidades da CULTURA

Linguiacutestica de Corpus

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 5: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Fraseologias Convenccedilotildees

Regecircncia insist on instructor in dressed in good at

Phrasal Verbs look up get on

Colocaccedilotildees Adjetivas public television Japanese

current

Colocaccedilotildees Nominais labor pains seashore cost of

living

Verbais pay a compliment take a step

Adverbiais lavishly illustrated lie outright

Binocircmios e Multinocircmios dead or alive cats and dogs

Outras fraseologias

Expressotildees Idiomaacuteticas kick the bucket blow onersquos top

Proveacuterbios Not all that glitters is gold

Foacutermulas Situacionais Act your age It takes two to tango

E mais outras

Pelo presente contrato particular de prestaccedilatildeo de serviccedilos as partes abaixo qualificadas de comum acordo contratam entre si os serviccedilos descritos

O objetivo deste artigo eacute discutir analisar apresentar refletir (1240000 hits no Google)

Este artigo tem por objetivo apresentar discutir analisar (431000 hits no Google)

Assim

haacute muito mais expressotildees

fixas na liacutengua do que se

imagina

Como fazer para reconhececirc-

las

Eacute onde entra a Linguumliacutestica de

Corpus

Uma coletacircnea de textos em formato eletrocircnico

compilada segundo criteacuterios especiacuteficosconsiderada representativa de uma liacutengua (ou da parte que se pretende estudar)

destinada agrave pesquisa

O que eacute um corpus hoje

O que permite

examinar uma grande quantidade

de ocorrecircncias

de linguagem autecircntica

de uma soacute vez

por meio de CONCORDAcircNCIAS

E descobrir

Padrotildees lexicais

Padrotildees gramaticais

repeticcedilotildees

N Concordance

1 am na aba inferior do moacutedulo Library Com as imagens classificadas vocecirc pode acionar os f

2 ior Quando for importar uma nova leva de imagens natildeo se assuste pelo fato das fotos i

3 com as bandeirinhas volte classificando as imagens com uso dos roacutetulos colondos e das e

4 r do disco A primeira opccedilatildeo apenas retira a imagem da biblioteca A segunda apaga definit

5 iblioteca A segunda apaga definitivamente a imagem Depois da primeira passada marcand

6 do cabeccedilalho do menu Para adicionar outras imagens a uma coleccedilatildeo jaacute existente basta sel

7 do Collections tambeacutem servem para agrupar as imagens exibidas na mesa de luz No menu Key

8 a Para criar uma nova coleccedilatildeo selecione as imagens que deseja e clique no botatildeo + ao la

9 s na uacuteltima importaccedilatildeo Para controlar quais imagens vocecirc deseja exibir na biblioteca use

10 tatildeo O Lightroom permite cnar coleccedilotildees de imagens que podem ser acessadas rapidamente p

11 tl+Backspace Sempre que tentar deletar uma imagem da biblioteca do Lightroom o programa

12 apenas seratildeo gravadas na hora de exportar as imagens O menu de importaccedilatildeo traz informa

13 ormaccedilotildees essenciais para o armazenamento das imagens Se vocecirc estiver importando fotos que

14 leitor do cartatildeo) Depois de importadas as imagens ficam disponiacuteveis para vocecirc manipular

15 ftwares Assim com ele eacute possiacutevel baixar as imagens do cartatildeo organizaacute-las editaacute-las f

16 adicado em Satildeo Paulo onde manteacutem o banco de imagens Argos (wwwargosfotocombr) e minist

17 para diminuir ou apagar as luzes em volta da imagem selecionada Depois de importadas a

18 eciacuteficos No modo Grid selecione o grupo de imagens que correspondem agrave mesma situaccedilatildeo e m

19 bre a seta correspondente Para editar as imagens que vocecirc importou classificaacute-las ap

20 tidas no proacuteprio arquivo Na era digital as imagens ganham muita mobilidade e precisam se

Concordacircncia para ldquoimagerdquo

O tradutor

eacute um PRODUTOR DE TEXTOS

precisa de

EQUIVALENTE ndash traduccedilatildeo

CONTEXTO ndash exemplo de uso

CONVENCIONALIDADE ndash padrotildees linguiacutesticos e textuais

Informaccedilotildees sobre a TIPOLOGIA TEXTUAL

Especificidades da CULTURA

Linguiacutestica de Corpus

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 6: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Outras fraseologias

Expressotildees Idiomaacuteticas kick the bucket blow onersquos top

Proveacuterbios Not all that glitters is gold

Foacutermulas Situacionais Act your age It takes two to tango

E mais outras

Pelo presente contrato particular de prestaccedilatildeo de serviccedilos as partes abaixo qualificadas de comum acordo contratam entre si os serviccedilos descritos

O objetivo deste artigo eacute discutir analisar apresentar refletir (1240000 hits no Google)

Este artigo tem por objetivo apresentar discutir analisar (431000 hits no Google)

Assim

haacute muito mais expressotildees

fixas na liacutengua do que se

imagina

Como fazer para reconhececirc-

las

Eacute onde entra a Linguumliacutestica de

Corpus

Uma coletacircnea de textos em formato eletrocircnico

compilada segundo criteacuterios especiacuteficosconsiderada representativa de uma liacutengua (ou da parte que se pretende estudar)

destinada agrave pesquisa

O que eacute um corpus hoje

O que permite

examinar uma grande quantidade

de ocorrecircncias

de linguagem autecircntica

de uma soacute vez

por meio de CONCORDAcircNCIAS

E descobrir

Padrotildees lexicais

Padrotildees gramaticais

repeticcedilotildees

N Concordance

1 am na aba inferior do moacutedulo Library Com as imagens classificadas vocecirc pode acionar os f

2 ior Quando for importar uma nova leva de imagens natildeo se assuste pelo fato das fotos i

3 com as bandeirinhas volte classificando as imagens com uso dos roacutetulos colondos e das e

4 r do disco A primeira opccedilatildeo apenas retira a imagem da biblioteca A segunda apaga definit

5 iblioteca A segunda apaga definitivamente a imagem Depois da primeira passada marcand

6 do cabeccedilalho do menu Para adicionar outras imagens a uma coleccedilatildeo jaacute existente basta sel

7 do Collections tambeacutem servem para agrupar as imagens exibidas na mesa de luz No menu Key

8 a Para criar uma nova coleccedilatildeo selecione as imagens que deseja e clique no botatildeo + ao la

9 s na uacuteltima importaccedilatildeo Para controlar quais imagens vocecirc deseja exibir na biblioteca use

10 tatildeo O Lightroom permite cnar coleccedilotildees de imagens que podem ser acessadas rapidamente p

11 tl+Backspace Sempre que tentar deletar uma imagem da biblioteca do Lightroom o programa

12 apenas seratildeo gravadas na hora de exportar as imagens O menu de importaccedilatildeo traz informa

13 ormaccedilotildees essenciais para o armazenamento das imagens Se vocecirc estiver importando fotos que

14 leitor do cartatildeo) Depois de importadas as imagens ficam disponiacuteveis para vocecirc manipular

15 ftwares Assim com ele eacute possiacutevel baixar as imagens do cartatildeo organizaacute-las editaacute-las f

16 adicado em Satildeo Paulo onde manteacutem o banco de imagens Argos (wwwargosfotocombr) e minist

17 para diminuir ou apagar as luzes em volta da imagem selecionada Depois de importadas a

18 eciacuteficos No modo Grid selecione o grupo de imagens que correspondem agrave mesma situaccedilatildeo e m

19 bre a seta correspondente Para editar as imagens que vocecirc importou classificaacute-las ap

20 tidas no proacuteprio arquivo Na era digital as imagens ganham muita mobilidade e precisam se

Concordacircncia para ldquoimagerdquo

O tradutor

eacute um PRODUTOR DE TEXTOS

precisa de

EQUIVALENTE ndash traduccedilatildeo

CONTEXTO ndash exemplo de uso

CONVENCIONALIDADE ndash padrotildees linguiacutesticos e textuais

Informaccedilotildees sobre a TIPOLOGIA TEXTUAL

Especificidades da CULTURA

Linguiacutestica de Corpus

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 7: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Assim

haacute muito mais expressotildees

fixas na liacutengua do que se

imagina

Como fazer para reconhececirc-

las

Eacute onde entra a Linguumliacutestica de

Corpus

Uma coletacircnea de textos em formato eletrocircnico

compilada segundo criteacuterios especiacuteficosconsiderada representativa de uma liacutengua (ou da parte que se pretende estudar)

destinada agrave pesquisa

O que eacute um corpus hoje

O que permite

examinar uma grande quantidade

de ocorrecircncias

de linguagem autecircntica

de uma soacute vez

por meio de CONCORDAcircNCIAS

E descobrir

Padrotildees lexicais

Padrotildees gramaticais

repeticcedilotildees

N Concordance

1 am na aba inferior do moacutedulo Library Com as imagens classificadas vocecirc pode acionar os f

2 ior Quando for importar uma nova leva de imagens natildeo se assuste pelo fato das fotos i

3 com as bandeirinhas volte classificando as imagens com uso dos roacutetulos colondos e das e

4 r do disco A primeira opccedilatildeo apenas retira a imagem da biblioteca A segunda apaga definit

5 iblioteca A segunda apaga definitivamente a imagem Depois da primeira passada marcand

6 do cabeccedilalho do menu Para adicionar outras imagens a uma coleccedilatildeo jaacute existente basta sel

7 do Collections tambeacutem servem para agrupar as imagens exibidas na mesa de luz No menu Key

8 a Para criar uma nova coleccedilatildeo selecione as imagens que deseja e clique no botatildeo + ao la

9 s na uacuteltima importaccedilatildeo Para controlar quais imagens vocecirc deseja exibir na biblioteca use

10 tatildeo O Lightroom permite cnar coleccedilotildees de imagens que podem ser acessadas rapidamente p

11 tl+Backspace Sempre que tentar deletar uma imagem da biblioteca do Lightroom o programa

12 apenas seratildeo gravadas na hora de exportar as imagens O menu de importaccedilatildeo traz informa

13 ormaccedilotildees essenciais para o armazenamento das imagens Se vocecirc estiver importando fotos que

14 leitor do cartatildeo) Depois de importadas as imagens ficam disponiacuteveis para vocecirc manipular

15 ftwares Assim com ele eacute possiacutevel baixar as imagens do cartatildeo organizaacute-las editaacute-las f

16 adicado em Satildeo Paulo onde manteacutem o banco de imagens Argos (wwwargosfotocombr) e minist

17 para diminuir ou apagar as luzes em volta da imagem selecionada Depois de importadas a

18 eciacuteficos No modo Grid selecione o grupo de imagens que correspondem agrave mesma situaccedilatildeo e m

19 bre a seta correspondente Para editar as imagens que vocecirc importou classificaacute-las ap

20 tidas no proacuteprio arquivo Na era digital as imagens ganham muita mobilidade e precisam se

Concordacircncia para ldquoimagerdquo

O tradutor

eacute um PRODUTOR DE TEXTOS

precisa de

EQUIVALENTE ndash traduccedilatildeo

CONTEXTO ndash exemplo de uso

CONVENCIONALIDADE ndash padrotildees linguiacutesticos e textuais

Informaccedilotildees sobre a TIPOLOGIA TEXTUAL

Especificidades da CULTURA

Linguiacutestica de Corpus

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 8: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Eacute onde entra a Linguumliacutestica de

Corpus

Uma coletacircnea de textos em formato eletrocircnico

compilada segundo criteacuterios especiacuteficosconsiderada representativa de uma liacutengua (ou da parte que se pretende estudar)

destinada agrave pesquisa

O que eacute um corpus hoje

O que permite

examinar uma grande quantidade

de ocorrecircncias

de linguagem autecircntica

de uma soacute vez

por meio de CONCORDAcircNCIAS

E descobrir

Padrotildees lexicais

Padrotildees gramaticais

repeticcedilotildees

N Concordance

1 am na aba inferior do moacutedulo Library Com as imagens classificadas vocecirc pode acionar os f

2 ior Quando for importar uma nova leva de imagens natildeo se assuste pelo fato das fotos i

3 com as bandeirinhas volte classificando as imagens com uso dos roacutetulos colondos e das e

4 r do disco A primeira opccedilatildeo apenas retira a imagem da biblioteca A segunda apaga definit

5 iblioteca A segunda apaga definitivamente a imagem Depois da primeira passada marcand

6 do cabeccedilalho do menu Para adicionar outras imagens a uma coleccedilatildeo jaacute existente basta sel

7 do Collections tambeacutem servem para agrupar as imagens exibidas na mesa de luz No menu Key

8 a Para criar uma nova coleccedilatildeo selecione as imagens que deseja e clique no botatildeo + ao la

9 s na uacuteltima importaccedilatildeo Para controlar quais imagens vocecirc deseja exibir na biblioteca use

10 tatildeo O Lightroom permite cnar coleccedilotildees de imagens que podem ser acessadas rapidamente p

11 tl+Backspace Sempre que tentar deletar uma imagem da biblioteca do Lightroom o programa

12 apenas seratildeo gravadas na hora de exportar as imagens O menu de importaccedilatildeo traz informa

13 ormaccedilotildees essenciais para o armazenamento das imagens Se vocecirc estiver importando fotos que

14 leitor do cartatildeo) Depois de importadas as imagens ficam disponiacuteveis para vocecirc manipular

15 ftwares Assim com ele eacute possiacutevel baixar as imagens do cartatildeo organizaacute-las editaacute-las f

16 adicado em Satildeo Paulo onde manteacutem o banco de imagens Argos (wwwargosfotocombr) e minist

17 para diminuir ou apagar as luzes em volta da imagem selecionada Depois de importadas a

18 eciacuteficos No modo Grid selecione o grupo de imagens que correspondem agrave mesma situaccedilatildeo e m

19 bre a seta correspondente Para editar as imagens que vocecirc importou classificaacute-las ap

20 tidas no proacuteprio arquivo Na era digital as imagens ganham muita mobilidade e precisam se

Concordacircncia para ldquoimagerdquo

O tradutor

eacute um PRODUTOR DE TEXTOS

precisa de

EQUIVALENTE ndash traduccedilatildeo

CONTEXTO ndash exemplo de uso

CONVENCIONALIDADE ndash padrotildees linguiacutesticos e textuais

Informaccedilotildees sobre a TIPOLOGIA TEXTUAL

Especificidades da CULTURA

Linguiacutestica de Corpus

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 9: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Uma coletacircnea de textos em formato eletrocircnico

compilada segundo criteacuterios especiacuteficosconsiderada representativa de uma liacutengua (ou da parte que se pretende estudar)

destinada agrave pesquisa

O que eacute um corpus hoje

O que permite

examinar uma grande quantidade

de ocorrecircncias

de linguagem autecircntica

de uma soacute vez

por meio de CONCORDAcircNCIAS

E descobrir

Padrotildees lexicais

Padrotildees gramaticais

repeticcedilotildees

N Concordance

1 am na aba inferior do moacutedulo Library Com as imagens classificadas vocecirc pode acionar os f

2 ior Quando for importar uma nova leva de imagens natildeo se assuste pelo fato das fotos i

3 com as bandeirinhas volte classificando as imagens com uso dos roacutetulos colondos e das e

4 r do disco A primeira opccedilatildeo apenas retira a imagem da biblioteca A segunda apaga definit

5 iblioteca A segunda apaga definitivamente a imagem Depois da primeira passada marcand

6 do cabeccedilalho do menu Para adicionar outras imagens a uma coleccedilatildeo jaacute existente basta sel

7 do Collections tambeacutem servem para agrupar as imagens exibidas na mesa de luz No menu Key

8 a Para criar uma nova coleccedilatildeo selecione as imagens que deseja e clique no botatildeo + ao la

9 s na uacuteltima importaccedilatildeo Para controlar quais imagens vocecirc deseja exibir na biblioteca use

10 tatildeo O Lightroom permite cnar coleccedilotildees de imagens que podem ser acessadas rapidamente p

11 tl+Backspace Sempre que tentar deletar uma imagem da biblioteca do Lightroom o programa

12 apenas seratildeo gravadas na hora de exportar as imagens O menu de importaccedilatildeo traz informa

13 ormaccedilotildees essenciais para o armazenamento das imagens Se vocecirc estiver importando fotos que

14 leitor do cartatildeo) Depois de importadas as imagens ficam disponiacuteveis para vocecirc manipular

15 ftwares Assim com ele eacute possiacutevel baixar as imagens do cartatildeo organizaacute-las editaacute-las f

16 adicado em Satildeo Paulo onde manteacutem o banco de imagens Argos (wwwargosfotocombr) e minist

17 para diminuir ou apagar as luzes em volta da imagem selecionada Depois de importadas a

18 eciacuteficos No modo Grid selecione o grupo de imagens que correspondem agrave mesma situaccedilatildeo e m

19 bre a seta correspondente Para editar as imagens que vocecirc importou classificaacute-las ap

20 tidas no proacuteprio arquivo Na era digital as imagens ganham muita mobilidade e precisam se

Concordacircncia para ldquoimagerdquo

O tradutor

eacute um PRODUTOR DE TEXTOS

precisa de

EQUIVALENTE ndash traduccedilatildeo

CONTEXTO ndash exemplo de uso

CONVENCIONALIDADE ndash padrotildees linguiacutesticos e textuais

Informaccedilotildees sobre a TIPOLOGIA TEXTUAL

Especificidades da CULTURA

Linguiacutestica de Corpus

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 10: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

O que permite

examinar uma grande quantidade

de ocorrecircncias

de linguagem autecircntica

de uma soacute vez

por meio de CONCORDAcircNCIAS

E descobrir

Padrotildees lexicais

Padrotildees gramaticais

repeticcedilotildees

N Concordance

1 am na aba inferior do moacutedulo Library Com as imagens classificadas vocecirc pode acionar os f

2 ior Quando for importar uma nova leva de imagens natildeo se assuste pelo fato das fotos i

3 com as bandeirinhas volte classificando as imagens com uso dos roacutetulos colondos e das e

4 r do disco A primeira opccedilatildeo apenas retira a imagem da biblioteca A segunda apaga definit

5 iblioteca A segunda apaga definitivamente a imagem Depois da primeira passada marcand

6 do cabeccedilalho do menu Para adicionar outras imagens a uma coleccedilatildeo jaacute existente basta sel

7 do Collections tambeacutem servem para agrupar as imagens exibidas na mesa de luz No menu Key

8 a Para criar uma nova coleccedilatildeo selecione as imagens que deseja e clique no botatildeo + ao la

9 s na uacuteltima importaccedilatildeo Para controlar quais imagens vocecirc deseja exibir na biblioteca use

10 tatildeo O Lightroom permite cnar coleccedilotildees de imagens que podem ser acessadas rapidamente p

11 tl+Backspace Sempre que tentar deletar uma imagem da biblioteca do Lightroom o programa

12 apenas seratildeo gravadas na hora de exportar as imagens O menu de importaccedilatildeo traz informa

13 ormaccedilotildees essenciais para o armazenamento das imagens Se vocecirc estiver importando fotos que

14 leitor do cartatildeo) Depois de importadas as imagens ficam disponiacuteveis para vocecirc manipular

15 ftwares Assim com ele eacute possiacutevel baixar as imagens do cartatildeo organizaacute-las editaacute-las f

16 adicado em Satildeo Paulo onde manteacutem o banco de imagens Argos (wwwargosfotocombr) e minist

17 para diminuir ou apagar as luzes em volta da imagem selecionada Depois de importadas a

18 eciacuteficos No modo Grid selecione o grupo de imagens que correspondem agrave mesma situaccedilatildeo e m

19 bre a seta correspondente Para editar as imagens que vocecirc importou classificaacute-las ap

20 tidas no proacuteprio arquivo Na era digital as imagens ganham muita mobilidade e precisam se

Concordacircncia para ldquoimagerdquo

O tradutor

eacute um PRODUTOR DE TEXTOS

precisa de

EQUIVALENTE ndash traduccedilatildeo

CONTEXTO ndash exemplo de uso

CONVENCIONALIDADE ndash padrotildees linguiacutesticos e textuais

Informaccedilotildees sobre a TIPOLOGIA TEXTUAL

Especificidades da CULTURA

Linguiacutestica de Corpus

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 11: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

E descobrir

Padrotildees lexicais

Padrotildees gramaticais

repeticcedilotildees

N Concordance

1 am na aba inferior do moacutedulo Library Com as imagens classificadas vocecirc pode acionar os f

2 ior Quando for importar uma nova leva de imagens natildeo se assuste pelo fato das fotos i

3 com as bandeirinhas volte classificando as imagens com uso dos roacutetulos colondos e das e

4 r do disco A primeira opccedilatildeo apenas retira a imagem da biblioteca A segunda apaga definit

5 iblioteca A segunda apaga definitivamente a imagem Depois da primeira passada marcand

6 do cabeccedilalho do menu Para adicionar outras imagens a uma coleccedilatildeo jaacute existente basta sel

7 do Collections tambeacutem servem para agrupar as imagens exibidas na mesa de luz No menu Key

8 a Para criar uma nova coleccedilatildeo selecione as imagens que deseja e clique no botatildeo + ao la

9 s na uacuteltima importaccedilatildeo Para controlar quais imagens vocecirc deseja exibir na biblioteca use

10 tatildeo O Lightroom permite cnar coleccedilotildees de imagens que podem ser acessadas rapidamente p

11 tl+Backspace Sempre que tentar deletar uma imagem da biblioteca do Lightroom o programa

12 apenas seratildeo gravadas na hora de exportar as imagens O menu de importaccedilatildeo traz informa

13 ormaccedilotildees essenciais para o armazenamento das imagens Se vocecirc estiver importando fotos que

14 leitor do cartatildeo) Depois de importadas as imagens ficam disponiacuteveis para vocecirc manipular

15 ftwares Assim com ele eacute possiacutevel baixar as imagens do cartatildeo organizaacute-las editaacute-las f

16 adicado em Satildeo Paulo onde manteacutem o banco de imagens Argos (wwwargosfotocombr) e minist

17 para diminuir ou apagar as luzes em volta da imagem selecionada Depois de importadas a

18 eciacuteficos No modo Grid selecione o grupo de imagens que correspondem agrave mesma situaccedilatildeo e m

19 bre a seta correspondente Para editar as imagens que vocecirc importou classificaacute-las ap

20 tidas no proacuteprio arquivo Na era digital as imagens ganham muita mobilidade e precisam se

Concordacircncia para ldquoimagerdquo

O tradutor

eacute um PRODUTOR DE TEXTOS

precisa de

EQUIVALENTE ndash traduccedilatildeo

CONTEXTO ndash exemplo de uso

CONVENCIONALIDADE ndash padrotildees linguiacutesticos e textuais

Informaccedilotildees sobre a TIPOLOGIA TEXTUAL

Especificidades da CULTURA

Linguiacutestica de Corpus

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 12: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

N Concordance

1 am na aba inferior do moacutedulo Library Com as imagens classificadas vocecirc pode acionar os f

2 ior Quando for importar uma nova leva de imagens natildeo se assuste pelo fato das fotos i

3 com as bandeirinhas volte classificando as imagens com uso dos roacutetulos colondos e das e

4 r do disco A primeira opccedilatildeo apenas retira a imagem da biblioteca A segunda apaga definit

5 iblioteca A segunda apaga definitivamente a imagem Depois da primeira passada marcand

6 do cabeccedilalho do menu Para adicionar outras imagens a uma coleccedilatildeo jaacute existente basta sel

7 do Collections tambeacutem servem para agrupar as imagens exibidas na mesa de luz No menu Key

8 a Para criar uma nova coleccedilatildeo selecione as imagens que deseja e clique no botatildeo + ao la

9 s na uacuteltima importaccedilatildeo Para controlar quais imagens vocecirc deseja exibir na biblioteca use

10 tatildeo O Lightroom permite cnar coleccedilotildees de imagens que podem ser acessadas rapidamente p

11 tl+Backspace Sempre que tentar deletar uma imagem da biblioteca do Lightroom o programa

12 apenas seratildeo gravadas na hora de exportar as imagens O menu de importaccedilatildeo traz informa

13 ormaccedilotildees essenciais para o armazenamento das imagens Se vocecirc estiver importando fotos que

14 leitor do cartatildeo) Depois de importadas as imagens ficam disponiacuteveis para vocecirc manipular

15 ftwares Assim com ele eacute possiacutevel baixar as imagens do cartatildeo organizaacute-las editaacute-las f

16 adicado em Satildeo Paulo onde manteacutem o banco de imagens Argos (wwwargosfotocombr) e minist

17 para diminuir ou apagar as luzes em volta da imagem selecionada Depois de importadas a

18 eciacuteficos No modo Grid selecione o grupo de imagens que correspondem agrave mesma situaccedilatildeo e m

19 bre a seta correspondente Para editar as imagens que vocecirc importou classificaacute-las ap

20 tidas no proacuteprio arquivo Na era digital as imagens ganham muita mobilidade e precisam se

Concordacircncia para ldquoimagerdquo

O tradutor

eacute um PRODUTOR DE TEXTOS

precisa de

EQUIVALENTE ndash traduccedilatildeo

CONTEXTO ndash exemplo de uso

CONVENCIONALIDADE ndash padrotildees linguiacutesticos e textuais

Informaccedilotildees sobre a TIPOLOGIA TEXTUAL

Especificidades da CULTURA

Linguiacutestica de Corpus

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 13: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

O tradutor

eacute um PRODUTOR DE TEXTOS

precisa de

EQUIVALENTE ndash traduccedilatildeo

CONTEXTO ndash exemplo de uso

CONVENCIONALIDADE ndash padrotildees linguiacutesticos e textuais

Informaccedilotildees sobre a TIPOLOGIA TEXTUAL

Especificidades da CULTURA

Linguiacutestica de Corpus

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 14: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Corpora para Traduccedilatildeo

Corpora on-line

Corpora biliacutengues inglecircs-portuguecircs

COMPARA wwwlinguatecaptCOMPARA

CorTec httpwwwfflchuspbrdlmcometconsulta_cortechtml

CorTrad httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Corpora personalizadosCompilados pelo tradutor

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 15: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

CorTec 2005

5 corpora comparaacuteveis

Culinaacuteria ndash receitas

Meio ambiente - Ecoturismo

Informaacutetica - Geral

Cardiologia ndash Hipertensatildeo

Direito ndash instrumentos contratuais

inglecircs ndash portuguecircs

aproximadamente 200000 palavras cada

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 16: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

CorTec 2005

Ferramentas

lista de frequecircncia

concordanciador

igual a

comeccedilando com

terminando com

contendo

n-gramas

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 17: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

CorTec 2008

14 corpora (CNPq)

Ecoturismo

Hipertensatildeo

Instrumentos Contratuais

Astronomia

Insuficiecircncia Renal

Linguiacutestica

Medidores Eletromagneacuteticos de Vazatildeo

Suplementos Nutricionais

Computaccedilatildeo

Futebol

Cafeacute

Turismo Cultural

Culinaacuteria 1 e 2

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 18: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

x

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 19: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Hipertensatildeo Ptg

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 20: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Tarefa 1

Situaccedilatildeo Vocecirc tem uma traduccedilatildeo sobre hipertensatildeo mas natildeo conhece o vocabulaacuterio muito menos os equivalentes em portuguecircs

Faccedila uma lista de frequecircncia para o corpus de Hipertensatildeo em inglecircs

Quais as palavras lexicais mais frequentes

Satildeo correspondentes agraves em portuguecircs

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 21: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Hypertension

Eng

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 22: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hipertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hipertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 23: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 24: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 25: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 26: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Comparando as frequecircncias

Portuguecircs

25 ndash pacientes

35 ndash arterial

44 ndash pressure

45 ndash blood

49 ndash hipertensatildeo

50 ndash estudo

51 ndash tratamento (54 ndash treatment)

52 ndash pressatildeo

53 ndash niacuteveis

54 - maior

Inglecircs

19 ndash patients

23 ndash pressure

24 ndash blood

27 ndash study

28 ndash hypertension

29 ndash bp

30 ndash p

38 ndash subjects

43 ndash hypertensive

46 ndash data

47 ndash group

48 ndash plasma

49 ndash rats

50 - levels

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 27: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Tarefa 2

Situaccedilatildeo Vocecirc precisa traduzir

ldquomedidores de vazatildeordquo para o inglecircs

Use o corpus de ldquoMedidores

eletromagneacuteticos de vazatildeordquo

Qual foi seu procedimento para

estabelecer a equivalecircncia

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 28: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Tarefa 3

Situaccedilatildeo Algueacutem pediu para vocecirc traduzir

uma receita do inglecircs para o portuguecircs

Quais satildeo as formas de preparar carne

em portuguecircs

Quais os correspondentes em inglecircs

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 29: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape from the legs

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 30: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

O que fazer com carne

Portuguecircs

liberar do osso

raspar do osso

bater com martelo

cozinhar

passar pela farinha

dourar

fritar

refogar

cortar

deixar de molho

temperar

(per)furar

lardear

Inglecircs

scoop out (from the shell)

scrape (from the legs)

boil

toss

roll in flour

brown

simmer

marinate

chop

coat with flour

soak

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 31: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

CorTrad ndash projeto conjunto

Projeto CoMET ndash DLMUSP Satildeo Paulo (httpwwwfflchuspbrdlmcomet ) idealizaccedilatildeo

coleta e preparo dos textos

disponibilizaccedilatildeo do corpus para a comunidade

Linguateca ndash SINTEF Oslo (httpwwwlinguatecapt ) idealizaccedilatildeo

desenvolvimento e implementaccedilatildeo da parte computacional -DISPARA

alinhamento e anotaccedilatildeo iniciais

NILC ndash USP Satildeo Carlos (httpwwwnilcicmcuspbr ) hospedagem

futuramente manutenccedilatildeo e melhoria da parte computacional

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 32: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

CorTrad

httpwwwfflchuspbrdlmcometconsulta_cortradhtml

Projeto em andamento iniciado em maio de 2008

Conta atualmente com 3 subcorpora Literaacuterio (por ora 27 contos australianos)

Teacutecnico-cientiacutefico (por ora 1 livro de culinaacuteria de 350 paacuteginas ndash aprox 130000 palavras)

Jornaliacutestico (por ora 1076 textos provenientes de vaacuterios nuacutemeros da Revista Pesquisa Fapesp (2001 a 2003)

Criteacuterio de coleta disponibilidade

Diferenciais

Multiversatildeo ndash permite comparar vaacuterias etapas da traduccedilatildeo revisatildeo

Sistema de busca refinado ndash permite buscas especiacuteficas para cada subcorpus

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 33: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Sistema de busca e anotaccedilatildeo

DISPARA (Santos 2002) - sistema parametrizaacutevel de disponibilizaccedilatildeo de corpora paralelos na rede

Sistema de processamento de corpus IMS-CWB (Christ et al 1999) agora Open CWB

Etiquetagem morfossintaacutetica Portuguecircs PALAVRAS (Bick 2000)

httpvislhumsdudkvislpt

Inglecircs CLAWS (Rayson amp Garside 1998)httpwwwcomplancsacukcomputingresearchucrelclaws

Interface desenhada pela equipe e programada por Patricia Tagnin

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 34: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Direitos autorais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 35: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Corpus Jornaliacutestico

Revista Pesquisa FAPESP

originais em portuguecircs

traduccedilotildees em inglecircs ndash publicadas online

ediccedilotildees de 2001 2002 e 2003

total de 20 nuacutemeros

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 36: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Corpus jornaliacutesticoDivulgaccedilatildeo cientiacutefica

Original

(Portuguecircs brasileiro)

Traduccedilatildeo publicada

(online)

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 37: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Situaccedilatildeo Vocecirc quer diversificar as

formas de traduzir pesquisa para o

inglecircs

bull Use o corpus de divulgaccedilatildeo cientiacutefica

(na revista Pesquisa da FAPESP)

Tarefa 6

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 38: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Tarefa 4

Situaccedilatildeo Vocecirc quer diversificar as formas

de traduzir pesquisa para o inglecircs

Use o corpus de divulgaccedilatildeo cientiacutefica

(Revista Pesquisa FAPESP)

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 39: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

CorTrad ndash Pesquisas

E quando ela NAtildeO eacute traduzida

por ldquoresearchrdquo

ldquoresearchrdquo

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 40: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Tarefa 5

Situaccedilatildeo Vocecirc natildeo sabe se numa entrevista eacute

melhor usar o verbo acreditar ou achar

Usar o corpus jornaliacutestico

[lema=ldquoacreditarrdquo] + Distribuiccedilatildeo por gecircnero

de texto

[lema=ldquoacharrdquo] + Distribuiccedilatildeo por gecircnero de

texto

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 41: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Corpus teacutecnico-cientiacutefico Culinaacuteria

Original

(portuguecircs brasileiro)

Primeira versatildeo da traduccedilatildeo

(inglecircs)

Texto revisado

(por falante nativo)

Traduccedilatildeo publicada

(ainda natildeo digitalizada)

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 42: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Quais adveacuterbios em ndashly

ocorrem na traduccedilatildeo

[pos=ldquoRRrdquo amp word=ldquolyrdquo]

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 43: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Tarefa 6

Situaccedilatildeo Vocecirc precisa traduzir uma receita

para o portuguecircs

Descubra como eacute traduzido ldquofinely

choppedrdquo

Haacute outras colocaccedilotildees com ldquofinelyrdquo

Como satildeo traduzidas

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 44: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Colocaccedilotildees na culinaacuteria

Colocaccedilotildees

finely CHOP diced minced shredded

Traduccedilotildees

finely bem + diminutivo

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 45: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Tarefa 7

Situaccedilatildeo como se diz suco de laranja

natural em inglecircs

Haacute outros casos em que ldquonaturalrdquo em

portuguecircs natildeo eacute traduzido por ldquonaturalrdquo

em inglecircs

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 46: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Casos em que ldquonaturalrdquo natildeo eacute vertido como ldquonaturalrdquo

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 47: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Resultado ldquonaturalrdquo ne ldquonaturalrdquo

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 48: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Corpus literaacuterio Contos australianos(corpus de aprendizes)

Original

(inglecircs australiano)

Traduccedilatildeo dos alunos

(portuguecircs brasileiro)

Traduccedilatildeo revisada

(incorporando sugestotildees do

professor)

Traduccedilatildeo publicada

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 49: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Comparando

diversas versotildees

de uma traduccedilatildeo

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 50: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Resultado da busca por ldquohouserdquo no corpus literaacuterio

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 51: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Tarefa 8

Situaccedilatildeo No seu texto aparece ldquothenrdquo com

muita frequecircncia Vocecirc quer evitar repetir

ldquoentatildeordquo na sua traduccedilatildeo

principal then

traduccedilatildeo publicada entatildeo

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 52: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Anotaccedilatildeo semacircntica para

bullcor

bull roupa

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 53: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Quais as ldquoroupasrdquo

que aparecem no corpus de culinaacuteria

[sema=ldquoroupardquo]

distribuiccedilatildeo dos lemas

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 54: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Algo estranho nessa lista

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 55: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Relembrando

A LC eacute uma abordagem empiacuterica

ateacute pode mas natildeo eacute assim que se diz

Estudos baseados em exemplos autecircnticos da

liacutengua em uso corpus

Corpus para a LC

textos autecircnticos

formato eletrocircnico

coletado segundo criteacuterios especiacuteficos

representativo da liacutengua ou variedade linguumliacutestica em

estudo

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 56: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Corpora personalizados

1 Coletar textos relevantes na internet

2 Salvar textos em txt

3 Acrescentar cabeccedilalho com informaccedilotildees pertinentes

4 Nomear os arquivos

5 Organizar arquivos em pastas

6 Explorar com ferramenta computacional AntConc

httpwwwantlabsciwasedaacjpantconc_indexhtml

Tutorial no Comet Artigos etc Minicursos

WordSmith Tools httpwwwlexicallynetwordsmith

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 57: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegt ltfilenamegt

lttitlegt

ltauthorgt

ltnamegtltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtltlanguagegt

ltmodegt[mode of delivery of textual

content]ltmodegt

ltpublishergtltpublishergt

ltpubPlacegt[place of publication]ltpubPlacegt

ltdategtltdategt

ltsourceTextgt

ltHeadergt

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 58: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

CabeccedilalholtHeadergt

lttitlegt

ltfilenamegtJO-IF-FSP-mu-

06out10_01ltfilenamegt

lttitlegt

ltauthorgt

ltnamegt Joseacute da Silvaltnamegt

ltauthorgt

ltsourceTextgt

ltlanguagegtEnglishltlanguagegt

ltmodegtwrittenltmodegt

ltpublishergtInternetltpublishergt

ltpubPlacegthttpwwwfflchuspbrdlmcometco

nsulta_cortechtmlltpubPlacegt

ltdategtOctober 6 2010ltdategt

ltsourceTextgt

ltHeadergt

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 59: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Nomeaccedilatildeo dos arquivos

Manual Laacutecio-Web (wwwnilcicmcuspbrlacioweb)

JO-IF-FSP-mu-06out10_01

Texto divulgado em jornal

Gecircnero textual informativo

Nome do perioacutedico Jornal ldquoFolha de Satildeo Paulordquo

Caderno ldquoMundordquo

Data 6 de outubro de 2010

Primeiro texto (deste caderno nesta data de publicaccedilatildeo)

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 60: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Inserir exemplos do WST para

Goal ndash

Gol contra

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido

Page 61: LINGUÍSTICA DE CORPUS E TRADUÇÃOcomet.fflch.usp.br/sites/comet.fflch.usp.br/files/u30/EBRALC 2010... · Informações sobre a TIPOLOGIA TEXTUAL ... Suplementos Nutricionais

Corpora na Traduccedilatildeo

Vantagens dos corpora

podem ser construiacutedos de acordo com as necessidades do tradutor

podem ser constantemente atualizados

conferem seguranccedila ao tradutor na escolha do termo a empregar

fornecem exemplos autecircnticos de uso

naturalidade para o texto traduzido