Upload
eliayr
View
851
Download
0
Embed Size (px)
Citation preview
El Traductor: El Profesional Completo
El traductor y la traducción automática:
percepciones, usos, tendencias, sinergias
_____________________________________________________________
Hotel Astoria, Valencia (ES), 15 y 16 de octubre de 2011
Elia Yuste
El traductor y la traducción automática: percepciones, usos, tendencias, sinergias
Your Logo
Como traductor/a hoy,¿puedes seguir así?
Entregaré la traducción pasado mañana tras
leérmela y repasar todo manualmente esta noche
y mañana como unas cinco veces más... Muy productivo no es que
sea, pero…
¿Has oído hablar del DATA DELUGE?
¿Estás preparado/a para ello?
Mayo de 2009: 487 billones gigabytes
Otras estimaciones:
• Los datos se incrementan hasta un 50%
cada año (Oracle)
• Duplicidad cada 11 horas (IBM)
Derribemos algunos mitos…¡Vamos allá!
Pensando en este diluvio de datos a traducir,
la Traducción como tarea se puede hacer
imposible de manejar: más requisitos,
volúmenes mayores, ciclos de entrega más
cortos…
La producción de contenidos traducidos de
manera humana (manual) se hace inviable,
sencillamente no basta
Si la automatización se considera
aceptable en otras áreas, ¿por qué no en la
traducción y la comunicación multilingüe?
MITO 1: La Traducción Automática (MT) acabará con el Traductor
¡Falso! En esencia, la MT esuna potente combinación de
varios elementos, comoextractos de memorias de traducción, procesados por
diferentes técnicas avanzadasde lingüística computacional. En cualquier caso, no debería
verse como amenaza sinocomo un aliado que ayuda al
lingüista a alcanzar susobjetivos…
MITO 2: La MT comete errores estúpidos sin lugar a mejora
MITO 2 (cont.): ¿Cómo considera el humano los errores realizados por otro humano / por la máquina?
Error humano
Análisis y adopción de medidas correctivas y preventivas –se piensa que es subsanable y no reproducibleError de la máquina:1. Según lo apercibe el lingüista inexperto en MT; alto nivel
de subjetividad- Gramática poco o nada natural- Basura - Falta de coherencia2. No sólo se debe medir/evaluar con el ojo humano, sino
con métricas automáticas, ej. BLEU3. Los programas más actuales de MT sí son capaces de
aprender del error y de mejorar mucho con los reentrenamientos (en el caso de PangeaMT, automáticos)
MITO 3: La MT nunca podrá superar a la traducción humana
2ª fase: El material post-editado y la
incorporación de datos contribuye a
que los motores se comporten de
manera más predecible / deseable.
Facilidad para crear o acceder a más
motores de MT especializada.
1ª fase: Se crean motores útiles,
1as. experiencias con post-edición (PE)
3ª fase: Procesos más automatizados,
usuario traductor con total control –
interacción; MT ubícua y una ayuda
“natural” que yo mismo mando crear
Pero va a mejorar muchísimo…
Cómo se construye un motor estadístico de MT
Y cómo interviene el/la lingüista
Sobre actualización del motor MT y la visibilidad de su estado
Entrenamiento automático incremental Lista de
Motores en el Panel de control
Profundicemos en nuestro impacto positivo sobre la máquina…
¿Cómo consigo que lo que yo hago como traductor/a influencie positivamente en procesos de traducción automática estadística
donde se manejan millones de palabras?
Aspectos más relevantes de MTque conviene tener en cuenta (1/5)
• Paradigmas
- RBMT / EBMT / SMT / Hybrid MT
Aunque como traductor/a no me encargue de programación, desarrollo,
implementaciones, etc., sino de post-editar el output (texto de salida del
motor), será importante que esté al loro de las tecnologías y novedades en
materia de MT. Por ej., conviene ir analizando qué relación puede haber
entre el paradigma del sistema y el tipo de output que produce ( calidad
de la salida). En caso de duda, preguntaré a mi cliente, agencia, etc.
• Estándares abiertos
XML, TMX, TBX, XLIFF... Implicaciones prácticas
- ¿Interoperabilidad, independencia tecnológica...? ¡Sin efecto
”amarre”!
Si el output a post-editar me viene dado en un formato estándar, soy libre
de elegir el entorno TAO a tal efecto.
Aspectos más relevantes de MTque conviene tener en cuenta (2/5)
• Flujo optimizado
Se propone un flujo basado en MT + Post-Editing (PE)
- El output post-editado se almacena para fines de reentrenamiento
(actualización) de los motores (SMT paradigm)
Un flujo de producción multilingüe basado solo en TM, sin MT, puede
quedarse obsoleto y resultar insuficiente en muchas ocasiones...
• Post-Edición (PE)
¿En qué consiste, qué niveles hay? ¿Dónde aprendo? ¿Cómo puedo
juzgar el output del motor? ¿En qué entorno llevo a cabo esta tarea?
¿Qué volumen de producción / velocidad puedo alcanzar?...
- El nuevo modelo de trabajo – ¡vale la pena adoptarlo!
”Tienes que ser analítico y sistemático...”
”No tengo que teclear tanto como antes...”
Aspectos más relevantes de MTque conviene tener en cuenta (3/5)
• Calidad de la traducción (automática)
• Difícil de definir y cuantificar – la subjetividad puede jugar en contra
• Los niveles de aceptabilidad han variado concepto de good enough,
bastante por debajo de la perfección, pero aceptable.
Implicaciones para la MT
- tolerancia más destacada por parte de los consumidores de MT
- la velocidad de entregas simultáneas (simship) multilingües la hace
absolutamente necesaria
- cuando prima la necesidad del acceso a la información en idiomas
desconocidos
- PE – una destreza y una profesión valoradas y necesarias cuando
se debe llegar a una calidad de publicación
Correlación entre el tipo de contenido, la calidad de la traducción y el nivel de PE requerido
Ej. Ej. UGC / CGU
Ej. informe interno
Ej. catálogo de producto
Calidad “good-enough” – PE ligera
Calidad de publicación – PE total
Calidad “gisting” , solo para entender de qué va - PE no requerida
Aspectos más relevantes de MTque conviene tener en cuenta (4/5)
• Productividad
La ventaja mayor de utilizar MT para los traductores freelance!
- ¡Adáptate a la actividad así como al tipo de output que suelas
recibir!
Hábito gradual, progresivo
Algo que verdaderamente puedes llegar a dominar
Estudios de productividad (realizados tanto internamente en
Pangeanic como por parte de sus clientes) confirman un aumento de
productividad del 30% al 70%
Algo que vale la pena que tanto las agencias como los
traductores adoptemos, no para responder a otra obligación o
carga más sino para hacernos más de valer y ser
competitivos en el mercado
Aspectos más relevantes de MTque conviene tener en cuenta (5/5)
• Feedback
Algunos proveedores de MT, como PangeaMT de Pangeanic, pueden
solicitar a los traductores autónomos feedback.
Los creadores de motores de MT (desarrolladores) aprecian en gran
medida el feedback lingüístico que pueda llegar desde diferentes tipos de
usuarios y consumidores de MT.
En un entorno SMT (MT estadística), el output post-editado es un tesoro para
el próximo reentrenamiento del motor. Lo ideal es que los traductores
autónomos que realizan PE, puedan reportar su feedback, a nivel lingüístico, de
productividad, usabilidad/funcionalidad, etc. Al jefe de proyecto o responsable
del desarrollo personalizado de MT en el que prestemos asistencia.
Se prestará atención a errores notables, especialmente si conforman un
patrón
Se debería mantener un registro de productividad (ej. nº pal./día)
Motores por dominios y totalmente personalizados para cada cliente / escenario de uso¡Pretendemos dirigirnos a todos los segmentos de usuarios posibles!
• Democratización y enfoque a diferentes segmentos de usuario MT
En la trayectoria de Pangeanic, han destacado los desarrollos para
clientes corporativos y agencias (LSPs)
Sin embargo, PangeaMT también va dirigido a nuestro equipo de post-
editores validados así como a los lingüistas autónomos, sin conexión
previa con Pangeanic, que pueden convertirse en clientes de PangeaMT.
Integración en entornos de producción multilingüe enriquecimiento
de herramientas CAT/TAO con tu propio sistema MT de un campo de
especialización con tus propios datos y a tu medida
Integración en sitios web y aplicaciones para grupos, asociaciones y
redes virtuales de traductores
PangeaMT¿Por qué debería interesarme por una solución MT
como ésta?
Contribuye a demostrar tu grado de especialización en un campo o dominio,
ayudándote a llegar a clientes y agencias a los que te sería difícil acceder de otro
modo
Professional empowerment
Un sistema que va más allá de un diccionario en línea o de una
aplicación abierta en web, generalista y ajena a tus necesidades.
Colabora con compañeros de tu campo de especialización para
recopilar memorias que puedan servir para un desarrollo, compartido
pero controlado, totalmente personalizado y de uso exclusivo para
vosotros.
Produce mucho más sin estresarte y posiciónate con tus clientes
(existentes y potenciales) como un proveedor de servicios lingüísticos
con la tecnología adecuada para brillar por encima de otros.
Typical Translation Workflow
Ask
PangeaMT for
TMX machine-
translation
TERMINOLOGY TOOLS
TM
Processed texts
to KB, TM,
documentation
ES
FR
IT
ORIGINAL
EN
TMX export
(95%, 89%,
etc)
ttx/itd/ XLIFF
Re-merge originals &
Post-Edit (preferred
environment, e.g. Tag
Editor, any 2-column
bilingual editor or
XML editor)
PangeaMT: ¿Dónde encaja?
RecapitulandoTengamos claro que…
• MT es una tecnología más de ayuda a los traductores, que no tiene por objeto
reemplazarles sino hacerles más productivos y posicionarles mejor
No existe una gran curva de aprendizaje
Los post-editores realizan una interacción sencilla y mínima con el sistema,
pero su feedback (a varios niveles) es muy valioso
- Resumen de ventajas
Ampliar mi oferta de servicios lingüísticos
Como parte de mi política de satisfacción y retención de clientes
Producir más en menos tiempo – ¡no me preocupan las tarifas más que
ajustadas!- Beneficios concretos de PangeaMT frente a G-Translate
Consolidación de especialización en uno o varios campos
No es un diccionario estático, sino una solución MT auténtica, desarrollada
a partir de datos específicos de dominio y clientes donde mi input si juega
un papel importante
Y si Popeye tomaba espinacas…Piensa en encargarnos tu motor personalizado
PangeaMT… and empower yourself!
Productividad
Confidencialidad de datos
Diferenciador de servicios