www.tauyou.com
[email protected]
Enjoy the world!
Communication is not a problem anymore
© 2009 Ta with you
Conferencia ProZ
Octubre 2009
Human quality machine translation solutions
Introducción
¿De dónde vengo?
¿Dónde estoy?
¿Adónde voy?
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
2
¿Para qué traducción automática?
Usuario final
Información web
Cliente corporativo
Documentación corporativa interna
Traductores
Herramienta de productividad (?)
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
3
Provocación
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
4
Pregunta
¿Cuántos quieren a la traducción automática?
¿Cuántos la odian?
Otras respuestas ...
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
5
Objetivos de la charla
Dar una perspectiva histórica de la TA
Explicar brevemente los sistemas más habituales
Generar discusión / ideas para mejorar
... aprender todos de todos ...
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
6
El problema esencial
Comprender el texto
(a veces también por causa del creador)
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
7
Con modestia
La traducción automática es complicada
Las máquinas no son personas
No es lucha persona contra máquina
Ayudarse y avanzar
Escuchemos a ...
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
8
Los inicios
Años 30: primeras patentes sistemas de reglas
1949: Informe de Warren Weaver
Años 50: Experimento Georgetown – IBM
Traducción 60 frases Ruso – Inglés
6 reglas + 250 unidades en vocabulario
En 5 años, problema resuelto ...
Reglas manuales + diccionarios bilingües
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
9
La realidad
Sistemas instalados
Objetivo: rapidez
Mejoras basadas en Chomsky
Lingüística generativa
Gramática transformacional
Pero las conclusiones es que nunca sería posible
Por la ambigüedad
Lo que lleva al ALPAC ...
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
10
Los años 60
Automatic Lang. Processing Advisory Committee
Creado en 1964, liderado por John R. Pierce
Informe en 1966
Conclusión básica
Investigar más en lingüística computacional
Dominios e idiomas limitados – herramientas
Consecuencia
Reducción de la inversión en TA
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
11
Un pequeño lapso
¡De sólo 10 años!
Con alguna excepción
1968: Systran para los EEUU y la UE
1970: Logos
1977: Méteo en Canada
Sistemas low cost
Para documentos técnicos y comerciales
Interlingua y transferencia
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
12
Finales de los 80 / principios de los 90
3 sistemas principales: Systran, Logos, Metal
Interés renovado por 3 motivos principales
Aumento de la capacidad computacional
Reducción del coste de hardware y software
Aparición de los modelos estadísticos (IBM)
Métodos basados en ejemplos
Principalmente en Japón
Proyecto de S2S: Verbmobil
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
13
Detalle proyecto Verbmobil
Traducción voz a voz en dominios controlados
8 años de investigación – década de los 90
86 millones de Euros invertidos
31 partners
Varias spin-offs lanzadas – casos de éxito
... pero Mariño os explicará más
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
14
¿Qué está pasando en 2009?
Plena efervescencia de sistemas
Reglas
Basados en ejemplos
Estadísticos
Basados en contexto
Alternativas: crowdsourcing
Importantes compañías involucradas
IBM, SAP, Google, Microsoft ...
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
15
Detalle de sistemas
Directa
Transferencia
Interlingua
Basados en ejemplos
En contexto
Estadísticos
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
16
Pregunta
¿Cuál es el objetivo de la traducción?
¿Cuál es el objetivo de la traducción automática?
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
17
El proceso es sencillo ...
Elegir las palabras adecuadas
Ordenarlas correctamente
Problemas
Gramática/sintaxis
Traducción literal
Terminología / palabras desconocidas
Adiciones / omisiones
Ortografía / puntuación / may. / min.
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
18
Traducción directa
De origen a destino
Mediante diccionarios y gramáticas
Proceso
Traducción palabra a palabra
Reglas de reordenación
Conclusión
Frases sin sentido
Puede ser útil en lenguaje controlado
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
19
Por transferencia (I)
Análisis morfológico
Categorización léxica
Transferencia léxica = traducción
Transferencia estructural
Generación morfológica
Exactitud cercana al 90% o superior ...
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
20
Por transferencia (II)
Fuente: Linguatec
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
21
Sistema basado en interlingua (I)
Análisis de los idiomas
Se crea una entidad común abstracta
Idioma pivote
A partir de ella, se genera la salida
Ventaja: No reglas uno a uno
Inconveniente: Creación interlingua (semántica)
DLT en Utrecht, Fujitsu ..
Antes METAL, Stanford ...
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
22
Sistema basado en interlingua (II)
Diccionarios, léxicos, reglas, gramáticas, ...
Sólo para lenguaje controlado o muy complicado
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
23
Traducción basada en ejemplos
Objetivo: obtener la traducción en base a previas
P.ej. memorias de traducción
Nació a mediados de los 80 en Japón
La clave
Combinación de segmentos
Técnicas optimizadas
Uso de patrones - reglas
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
24
Traducción basada en el contexto
Fuente: Meaningful Machines
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
25
Traducción estadística
Modelo más realista
Fuente: POSTECH, Intelligent Software Lab.
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
26
Más sobre la SMT
Ventajas
Rapidez de desarrollo de idiomas y dominios
Superioridad en aplicaciones acotadas
Alto volumen de texto multilingüe disponible
No necesita intervención lingüística
Inconvenientes
Metodología estadística
Cómo particularizar
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
27
Comparativa de métodos
Transferencia
Interlingua
EBMT
diccionarios
X
X
X
reglas de
transferencia
X
parser
X
X
X
analizador
semántico
X
datos
paralelos
otros
© 2009 Ta with you
SMT
X
representación
universal
Conferencia ProZ, Octubre 2009
X
tesaurus
28
¿Qué hacen bien las máquinas?
Ayudar al traductor
Corrección en dominios limitados
Amplitud de textos traducidos
Velocidad de traducción
Aprendizaje continuo
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
29
Pregunta
Dudas
Preguntas
Comentarios
¿Es útil combinar tecnología y lenguaje?
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
30
Y el futuro ...
Traducción clásica
Traducción automática
Traducción automática + postedición
Crowdsourcing
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
31
Retos de la traducción automática
Disponibilidad de corpus – lenguas minoritarias
Combinación sistemas estadísticos y por reglas
Unir de forma eficiente traductor y máquina
Evaluación de la calidad
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
32
Conclusiones
La TA es una herramienta útil para los traductores
Incremento productividad
Disminución costes y tiempos de entrega
También tiene inconvenientes
No sirve para todo
El futuro es híbrido y amplio
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
33
Crisis ... ¡pues innovemos!
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
34
¡ Gracias !
Diego Bartolomé, PhD
Director Ejecutivo, Ta with you
C/Ferrer de Blanes 25
08203 Sabadell
Tel.
+34 937 11 29 96
Móvil +34 670 33 12 25
[email protected]
© 2009 Ta with you
Conferencia ProZ, Octubre 2009
35
Descargar

Ta with you Presentation