Joseba Abaitua
Facultad de Filosofía y Letras
Universidad de Deusto
Nuevas tendencias en
Traducción Automática
Preliminares
Limitaciones de la tecnología
Condiciones (ámbitos)
Salidas profesionales
Modos y medios
Grupo DELi (UD)
Herramientas y recursos
Documentación
2
1 Preliminares
 ¿”nuevas”
tendencias?
 ¿traducción “automática”?
– creatividad del lenguaje
– capacidad de mecanización
– condiciones de éxito
Nuevas tendencias en Traducción Automática
3
Preliminares (I)
 ¿”nuevas”
tendencias?
 ¿traducción
“automática”?
Nuevas tendencias en Traducción Automática
4
Preliminares: 5 décadas
1ª) 1949 (W. Weaver)
 2ª) 1956 I Conferencia Internacional de la

Traducción Automática (FAHQT)

3ª) 1966 Informe ALPAC (Automatic Language
Processing Advisory Committee) del National
Research Council

4ª) 1976 la CE adquiere SYSTRAN y promueve
EUROTRA

5ª) 1991, Informe Danzin: fin de EUROTRA.
MT > CAT
Nuevas tendencias en Traducción Automática
5
¿Novedades recientes?









Abandono de FAHQT
RBMT vs. ABMT
Recursos compartidos
Empirismo (corpora)
Hibridación (integración)
Lenguajes de etiquetado (SGML/XML)
Delimitación de ámbitos (dominios…)
Texto electrónico, localización
INTERNET
Nuevas tendencias en Traducción Automática
6
Preliminares (II)
 ¿”nuevas”
tendencias?
 ¿traducción “automática”?
– ¿totalmente automática?
– complejidad del lenguaje / traducción
– ¿es posible mecanizar / automatizar?
– condiciones de éxito
Nuevas tendencias en Traducción Automática
7
Traducción humana vs. mecánica
Twinkle, twinkle, little bat
how I wonder what you're at!
Up above the world you fly
like a tea-tray in the sky.
Lewis Carroll
Brilla, luce, ratita alada
¿en qué estás tan atareada?
Por encima del universo vuelas
como una bandeja de teteras.
tr. de Jaime de Ojeda
Nuevas tendencias en Traducción Automática
8
Excelencia humana

Manuel Breva (1996)
The above lines are a parody of the famous poem "Twinkle,
twinkle, little star" by Jane Taylor, which, in Carroll's version,
turns into a sarcastic attack against Bartholomew Price, a
professor of mathematics, nicknamed "The Bat". Jaime de
Ojeda translates "bat" as "ratita alada" for rhythmical reasons.
"Murciélago", the Spanish equivalent of "bat", would be hard to
fit in this context for the same poetic reasons. With Ojeda's
choice of words the Spanish version preserves the meaning and
maintains the same rhyming pattern (AABB) as in the original
English verse-lines.
Nuevas tendencias en Traducción Automática
9
Nuevas tendencias en Traducción Automática
10
Nuevas tendencias en Traducción Automática
11
Traducción humana vs. mecánica
Twinkle, twinkle, little bat
how I wonder what you're at!
Up above the world you fly
like a tea-tray in the sky.
Lewis Carroll
Centelleo, centelleo, pequeño
palo, ¡cómo me pregunto en cuál
usted está! Encima sobre del
mundo usted vuela como una tébandeja en el cielo.
tr. de SYSTRAN
Nuevas tendencias en Traducción Automática
12
Traducción humana vs. mecánica
Brilla, luce, ratita alada
¿en qué estás tan atareada?
Por encima del universo vuelas
como una bandeja de teteras.
tr. de Jaime de Ojeda
Centelleo, centelleo, pequeño
palo, ¡cómo me pregunto en cuál
usted está! Encima sobre del
mundo usted vuela como una tébandeja en el cielo.
tr. de SYSTRAN
Nuevas tendencias en Traducción Automática
13
Preliminares (III)
 ¿traducción
“automática”?
– creatividad del lenguaje
– mecanización / automatización
– condiciones de éxito
• ámbitos adversos
• ámbitos óptimos
Nuevas tendencias en Traducción Automática
14
Creatividad del lenguaje
– “To make a free sonnet comparable to a chess
game, how many words do we need?
– 100 words offer far more different combinations
than there are ways of playing a chess game”
(DELi)
(Free sonnets: any combination of 6 words in 14
verses)
Nuevas tendencias en Traducción Automática
15
Complejidad del lenguaje


nº de partículas
subatómicas de
toda la materia del
universo: 1080
nº de partidas de
ajedrez distintas:
10120
Jorge Wagensberg
(1998)

nº de sonetos libres
con 100 palabras
(sin que se repitan):
4 x10145
maneras distintas de
ordenar 84 palabras (seis
palabras por cada 14
versos) de un total de 100
DELi (ejemplo)
Nuevas tendencias en Traducción Automática
16
Complejidad de la traducción

Douglas Hofstadter (1998)
“A skilled literary translator makes a far larger
number of changes, and far more significant
changes, than any virtuoso performer of classical
music would ever dare to make in playing notes in
the score of, say, a Beethoven piano sonata. In
literary translation, it's totally humdrum stuff for
new ideas to be interpreted, old ideas to be
deleted, structures to be inverted, twisted around,
and on and on.”
Nuevas tendencias en Traducción Automática
17
Complejidad de la traducción

Martin Kay (1992)
“There is nothing that a person could know, or feel, or
dream, that could not be crucial for getting a good
translation of some text or other. To be a translator,
therefore, one cannot just have some parts of
humanity; one must be a complete human being.”
Nuevas tendencias en Traducción Automática
18
Preliminares (y IV)
 ¿traducción
“automática”?
– creatividad del lenguaje
– mecanización / automatización
– condiciones de éxito
• ámbitos adversos
• ámbitos óptimos
Nuevas tendencias en Traducción Automática
19
Posibilidades de mecanización

Martin Kay (1980/97)
"No es adecuado encomendar al ordenador que
mecanice lo que no es mecánico, o algo cuya
subestructura mecánica no ha sido revelada para
la ciencia. En otras palabras, el ordenador se usa
inadecuadamente cuando intentamos que haga algo que
nosotros mismos no comprendemos. La historia
no puede ofrecer un ejemplo mejor de uso
inapropiado del ordenador que la traducción
automática.”
Nuevas tendencias en Traducción Automática
20
Posibilidades de mecanización

Martin Kay (1980/97)
"La traducción, aun siendo un arte delicada y
precisa, conlleva muchas tareas que son
mecánicas y rutinarias. Si estas tareas fueran
encomendadas a una máquina, la productividad
del traductor no sólo se vería magnificada, sino
que su trabajo se haría más gratificante, más
apasionante, más humano."
Nuevas tendencias en Traducción Automática
21
2 Condiciones (ámbitos)
 ¿traducción
“automática”?
– creatividad del lenguaje
– mecanización / automatización
– condiciones de éxito
• ámbitos adversos
• ámbitos óptimos
Nuevas tendencias en Traducción Automática
22
Condiciones de éxito

Adversas
– lenguaje creativo, espontáneo,
imprevisible: habla coloquial, producción
poética, narrativa, ensayo, publicidad, humor
Nuevas tendencias en Traducción Automática
23
Condiciones de éxito

Adversas
– lenguaje creativo, espontáneo,
imprevisible: habla coloquial, producción
poética, narrativa, ensayo, publicidad, humor

Óptimas
– lenguaje controlado, repetitivo, canónico:
manuales técnicos, partes, informes, textos
jurídicos, fórmulas
Nuevas tendencias en Traducción Automática
24
Análisis de las condiciones

Clasificación de textos (Biber y Finegan,
1986; Nakamura, 1991) por:
– Género, función pragmática: novela, artículo
periodístico, ensayo (factores extralingüísitcos)
– Tipo, propiedades lingüísticas: longitud de
oraciones, utilización de perífrasis verbales,
densidad léxica, uso de conectores, etc.
Nuevas tendencias en Traducción Automática
25
Análisis de las condiciones

Propiedades lingüísticas (Melby 1995)
– Lengua común: granularidad fina “el texto está
compuesto por partículas que se mezclan y
cohesionan como el adobe o el yeso”
– Lenguajes de especialidad (sublenguajes):
granuralidad gruesa “el texto se configura por
medio de unidades discretas, al modo de ladrillos
o bloques prefabricados”
Nuevas tendencias en Traducción Automática
26
Condiciones favorables

Evaluación de TA (cf. Margaret King, Karen
Spark-Jones, K. Falkedal, etc.): “mejores
resultados con sublenguajes”

ISO 9126 adecuación del sistema a la
aplicación para la que se ha diseñado

TAUM-Météo (para partes metereológicos), SPANAM
(de la Organización Panamericana de la Salud), o
TITUS (de la industria textil francesa)
Nuevas tendencias en Traducción Automática
27
Cobertura vs. calidad
calidad
CAT
perfecta
ready-to-use
comprensible
indicativa
M
T
cobertura
Nuevas tendencias en Traducción Automática
28
3 Modos y medios

Oral
– intérpretes

Escrito
– traductores (agencias, editoriales)

Electrónico
– empresas de localización (de software)
Nuevas tendencias en Traducción Automática
29
Modos y medios

Oralidad
• primaria (infancia, analfabetos, culturas orales)
• secundaria (discursos, medio audiovisual)
Walter S. Ong S.J (1992)

Escritura
• primaria (escribas, copistas)
• secundaria (imprenta)

Hipermedios
• TeX, HTML, SGML/XML, PDF, PPT, FLASH,
QUICKTIME, WAV, MP3
Nuevas tendencias en Traducción Automática
30
El ordenador según los medios

Oral
– intérpretes

Escrito
– traductores (agencias, editoriales)

Electrónico
– empresas de localización (de
software)
Nuevas tendencias en Traducción Automática
UJI, noviembre 2000
ej. industria aeronáutica
Airbus Industrie
Headquarters
Toulouse
Nuevas tendencias en Traducción Automática
UJI, noviembre 2000
Aircraft Technical Documentation
450.000
Cassettes
115.000.000
Pages
One AMM :
46.000 Pages
360 MB
265.000
Shipping Notes
4501994 Volume
Tons
Nuevas tendencias en Traducción Automática
UJI, noviembre 2000
Aircraft Technical Documentation
450.000
Cassettes
115.000.000
Pages
265.000
Shipping Notes
Digitalización del texto
Nuevas tendencias en Traducción Automática
34
El ordenador según los medios

Oral
– intérpretes

Escrito
– traductores (agencias, editoriales)

Electrónico
– empresas de localización (de
software)
Nuevas tendencias en Traducción Automática
35
El auge de la localización

Grán demanda
• Microsoft, Oracle, Adobe, Quark, Thomas Publishing
International, Bertelsman, Aerospatiale...

Proliferación de empresas
• Nua Ltd., EnCompas Globalization, Flanders, Vertaalbureau
Bothof , Intertrans, Bowne Global Solutions, LionBridg, Language
Management International, International Language Engineering, Techno-Graphics &
Translations, +

Escasez de profesionales
 LISA (the Localization Industry Standards Association)
Nuevas tendencias en Traducción Automática
36
El auge de la localización

Santi van der Kruk (General Manager of LionBridge)
“The profile we look for in translators is an excellent
knowledge of computer technology and superb
linguistic ability in both the source and target languages.
They must know how to use the leading CAT
[computer assisted translation] tools and applications
and be flexible. The information technology and
localization industries are evolving very rapidly and
translators need to move with them.”
Nuevas tendencias en Traducción Automática
37
El auge de la localización

Vand der Meer (president of AlpNet):
“Software translators had to understand
programming code, they had to work under
tremendous time pressure and be flexible about
product changes and updates. Originally there was
only a select group--the localizers--who knew how to
respond to the needs of the software industry. From these
beginnings, pure localization companies emerged focusing
on testing, engineering, and project management.”
Nuevas tendencias en Traducción Automática
38
El auge de la localización

the localization industry complains of labor shortage

objectives of LISA & LEIT (LISA Education Initiative
Taskforce):
– to survey courseware and training programmes for localizers
– to query the market to determine the needs and job profiles
– to stimulate more formal education in skills beneficial to localizers
University of Geneva (Switzerland), Brigham Young University (Utah),
Kent State University (Ohio), University of Cologne (Germany), City
College of Dublin (Ireland), Monterey Institute of International
Studies (California), and National Software Center in Bombay
(India).
Nuevas tendencias en Traducción Automática
39
4 Herramientas y recursos

Herramientas
– Integración de sistemas
• translator workstations (ej. EURAMIS)
• localization packages (ej. AIRBUS)

Recursos
– corpora
– segmentadores
– alineadores
Nuevas tendencias en Traducción Automática
40
4.1 Herramientas: System integration

Old conception of a monolithic compact
translation engine

Integration of systems
– Trados “will provide enterprise-wide applications
for multilingual information creation and
dissemination, integrating logistical and languageengineering applications"
Nuevas tendencias en Traducción Automática
41
Herramientas: System integration
– Logos ”an integrated technology-based
translation package, which will combine term
management, TM, MT and related tools to create
a seamless full service localization environment."

Others: Corel, Star, IBM, Atril, Multicorpora

Eurolang's Optimizer

EURAMIS (European Advanced Multilingual
Information Systems)
Nuevas tendencias en Traducción Automática
42
ej. EURAMIS
Integración de sistemas
Entorno de autor
Editores
Adobe
M
T
LANTmaster
CAT
memorias
de traduccion
ECCO toolkit
CL Tools
STEP server
Bases de datos
CELEX
TermBase
Nuevas tendencias en Traducción Automática
43
Herramientas: The ideal workstation

Language International 10.6
– Muriel Vasconcellos (Pan American Health
Organization)
– Minako O'Hagan (author of The Coming Age of
Teletranslations)
– Eduard Hovy (President of the Association of Machine
Translation in the Americas)
Nuevas tendencias en Traducción Automática
44
Herramientas: The ideal workstation

full integration in working environment (operating system,
the document editor (hypertext authoring, desktop publisher or the
standard word-processor), as well as the emailer or the Web browser.

with linguistic tools: from spell, grammar and style checkers to
on-line dictionaries, and glossaries, including terminology management,
annotated corpora, concordances, collated texts, etc.

all advances in MT & TM (CAT), be able to perform batch
extraction and reuse of validated translations, enable searches into TM
databases by various keywords (such as phrases, authors, or issuing
institutions). These TM databases could be distributed and accessible through
Internet. There is a new standard for TM exchange (TMX) that would permit
translators and companies to work remotely and share memories in real-time.
Nuevas tendencias en Traducción Automática
45
Herramientas: The ideal workstation
Integración de sistemas
Entorno de autor
Editores
Adobe
M
T
LANTmaster
CAT
memorias
de traduccion
ECCO toolkit
CL Tools
STEP server
Bases de datos
CELEX
TermBase
Nuevas tendencias en Traducción Automática
46
Herramientas: The ideal workstation

Muriel Vasconcellos (1/3):
 Good view of the source text extensive enough to
offer the overall context, including the previous
sentence and two or three sentences after the current
one.
 Relevant on-line topical word lists, glossaries and
thesaurus. These should be immediately accessible
and, in the case of topical lists, there should be an
optimal switch that shows, possibly in color, when
there are subject-specific entries available.
Nuevas tendencias en Traducción Automática
47
Herramientas: The ideal workstation

Muriel Vasconcellos (2/3):
 Three target-text windows. The first would be the
main working area, and it would start by providing a
sentence from the original document (or a machine
pre-translation), which could be over-struck or quickly
deleted to allow the translator to work from scratch.
The original text or pre-translation could be switched
off. Characters of any language and other symbols
should be easy to produce.
 Drag-and-drop is essential and editing macros are
extremely helpful when overstriking or translating
from scratch.
Nuevas tendencias en Traducción Automática
48
Herramientas: The ideal workstation

Muriel Vasconcellos (y 3/3):
 The second window would offer translation memory
when it is available. The TM should be capable of
fuzzy matching with a very large database, with the
ability to include the organization's past texts if they
are in some sort of electronic form.
 The third window would provide a raw machine
translation which should be easy to paste into the
target document.
 The grammar checker can be tailored so that it is not
so sensitive. It would be ideal if one could write one's
own grammar rules.
Nuevas tendencias en Traducción Automática
49
Herramientas: The ideal workstation

Eduard Hovy "We need:
– a genre topology, a tree of more or less related types
of text, and ways of recognizing and treating the different
types computationally.
– a restless lexicon builder that crawls all over the
Web every night, ceaselessly collecting words, names, and
phrases, and putting them into the appropriate lexicons."
Nuevas tendencias en Traducción Automática
50
Herramientas: Localization software
– Software engineering techniques applied to
document production
– National and international standards of various
types is also significant:
• text and character coding standards (e.g. SGML/XML
and Unicode
• translation quality control standards (e.g. DIN 2345 in
Germany, or UNI 10574 in Italy).
Nuevas tendencias en Traducción Automática
51
Herramientas: Localization packages

assist throughout the whole life cycle of a
multilingual document

job setup, authoring, translation preparation,
translation, validation, and publishing

ensuring consistency and quality in source and target
language variants

monitor different versions, variants and languages,
and author customer specific solutions
Nuevas tendencias en Traducción Automática
52
Herramientas: Localization packages
An average localization package consists of
• an industry standard SGML/XML editor (e.g.
ArborText)
• a translation and terminology toolkit (Trados
Translator's Workbench)
• and a publishing engine (e.g. Adobe's
FrameMaker+SGML
Nuevas tendencias en Traducción Automática
53
ej. AIRBUS
controlled
language
checker
Workflow
manager
STEP
Product
database
SGML
structured
documentation
(editor & DB)
terminology
tool
(User access)
Nuevas tendencias en Traducción Automática
54
Sistemas SGML
Airbus needs

no voluminous
documents

facilities for publishing

no use of SGML
database
Chosen tools
FrameMaker+SGM
Adobe
L
VAULT
Nuevas tendencias en Traducción Automática
55
Herramientas lingüísticas
Airbus needs

no translation need
 controlled language in
English
 AECMA SE compliant
 addition of specific
rules/TID
 SGML context
Chosen tools
LANTmaster
+ coding tool
AIB reference
language (User
access to the
terminology)
Nuevas tendencias en Traducción Automática
56
Integración de herramientas
Optegra Workflow
Authoring environment
FrameMaker
5+SGML
CL tool
LANTmaster
Adobe
Airbus
Reference
Language
ECCO toolkit
SGML converter
STEP server
Database(s)
ObjectStore
Optegra
VAULT
Nuevas tendencias en Traducción Automática
57
Arquitectura
DOCUMENT DB
SGML Converter
ObjectStore
STEP
server
Query System
SGML
File
VAULT OPTEGRA
STEP
requests
consistency
links
Navigator System
DATA
INPUTS
AUTHORING SYSTEM
FrameMaker
5+SGML Adobe
Airbus Ref. lang.
CL
checker
AECMA
rules
corpus
Nuevas tendencias en Traducción Automática
58
4.2 Recursos
Corpora: ejemplos de traducciones
 Buscadores: reconocen y compilan ejemplos
 Extractores: excogen los más relevantes
 Segmentadores: añaden etiquetas

descriptivas
Alineadores: emparejan las traducciones
 Alimentadores: actualizan datos del sistema

Nuevas tendencias en Traducción Automática
59
Recursos
Corpora: ejemplos de traducciones
 Buscadores: reconocen y compilan ejemplos
 Extractores: excogen los más relevantes
 Segmentadores: añaden etiquetas

descriptivas
Alineadores: emparejan las traducciones
 Alimentadores: actualizan datos del sistema

Nuevas tendencias en Traducción Automática
60
Recursos: corpora

Corpora en distintos idiomas:
Multilingual Corpus de la European Corpus Initiative
(D. McKelvie y H.S. Thompson, 1994)

Corpora comparables: Corpus Aarhus,
compuesto por textos de derecho contractual en
danés, francés e inglés

Corpora paralelos: Hansard Corpus, que son
actas del parlamento canadiense publicadas en
francés e inglés, BOB/LEGEBiDUNA.
Nuevas tendencias en Traducción Automática
61
Corpus BOB/LEGEBiDUNA
F oru A gin d u a
O rd en F oral
F o ru A g in du a, 76 7 /19 9 4 zk ., urriaren
2 4 k o . A ip atu tak o F o ru A g in d u aren
b id ez h urreng o h au x ed atu d a:
L u rzo ru b atzuk d en tsitate tx ik ik o
lu rzo ru u rb an izag ai g isa b irsailk atzek o
Z allak o U d alerriko P lan eam en du ari
b u ru zk o S o ro sp id ezk o A rau en
ald arazp en a u k atzea.
E rab ak i ho n en au rk a, h aren
jak in arazp en etik zen b atu b eh arrek o
h ilab ete b ik o ep earen b arru an ,
ad m in istrazio zk o lisk arrau zierrek u rtso a jarri ah al izang o d a, E u sk al
H errik o Ju stizia A u ziteg i N ag u sik o
A d m in istrazio zk o L isk arrau zietarak o
S alan , k o m en iesten d iren b este
d efen tsab id eak erab il d aitezk eelako
k alterik g ab e. A d ierazi d en ep earen
b arru an , B H I-0 15 /9 4 -P 05 -A
esp ed ien tea B ilb aok o G ran V ía, 1 92 1 ek o 5 g n. so lairu an eg o ng o da
ag erik o , azter d ad in . B ilbo n , 1 9 94 .ek o
u rriaren 2 4 an.-H irig in tzako fo ru
d ip u tatu a. P ed ro H ern án d ez G on zález.
O rd en F o ral nú m ero 7 67 /1 99 4 d e 2 4
o ctu b re. M ed ian te la O rd en F o ral d e
referen cia se h a d isp u esto lo sig u ien te:
D en eg ar la M o d ificació n d e las N o rm as
S u b sid iarias d e P lan eam ien to d el m u n icip io
d e Z alla p ara la reclasificació n d e un o s
terren o s co m o S u elo A p to p ara U rb an izar
d e B aja D en sid ad .
C o n tra d ich a O rd en F o ral p o d rá
in terp o n erse, en el p lazo d e do s m eses
d esd e su n o tificació n, recurso co n ten cio so ad m in istrativ o an te la S ala d e lo
C o n ten cio so-A d m in istrativ o d el T rib un al
S u p erio r d e Ju sticia d el P aís V asco , sin
p erju icio d e la u tilizació n d e o tro s m ed io s
d e d efen sa q u e estim e co nv en ien te. D uran te
el referid o p lazo el ex p ed ien te B H I-01 5 /94 P 0 5 -A , q u ed ará d e m an ifiesto p ara su
ex am en en las d ep en d en cias situ ad as en
B ilb ao calle A lam ed a R ek ald e, 3 0 , 5 .a y 6 .a
p lan tas. B ilb ao , 2 4 d e o ctub re d e 1 9 94 .-E l
D ip u tad o F o ral d e U rb an ism o.- P ed ro
H ern án d ez G on zález.
T a b la 4 . M u estra d el co rp u s p aralelo L E G E B ID U N /B O B
Nuevas tendencias en Traducción Automática
62
Recursos: segmentadores

Anotaciones con información
extralingüísitca: género, tipo, status, función,
procedencia, fecha, autor, editor, etc. <HEADER>

Anotaciones ortotipográficas: ASCII,
JUNET, ISOLatin, Unicode

Anotaciones lingüísticas
Nuevas tendencias en Traducción Automática
63
Ejemplo de <HEADER>
<B CEPRIV1> Short descriptive code <Q E1 XX CORP
EBUEAM> Text identifier <N LET TO HUSBAND> Name of
text <A BEAUMONT ELIZABETH> Author's name <C E1> Subperiod <O 1500-1570> Date of original <M X> Date of
manuscript <K X> Contemporaneity of original and
manuscript <D ENGLISH> Dialect <V PROSE> Verse or
prose <T LET PRIV> Text type <G X> Relationship to
foreign original <F X> Language of foreign original
<W WRITTEN> Relationship to spoken language <X
FEMALE> Sex of author <Y X> Age of author <H HIGH>
Author's social status <U X> Audience description <E
INT UP> Participant relationship <J INTERACTIVE>
Interactive/non-interactive <I INFORMAL>
Formal/informal <Z X> Prototypical text category <S
SAMPLE X> Sample
Nuevas tendencias en Traducción Automática
64
ASCII vs. Unicode
Nuevas tendencias en Traducción Automática
65
Anotaciones lingüísticas


Anotaciones estructurales: epígrafes, párrafos, etc.
Anotaciones morfosintácticas: categoría
morfosintáctica (POS), género, número, persona, caso, tiempo,
etc.

Lematización: formas flexionadas con lexemas

Análisis sintáctico: sintagmas intraoracionales (grupos
verbales y nominales, cláusulas subordinadas, etc.)

Anotaciones orientadas a la tarea: unidades de
traducción,etiquetado de referencia (numeración, citas, etc.).
Nuevas tendencias en Traducción Automática
66
Etiquetador POS con lematización
form a flexiva
que
agota
la
vía
adm inistrativa
podrá
interponerse
recurso
contencioso
ante
lexem a
que
agotar
la
vía
adm inistrativo
poder
interponer
recurso
contencioso
ante
etiq u eta P O S
P R 3C N 00
V M IP 3S 0
TFFS0
N C F S 00
A Q 0F S 00
V M IF 3S 0
V M N 000
N C M S 00
A Q 00000
S P S 00
en tid ad S G M L
q u e& pr3cn;
agota & vm ip3s;
la & tffs;
vía & ncfs;
ad m in istrativo & aq0fs;
p od rá & vm if3s;
in terp on erse & vm n;
recu rso & ncm s;
con ten cioso & aq0;
an te& sps;
T ab la 2 . R esultados del lem atizador de M árqu ez y P adró, con m uestras d e etiquetas
m orfosintácticas (según los códigos propuestos por P A R O L E )
Nuevas tendencias en Traducción Automática
67
Análisis sintáctico
F a se 1 : etiq u eta d o m o rfo sin tá ctico
F a se 2 : etiq u eta d o fu n cio n a l
F a se 3 : rela cio n es d e
d ep en d e n cia
[S C [N P L a^el+ D E T S G
p o sicio n ^p o sicio n + N O U N S G N P ]/N
[P P d el^d e= el+ P R E P D E T
G o b iern o ^go b iern o + N O U N S G P P ] [A P
fran ces^fran ces+ A D JS G A P ] : v
h a^h ab er+ H A B sid o ^ser+ P A P U X
in terp retad a^in terp retarP A P S G S C ]
co m o ^co m o + C O M O [N P
u n a^u n + D E T Q U A N T S G
m an era^m an era+ N O U N S G N P ]/N [IV
d e^d e+ P R E P _ D E
elu d ir^elu d ir+ V E R B IN F IV ] [N P
el^el+ D E T S G
p ro b lem a^p ro b lem a+ N O U N S G N P ]/N
.^.+ S E N T
[S C [N P E l^el+ D E T S G
p ro b lem a^p ro b lem a+ N O U N S G
N P ]/S U B J : v tien e^ten er+ V E R B F IN
S C ] [N P u n a^un + D E T Q U A N T S G
d im en sio n ^d im en sio n + N O U N S G
N P ]/O B J [A P
m ay o r^m ay o r+ A D JS G
A P ].^.+ S E N T
[S C [N P L as
relacio n es N P ]/S U B J
[A P so ciales A P ] : v
so n S C ] [A P m uy
in fo rm ales A P ], [P P
en el sen tid o P P ] [S C
[P P d e q u e P P ] [N P
las p erso n as
N P ]/S U B J :v se
v isitan S C ] [P P sin
p rev io av iso P P ] ;
S U B J(relació n ,ser)
S U B R E F L E X (p erso n
a,v isitar)
A T T R (relació n
in fo rm al)
V M O D O B J(ser,en ,se
n tid o )
P A D J(relació n ,so cial)
A D J(p rev io av iso )
L a p o sició n d el g o b iern o fran cés h a
sid o in terp reta d a co m o u n a m a n era d e
elu d ir el p ro b lem a .
E l p ro b lem a tien e un a d im en sió n
m a yo r.
L a s rela cio n es
so cia les so n m u y
in fo rm a les, en el
sen tid o d e qu e la s
p erso n a s se visita n
sin p revio a viso ;
T a b la 3 . F ases d el etiq u etado r IF S P d e G ala 1 99 9 .
Nuevas tendencias en Traducción Automática
68
F a se 1 : etiq u eta d o m o rfo sin tá ctico
F a se 2 : etiq u eta d o fu n cio n a l
F a se 3 : rela cio n es d e
d ep en d e n cia
[S C [N P L a^el+ D E T S G
p o sicio n ^p o sicio n + N O U N S G N P ]/N
[P P d el^d e= el+ P R E P D E T
G o b iern o ^go b iern o + N O U N S G P P ] [A P
fran ces^fran ces+ A D JS G A P ] : v
h a^h ab er+ H A B sid o ^ser+ P A P U X
in terp retad a^in terp retarP A P S G S C ]
co m o ^co m o + C O M O [N P
u n a^u n + D E T Q U A N T S G
m an era^m an era+ N O U N S G N P ]/N [IV
d e^d e+ P R E P _ D E
elu d ir^elu d ir+ V E R B IN F IV ] [N P
el^el+ D E T S G
p ro b lem a^p ro b lem a+ N O U N S G N P ]/N
.^.+ S E N T
[S C [N P E l^el+ D E T S G
p ro b lem a^p ro b lem a+ N O U N S G
N P ]/S U B J : v tien e^ten er+ V E R B F IN
S C ] [N P u n a^un + D E T Q U A N T S G
d im en sio n ^d im en sio n + N O U N S G
N P ]/O B J [A P
m ay o r^m ay o r+ A D JS G
A P ].^.+ S E N T
[S C [N P L as
relacio n es N P ]/S U B J
[A P so ciales A P ] : v
so n S C ] [A P m uy
in fo rm ales A P ], [P P
en el sen tid o P P ] [S C
[P P d e q u e P P ] [N P
las p erso n as
N P ]/S U B J :v se
v isitan S C ] [P P sin
p rev io av iso P P ] ;
S U B J(relació n ,ser)
S U B R E F L E X (p erso n
a,v isitar)
A T T R (relació n
in fo rm al)
V M O D O B J(ser,en ,se
n tid o )
P A D J(relació n ,so cial)
A D J(p rev io av iso )
L a p o sició n d el g o b iern o fran cés h a
sid o in terp reta d a co m o u n a m a n era d e
elu d ir el p ro b lem a .
E l p ro b lem a tien e un a d im en sió n
m a yo r.
L a s rela cio n es
so cia les so n m u y
in fo rm a les, en el
sen tid o d e qu e la s
p erso n a s se visita n
sin p revio a viso ;
T a b la 3 . F ases d el etiq u etado r IF S P d e G ala 1 99 9 .
Nuevas tendencias en Traducción Automática
69
Unidades de traducción
< rs ty p e= o rg a n iza tio n > E u sk al H erriko
Ju stizia A u ziteg i N ag u sik o
A d m in istrazio zk o L isk arrau zietarak o
S alan < /rs>
< rs ty p e= o rg a n iza tio n > S ala d e lo C o n ten cio soA d m in istrativ o d el T ribu n al S u p erio r d e Ju sticia
d el P aís V asco < /rs>
< rs ty p e= la w > Z allak o U d alerrik o
P lan eam en d u ari b u ru zk o S oro sp id ezko
A rau en ald arazp en a< /rs>
< rs ty p e= la w > M o d ificació n d e las N o rm as
S u b sid iarias d e P lan eam ien to d el m u n icip io d e
Z alla < /rs>
< term > L u rzo ru b atzu k d en tsitate tx ik ik o
lu rzo ru u rb an izag ai g isa
b irsailk atzek o < /term >
< term > p ara la reclasificació n d e u n o s terren o s
co m o S u elo A p to p ara U rb an izar d e B aja
D en sid ad < /term >
< seg ty p e= 9 > E rab ak i h o n en au rk a, h aren
jak in arazp en etik zen b atu b eh arrek o
h ilab ete b ik o ep earen b arru an ,
ad m in istrazio zk o lisk arrau zi-errek u rtso a
jarri ah al izan go d a, E u sk al H erriko
Ju stizia A u ziteg i N ag u sik o
A d m in istrazio zk o L isk arrau zietarak o
S alan , k o m en iesten d iren b este
d efen tsab id eak erab il d aitezk eelako
k alterik g ab e. A d ierazi d en ep earen
b arru an , B H I-0 15 /9 4 -P 05 -A esp ed ien tea
B ilb ao k o G ran V ía, 19 -21 ek o 5 gn .
so lairu an eg on g o d a ag erik o , azter d ad in .
B ilb o n , 1 9 94 .eko u rriaren 2 4 an .H irig in tzak o fo ru d ip u tatu a. P edro
H ern án d ez G on zález. < /seg >
< seg ty p e= 9 > C o n tra d ich a O rden F o ral
d rá in terp on erse, en el p lazo d e d o s m eses
sd e su n o tificació n, recurso co n ten cio so m in istrativ o an te la S ala d e lo C on ten cio so m in istrativ o d el T ribu n al S u p erio r d e
ticia d el P aís V a sco , sin p erju icio d e la
lizació n d e o tro s m ed io s d e defen sa qu e
im e co n v en ien te. D uran te el referid o p lazo
ex p ed ien te B H I-01 5 /9 4-P 0 5 -A , q u ed ará d e
n ifiesto p ara su ex am en en las d ep end en cias
u ad as en B ilb ao calle A lam ed a R ek ald e, 3 0 ,
y 6.a p lan tas. B ilb ao , 2 4 d e o ctu bre d e
9 4 .-E l D ip u tado F o ral d e U rb an ism o .- P ed ro
rn án d ez G on zález. < /seg >
T a b la 5 . S egm en tació n en un id ad es d e trad u cción .
Nuevas tendencias en Traducción Automática
< rs ty p e= o rg a n iza tio n > E u sk al H erriko
Ju stizia A u ziteg i N ag u sik o
A d m in istrazio zk o L isk arrau zietarak o
S alan < /rs>
< rs ty p e= o rg a n iza tio n > S ala d e lo C o n ten cio soA d m in istrativ o d el T ribu n al S u p erio r d e Ju sticia
d el P aís V asco < /rs>
< rs ty p e= la w > Z allak o U d alerrik o
P lan eam en d u ari b u ru zk o S oro sp id ezko
A rau en ald arazp en a< /rs>
< rs ty p e= la w > M o d ificació n d e las N o rm as
S u b sid iarias d e P lan eam ien to d el m u n icip io d e
Z alla < /rs>
< term > L u rzo ru b atzu k d en tsitate tx ik ik o
lu rzo ru u rb an izag ai g isa
b irsailk atzek o < /term >
< term > p ara la reclasificació n d e u n o s terren o s
co m o S u elo A p to p ara U rb an izar d e B aja
D en sid ad < /term >
< seg ty p e= 9 > E rab ak i h o n en au rk a, h aren
jak in arazp en etik zen b atu b eh arrek o
h ilab ete b ik o ep earen b arru an ,
ad m in istrazio zk o lisk arrau zi-errek u rtso a
jarri ah al izan go d a, E u sk al H erriko
Ju stizia A u ziteg i N ag u sik o
A d m in istrazio zk o L isk arrau zietarak o
S alan , k o m en iesten d iren b este
d efen tsab id eak erab il d aitezk eelako
k alterik g ab e. A d ierazi d en ep earen
b arru an , B H I-0 15 /9 4 -P 05 -A esp ed ien tea
B ilb ao k o G ran V ía, 19 -21 ek o 5 gn .
so lairu an eg on g o d a ag erik o , azter d ad in .
B ilb o n , 1 9 94 .eko u rriaren 2 4 an .H irig in tzak o fo ru d ip u tatu a. P edro
H ern án d ez G on zález. < /seg >
70
< seg ty p e= 9 > C o n tra d ich a O rden F o ral
d rá in terp on erse, en el p lazo d e d o s m eses
sd e su n o tificació n, recurso co n ten cio so m in istrativ o an te la S ala d e lo C on ten cio so m in istrativ o d el T ribu n al S u p erio r d e
ticia d el P aís V a sco , sin p erju icio d e la
lizació n d e o tro s m ed io s d e defen sa qu e
im e co n v en ien te. D uran te el referid o p lazo
ex p ed ien te B H I-01 5 /9 4-P 0 5 -A , q u ed ará d e
n ifiesto p ara su ex am en en las d ep end en cias
u ad as en B ilb ao calle A lam ed a R ek ald e, 3 0 ,
y 6.a p lan tas. B ilb ao , 2 4 d e o ctu bre d e
9 4 .-E l D ip u tado F o ral d e U rb an ism o .- P ed ro
rn án d ez G on zález. < /seg >
T a b la 5 . S egm en tació n en un id ad es d e trad u cción .
Nuevas tendencias en Traducción Automática
71
Corpus anotado
< d iv > ... < seg typ e= 9 id = 9 E U 2 corresp = 9 E S 2 > < p
id = p E U 1 1 > < s id = sE U 1 1 co rresp = E S 11 > < rs
ty p e= law id = L E U 1 0 co rresp = L E S 12 > F o ru
a g in d u < /rs> h o rrek a m a iera em a n d io
a d m in istra zio b id ea ri; eta b era ren a u rk a < rs
ty p e= o rg an izatio n id = O E U 10 >
A d m in istra zio a rek ik o < /rs> a u zib id eerrek u rtso a ja rri a h a l iza n g o za io < rs
ty p e= o rg an izatio n id = O E U 11 co rresp = O E S 9 >
E u sk a l H errik o J u stizi A u ziteg i N a g u sik o
A d m in istra zio a rek ik o A u zib id eeta ra k o S a la ri
< /rs> , b i h ila b etek o ep ea n ; ja k in a ra zp en h a u
eg iten d en eg u n a ren b ih a ra m u n etik zen b a tu k o
d a ep e h o ri; h a la eta g u ztiz ere, ego k iesten
d iren b este d efen tsa b id ea k ere era b il litezk e.
< /s> < /p > < /seg > < seg ty p e= 1 0 id = 1 0 E U 1
co rresp = 1 0 E S 1 > < p id = p E U 1 2 > < s id = sE U 1 2
co rresp = E S 1 2 > E p e h o ri a m a itu a rte B H I-< nu m
n u m = 1 00 9 4 > 1 00 /9 4 < /nu m > -P 0 5 -A esp ed ien tea
a g eria n eg o n go d a , n a h i d u en a k a zter d eza n ,
< rs ty p e= p lace id = P E U 2 corresp = P E S 3 > B ilb o k o
E rrek a ld e zu m a rk a lek o < /rs> < n u m n u m = 3 0 >
3 0 .ek o < /n um > b u leg o eta n , < nu m n u m = 5 > 5
< /n u m > eta < nu m nu m = 6 > 6 .< /n um >
so la iru eta n .< /s> < /p > < /seg > < /d iv > < clo ser
id = p E U 1 3 > < d o cA u tho r> < s id = sE U 1 3
co rresp = E S 1 3 > < rs ty p e= title id = T L E U 4
co rresp = T L E S 4 > H irig in tza k o fo ru d ip u ta tu a
< /rs> . < /s> < s id = sE U 1 4 co rresp = E S 1 4 > _ < rs
ty p e= n am e id = N E U 4 co rresp = N E S 4 > P ed ro
H ern á n d ez G o n zá lez < /rs> .< /s> < /d o cA u th o r>
< d iv > ... < seg ty p e= 9 id = 9 E S 2 corresp = 9 E U 2 >
< p id = p E S 1 1 > < s id = sE S 1 1 co rresp = E U 1 1 >
C o n tra d ich a < rs ty p e= law id = L E S 1 2
co rresp = L E U 1 0 > O rd en F o ra l < /rs> , q u e
a g o ta la v ía a d m in istra tiv a p o d rá
in terp o n erse recu r so co n ten cio so a d m in istra tiv o a n te la < rs ty p e= o rg an ization
id = O E S 9 co rresp = O E U 1 1 > S a la d e lo
C o n ten cio so -A d m in istra tiv o d el T rib u n a l
S u p erio r d e J u sticia d el P a ís V a sco < /rs> , en
el p la zo d e d o s m eses, co n ta d o d esd e el d ía
sig u ien te a esta n o tifica ció n sin p erju icio d e
la u tiliza ció n d e o tro s m ed io s d e d efen sa q u e
estim e o p o rtu n o s.< /s> < /p > < /seg > < seg
ty p e= 1 0 id = 1 0 E S 1 co rresp = 1 0E U 1 > < p
id = p E S 1 2 > < s id = sE S 1 2 corresp = E U 1 2 >
D u ra n te el referid o p la zo el ex p ed ien te B H I< n u m nu m = 1 00 9 4 > 1 00 /9 4 < /nu m > - P 0 5 -A
q u ed a rá d e m a n ifiesto p a ra su ex á m en en
la s d ep en d e n cia s d e < rs ty p e= p lace id = P E S 3
co rresp = P E U 2 > B ilb a o ca lle A la m ed a
R ek a ld e < /rs> , < n u m n u m = 3 0 > 30 < /n um > ,
< n u m nu m = 5 > 5 .a < /nu m > y < n u m n u m = 6 >
6 .a < /n um > p la n ta s. < /s> < /p > < /seg > < /d iv >
< clo ser= p E S 1 3 > < do cA u th o r> < s id = sE S 1 3
co rresp = E U 1 3 > E l < rs ty p e= title id = T L E S 4
co rresp = T L E U 4 > D ip u ta d o F o ra l d e
U rb a n ism o < /rs> . < /s> < s id = sE S 1 4
co rresp = E U 1 4 > - < rs ty p e= n am e id = N E S 4
co rresp = N E U 4 > P ed ro H ern á n d ez G o n zá lez
< /rs> < /s> < /d o cA u th o r> < /clo ser>
T a b la 6 . M u estra d e secció n d el co rp u s alin ead a (M artín ez 1 99 9 )
Nuevas tendencias en Traducción Automática
72
< d iv > ... < seg typ e= 9 id = 9 E U 2 corresp = 9 E S 2 > < p
id = p E U 1 1 > < s id = sE U 1 1 co rresp = E S 11 > < rs
ty p e= law id = L E U 1 0 co rresp = L E S 12 > F o ru
a g in d u < /rs> h o rrek a m a iera em a n d io
a d m in istra zio b id ea ri; eta b era ren a u rk a < rs
ty p e= o rg an izatio n id = O E U 10 >
A d m in istra zio a rek ik o < /rs> a u zib id eerrek u rtso a ja rri a h a l iza n g o za io < rs
ty p e= o rg an izatio n id = O E U 11 co rresp = O E S 9 >
E u sk a l H errik o J u stizi A u ziteg i N a g u sik o
A d m in istra zio a rek ik o A u zib id eeta ra k o S a la ri
< /rs> , b i h ila b etek o ep ea n ; ja k in a ra zp en h a u
eg iten d en eg u n a ren b ih a ra m u n etik zen b a tu k o
d a ep e h o ri; h a la eta g u ztiz ere, ego k iesten
d iren b este d efen tsa b id ea k ere era b il litezk e.
< /s> < /p > < /seg > < seg ty p e= 1 0 id = 1 0 E U 1
co rresp = 1 0 E S 1 > < p id = p E U 1 2 > < s id = sE U 1 2
co rresp = E S 1 2 > E p e h o ri a m a itu a rte B H I-< nu m
n u m = 1 00 9 4 > 1 00 /9 4 < /nu m > -P 0 5 -A esp ed ien tea
a g eria n eg o n go d a , n a h i d u en a k a zter d eza n ,
< rs ty p e= p lace id = P E U 2 corresp = P E S 3 > B ilb o k o
E rrek a ld e zu m a rk a lek o < /rs> < n u m n u m = 3 0 >
3 0 .ek o < /n um > b u leg o eta n , < nu m n u m = 5 > 5
< /n u m > eta < nu m nu m = 6 > 6 .< /n um >
so la iru eta n .< /s> < /p > < /seg > < /d iv > < clo ser
id = p E U 1 3 > < d o cA u tho r> < s id = sE U 1 3
co rresp = E S 1 3 > < rs ty p e= title id = T L E U 4
co rresp = T L E S 4 > H irig in tza k o fo ru d ip u ta tu a
< /rs> . < /s> < s id = sE U 1 4 co rresp = E S 1 4 > _ < rs
ty p e= n am e id = N E U 4 co rresp = N E S 4 > P ed ro
H ern á n d ez G o n zá lez < /rs> .< /s> < /d o cA u th o r>
< d iv > ... < seg ty p e= 9 id = 9 E S 2 corresp = 9 E U 2 >
< p id = p E S 1 1 > < s id = sE S 1 1 co rresp = E U 1 1 >
C o n tra d ich a < rs ty p e= law id = L E S 1 2
co rresp = L E U 1 0 > O rd en F o ra l < /rs> , q u e
a g o ta la v ía a d m in istra tiv a p o d rá
in terp o n erse recu r so co n ten cio so a d m in istra tiv o a n te la < rs ty p e= o rg an ization
id = O E S 9 co rresp = O E U 1 1 > S a la d e lo
C o n ten cio so -A d m in istra tiv o d el T rib u n a l
S u p erio r d e J u sticia d el P a ís V a sco < /rs> , en
el p la zo d e d o s m eses, co n ta d o d esd e el d ía
sig u ien te a esta n o tifica ció n sin p erju icio d e
la u tiliza ció n d e o tro s m ed io s d e d efen sa q u e
estim e o p o rtu n o s.< /s> < /p > < /seg > < seg
ty p e= 1 0 id = 1 0 E S 1 co rresp = 1 0E U 1 > < p
id = p E S 1 2 > < s id = sE S 1 2 corresp = E U 1 2 >
D u ra n te el referid o p la zo el ex p ed ien te B H I< n u m nu m = 1 00 9 4 > 1 00 /9 4 < /nu m > - P 0 5 -A
q u ed a rá d e m a n ifiesto p a ra su ex á m en en
la s d ep en d e n cia s d e < rs ty p e= p lace id = P E S 3
co rresp = P E U 2 > B ilb a o ca lle A la m ed a
R ek a ld e < /rs> , < n u m n u m = 3 0 > 30 < /n um > ,
< n u m nu m = 5 > 5 .a < /nu m > y < n u m n u m = 6 >
6 .a < /n um > p la n ta s. < /s> < /p > < /seg > < /d iv >
< clo ser= p E S 1 3 > < do cA u th o r> < s id = sE S 1 3
co rresp = E U 1 3 > E l < rs ty p e= title id = T L E S 4
co rresp = T L E U 4 > D ip u ta d o F o ra l d e
U rb a n ism o < /rs> . < /s> < s id = sE S 1 4
co rresp = E U 1 4 > - < rs ty p e= n am e id = N E S 4
co rresp = N E U 4 > P ed ro H ern á n d ez G o n zá lez
< /rs> < /s> < /d o cA u th o r> < /clo ser>
T a b la 6 . M u estra d e secció n d el co rp u s alin ead a (M artín ez 1 99 9 )
Nuevas tendencias en Traducción Automática
73
5 Límites de la tecnología

Condiciones adversas
– lenguaje creativo, espontáneo,
imprevisible: habla coloquial, producción
poética, narrativa, ensayo, publicidad, humor

Condiciones óptimas
– lenguaje controlado, repetitivo, canónico:
manuales técnicos, partes, informes, textos
jurídicos, fórmulas
Nuevas tendencias en Traducción Automática
74
Límites de la tecnología

Traducción automática (MT)
– Systran, Logos: 100.000 palabras, 5.000 reglas de
transferencia

Traducción asistida (CAT)
– memorias de traducción: Trados, Star, Atril
– lenguaje controlado, traducciones canónicas
– corpus paralelo alineado, base terminológica
Nuevas tendencias en Traducción Automática
75
Cobertura vs. calidad
calidad
CAT
perfecta
ready-to-use
comprensible
indicativa
M
T
cobertura
Nuevas tendencias en Traducción Automática
76
Límites de la tecnología

Tipología textual
– textos literarios
• Lewis Carroll
– textos ténicos, divulgativos
• página presentación CE
– textos canónicos
• fórmula religiosa
Nuevas tendencias en Traducción Automática
77
Texto literario
Brilla, luce, ratita alada
¿en qué estás tan atareada?
Por encima del universo vuelas
como una bandeja de teteras.
tr. de Jaime de Ojeda
Centelleo, centelleo, pequeño
palo, ¡cómo me pregunto en cuál
usted está! Encima sobre del
mundo usted vuela como una tébandeja en el cielo.
tr. de SYSTRAN
Nuevas tendencias en Traducción Automática
78
Texto técnico (SYSTRAN)
HLTCentral web site was established
as an online information resource of
human language technologies and
related topics of interest to the HLT
community at large. It covers news,
R&D, technological and business
developments in the areas of speech,
language, multilinguality, automatic
translation, localisation and related
areas. It has a unique European
perspective with a broad view of HLT
news and developments worldwide.
El Web site de HLTCentral fue
establecido como recurso en línea de la
información tecnologías humanas del
lenguaje y los asuntos relacionados del
interés para la comunidad de HLT en
grande. Cubre noticias, progresos del
R&d, tecnológicos y de negocio en las
áreas del discurso, del lenguaje, del
multilinguality, de la traducción
automática, de la localización y de áreas
relacionadas. Tiene una perspectiva
europea única con una visión de conjunto
noticias de HLT y los progresos por todo
el mundo.
Nuevas tendencias en Traducción Automática
79
FREETRANSLATION.com / SYSTRAN
El sitio de la telaraña de HLTCentral
se estableció como un recurso de
información de online de tecnologías
humanas de idioma y temas
relacionados del interés a la
comunidad de HLT en libertad. Cubre
las noticias, R&D, tecnológico y los
desarrollos del negocio en las áreas del
habla, el idioma, multilinguality, la
traducción automática, localisation y
áreas relacionadas. Tiene una
perspectiva europea extraordinaria con
un panorama ancho de noticias de HLT
y desarrollos mundiales.
El Web site de HLTCentral fue
establecido como recurso en línea de la
información tecnologías humanas del
lenguaje y los asuntos relacionados del
interés para la comunidad de HLT en
grande Cubre noticias, progresos del
R&d, tecnológicos y de negocio en las
áreas del discurso, del lenguaje, del
multilinguality, de la traducción
automática, de la localización y de áreas
relacionadas. Tiene una perspectiva
europea única con una visión de conjunto
noticias de HLT y los progresos por todo
el mundo.
Nuevas tendencias en Traducción Automática
80
Texto técnico II (SYSTRAN)
Welcome to the homepage of the
Language Engineering sector of the
Telematics Applications Programme
within the Fourth Framework. The aim
of Language Engineering is to facilitate
the use of telematics applications and to
increase the possibilities for
communication in and between
European languages. RTD work focuses
on pilot projects that integrate language
technologies into information and
communications applications and
services. A key objective is to improve
their ease of use and functionality and
broaden their scope across different
languages.
Bienvenido a la pagina de (inicio)casa del
sector de Ingenieria de Lenguaje del
Telematics Programa de Aplicaciones
dentro el Cuarto Armazon. La punteria de
Ingenieria de Lenguaje es facilitar el usa de
telematics aplicaciones y a aumento las
posibilidades para comunicacion en y entre
lenguajes Europeos. RTD trabajar focos en
proyectos de piloto que integra tecnologias
de lenguaje dentro informacion y
comunicaciones aplicaciones y servicios.
Una (llave/clave)tecla objetiva es mejorar
su facilidad de usa y funcionalidad y
ensancha su ambito lenguajes a traves
diferentes.
Nuevas tendencias en Traducción Automática
81
NCSA.es vs. SYSTRAN
Recepción al homepage del sector de la
ingeniería del lenguaje del programa de
aplicaciones del telematics dentro del
cuarto marco. La puntería de la
ingeniería del lenguaje es facilitar el uso
de las aplicaciones del telematics y
aumentar las posibilidades para la
comunicación en y entre lenguajes
europeos. El trabajo de RTD se centra
en los proyectos experimentales que
integran tecnologías del lenguaje en la
información y aplicaciones y servicios
de comunicaciones. Un objetivo
dominante es mejorar su facilidad de
empleo y funciones y ensanchar su
alcance a través de diversos lenguajes.
Bienvenido a la pagina de (inicio)casa del
sector de Ingenieria de Lenguaje del
Telematics Programa de Aplicaciones
dentro el Cuarto Armazon. La punteria de
Ingenieria de Lenguaje es facilitar el usa de
telematics aplicaciones y a aumento las
posibilidades para comunicacion en y entre
lenguajes Europeos. RTD trabajar focos en
proyectos de piloto que integra tecnologias
de lenguaje dentro informacion y
comunicaciones aplicaciones y servicios.
Una (llave/clave)tecla objetiva es mejorar
su facilidad de usa y funcionalidad y
ensancha su ambito lenguajes a traves
diferentes.
Nuevas tendencias en Traducción Automática
82
FREETRANSLATION.com / SYSTRAN
Dé la bienvenida al homepage del
sector de la Ingeniería del Idioma de las
Aplicaciones de Telematics Programa
dentro de la Cuarta Armazón. La
puntería de la Ingeniería del Idioma
deberá facilitar el uso de aplicaciones
de telematics y al aumento las
posibilidades para la comunicación en y
entre idiomas europeos. El trabajo de
RTD se enfoca en proyectos pilotos que
integran las tecnologías del idioma en
aplicaciones de información y
comunicaciones y servicios. Un
objetivo clave deberá mejorar su
comodidad del uso y la funcionalidad y
ensanchar su alcance a través de
idiomas diferentes.
Bienvenido a la pagina de (inicio)casa del
sector de Ingenieria de Lenguaje del
Telematics Programa de Aplicaciones
dentro el Cuarto Armazon. La punteria de
Ingenieria de Lenguaje es facilitar el usa de
telematics aplicaciones y a aumento las
posibilidades para comunicacion en y entre
lenguajes Europeos. RTD trabajar focos en
proyectos de piloto que integra tecnologias
de lenguaje dentro informacion y
comunicaciones aplicaciones y servicios.
Una (llave/clave)tecla objetiva es mejorar
su facilidad de usa y funcionalidad y
ensancha su ambito lenguajes a traves
diferentes.
Nuevas tendencias en Traducción Automática
83
Texto canónico (SYSTRAN)
Our Father, who art in heaven,
hallowed be thy name;
thy kingdom come;
thy will be done;
on earth as it is in heaven.
Give us this day our daily bread.
And forgive us our trespasses,
as we forgive those who trespass
against us.
And lead us not into temptation;
but deliver us from evil.
For thine is the kingdom, the
power and the glory,
for ever and ever. Amen.
Nuestro padre, que el arte en el
cielo, santificado sea nombre thy;
el reino thy viene; thy será
hecho; en la tierra como está en
cielo Dénos este día nuestro pan
diario. Y perdónenos nuestras
infracciones, mientras que
perdonamos a los que violen
contra nosotros. Y condúzcanos
no en la tentación; pero
entregúenos de mal. Para el
thine está el reino, la potencia y
la gloria, para siempre y siempre.
Amen..
Nuevas tendencias en Traducción Automática
84
NCSA.es vs. SYSTRAN
Nuestro Padre, quien arte en
cielo, santificar casar ser thy
nombre; thy reino viene; thy sera
hecho; en tierra como el esta en
cielo. Darnos este dia nuestro
pan diario. Y perdonarnos
nuestro violaciones, como
nosotros perdonamos esos quien
violacion contra nosotros. Y
conducirnos no dentro tentacion;
pero entregarnos desde mal. Para
thine es el reino, el poder y la
gloria, para siempre y siempre.
Amen.
Nuestro padre, que el arte en el
cielo, santificado sea nombre thy;
el reino thy viene; thy será
hecho; en la tierra como está en
cielo Dénos este día nuestro pan
diario. Y perdónenos nuestras
infracciones, mientras que
perdonamos a los que violen
contra nosotros. Y condúzcanos
no en la tentación; pero
entregúenos de mal. Para el
thine está el reino, la potencia y
la gloria, para siempre y siempre.
Amen..
Nuevas tendencias en Traducción Automática
85
FREETRANSLATION.com / SYSTRAN
Nuestro Padre, cielo de en de arte de
quien, nombre de thy de ser de casar
de santificar; reino de thy rivalizado;
hecho de sera de thy; cielo de en de
esta de el de como de tierra de en.
Diario de cacerola de nuestro de dia
de este de Darnos. Violaciones de
nuestro de perdonarnos y, violacion
de quien de esos de perdonamos de
nosotros de como contra nosotros.
Conducirnos y no tentacion
de dentro; mal de desde de
entregarnos de pero. Reino de el de
thine e de Para, gloria de la de poder
y de el, siempre de siempre y de
para. Amén.
Nuestro padre, que el arte en el
cielo, santificado sea nombre thy;
el reino thy viene; thy será
hecho; en la tierra como está en
cielo Dénos este día nuestro pan
diario. Y perdónenos nuestras
infracciones, mientras que
perdonamos a los que violen
contra nosotros. Y condúzcanos
no en la tentación; pero
entregúenos de mal. Para el
thine está el reino, la potencia y
la gloria, para siempre y siempre.
Amen..
Nuevas tendencias en Traducción Automática
Retraducción
86
Texto en inglés
MLIS (Multilingual Information
Society) is a programme of the
European Commission's DG XIII,
launched in November 1996. MLIS
sets out to support the construction
of an infrastructure for European
language resources; to mobilise
and expand the language
industries; to promote the use of
advanced language tools in the
European public sector.
Companies, public sector
organisations, the language
industries and citizens can benefit
from this programme.
Traducción del español
MLIS (Society of the
Multilingual Information) is a
program of European
Commission - DGXIII, sent in
November of 1996 MLIS was
constituted to support to the
construction of an infrastructure
for the European resources of
the language, to mobilize and to
expand the industries of the
language and to promote the use
of tools outposts of language in
the European public sector.
Nuevas tendencias en Traducción Automática
Retraducción
Traducción del inglés
MLIS (sociedad de la información
multilingüe) es un programa de la
Comisión de las Comunidades
Europeas - DGXIII, enviado en
noviembre de 1996. MLIS fue
constituido para utilizar a la
construcción de una infraestructura
para los recursos europeos del
lenguaje, para movilizar y para
ampliar las industrias del lenguaje
y para promover el uso de los
puestos avanzados de las
herramientas del lenguaje en el
sector público europeo.
87
Original en español
MLIS (Sociedad de la Información
Multilingüe) es un programa de la
Comisión Europea - DGXIII,
lanzado en Noviembre de 1996.
MLIS se constituyó para dar apoyo
a la construcción de una
infraestructura para los recursos
del lenguaje europeos, movilizar y
expandir las industrias del lenguaje
y promocionar el uso de
herramientas avanzadas de
lenguaje en el sector público
europeo.
Nuevas tendencias en Traducción Automática
88
Cobertura vs. calidad
calidad
CAT
perfecta
ready-to-use
comprensible
indicativa
M
T
cobertura
Nuevas tendencias en Traducción Automática
89
6 Salidas profesionales

Consultor / Consultant

Usuario / User

Docente / Instructor

Evaluador / Evaluator

Gestor / Manager

Diseñador / Developer
Nuevas tendencias en Traducción Automática
90
Salidas profesionales

Consultant: A person that is sufficiently
informed to advise potential users of
translation technology. This person should be
able to find out when and how technology
may be useful or cost-effective; how to find
out the most adequate tools or where to get
the necessary information to come up with an
answer. That is, a person that knows where to
find the basic relevant literature and
references.
Nuevas tendencias en Traducción Automática
91
Salidas profesionales

User: A person that has sufficient
technological training to be efficient not only
using the computer but also any specialized
translation software with a minimally standard
way of working.
Nuevas tendencias en Traducción Automática
92
Salidas profesionales

Instructor: A person that can both assess
and use the technology is, with a little more
experience, also capable of training other
people. Teaching requires some confidence
with hardware and software, so it would be
desirable for the instructor to also be a
regular computer user.
Nuevas tendencias en Traducción Automática
93
Salidas profesionales

Evaluator: Evaluating the technology
requires a little more expertise than being a
consultant. An evaluator would be able to
analyze how good or bad particular software
is. Therefore, some experience in software
evaluation in general, and in translation
technology in particular, is recommendable.
Nuevas tendencias en Traducción Automática
94
Salidas profesionales

Manager: Has responsibility to make the
company profitable. Experience using and
testing translation technology. Must set an
optimal distribution between human and
machine resources; select adequate
professionals (translators, computational
linguists, or software engineers), and acquire
appropriate technological infrastructure.
Nuevas tendencias en Traducción Automática
95
Salidas profesionales

Developer: Localization software very often
needs customizing, integration or up-dating.
Good professionals may be involved in
software development, where both linguistic
and technical skills may be required.
Nuevas tendencias en Traducción Automática
96
7 Grupo DELi
Corpus BOB/LEGEBiDUNA (demo)
 Proyecto ITEM

– UPC, UB, EHU, UNED

Proyecto XTRA-Bi (extracción automática
de elementos bitextuales)
– STELLA, GV
– TRANSIT, XML/XSL, TMX
Nuevas tendencias en Traducción Automática
97
8 Documentación




EuTrans http://hermes.zeres.de/Eutrans
DELi http://www.deli.deusto.es
Aspects of Translation Technology

Translation Reference Center
http://www.transref.org/
ForeingWord http://www.foreignword.com/
Laurie Gerber’s links http://www.eamt.org/

HLT http://www.hltcentral.org/

Translation Journal http://accurapid.com/journal

Nuevas tendencias en Traducción Automática
Descargar

Nuevas tendencias en Traducción Automática