Informática aplicada a la Traducción: abril 2012

sábado, 21 de abril de 2012

Memorias de Traducción

Después de haber explicado en qué consiste la Traducción Automática, nos resultará más fácil entender qué son las Memorias de Traducción, pues ambas son sistemas automáticos de traducción. No obstante, existe una diferencia fundamental entres estos dos sistemas: la primera utiliza lenguaje de conocimiento para traducir un texto de una lengua origen a una lengua meta; la segunda utiliza traducciones ya creadas por el traductor que se han ido almacenando en el programa.

Como el propio nombre indica, una memoria de traducción empieza a funcionar una vez se hayan almacenado datos, pues es imposible "recordar" datos que no se hayan "memorizado". Para comenzar nuestra memoria, debemos introducir textos originales alineados con sus respectivas traducciones (el concepto de alineación lo describiremos en la próxima entrada).

Para crear una memoria de traducción hay que seguir unos pasos que, por norma general, son similares en todos los programas: selección de idiomas, gestión de archivos, configuración del usuario y opciones para coincidencias parciales.

Selección de idioma: una memoria de traducción tiene, al menos, dos idiomas, la lengua origen y la lengua meta. Sin embargo, la mayoría de los programas admiten todos los idiomas e, incluso, diferencian entre variedades regionales.

Selección de idioma en DéjàVu

Gestión de archivos: la memoria de traducción puede estar formada tanto por un sólo archivo como por varios archivos en diferentes formatos.
Configuración del usuario: se trata de la información adicional sobre la base de datos o sobre las unidades de traducción. Esto permite utilizar filtros relacionados con el tema de la traducción o su cliente, por lo que la terminología y el estilo puede adecuarse más al encargo que se nos ha solicitado.

Configuración del usuario en DéjàVu

Opciones para coincidencias parciales: por cada memoria de traducción que se crea, se puede fijar el límite de coincidencia sobre el que se desea trabajar. Normalmente, se puede configurar este límite entre el 1% y el 99%. No obstante, con el fin de evitar mucho "ruido" o demasiado "silencio", este umbral se suele definir entre el 60% y el 70%.

Opciones para coincidencias en DéjàVu

Las memorias de traducción tienen grandes ventajas, sobre todo en textos afines tales como instrucciones, pues las diferencias entre textos son muy reducidas y la memoria ofrecerá una calidad de traducción muy alta.

Existe un gran variedad de programas de memoria de traducción, tanto de pago como software libre. Algunos ejemplos son: Trados, OmegaT o DéjàVu.

Antes de finalizar la entrada, cabe destacar que existen unos sistemas híbridos entre la traducción automática y la memoria de traducción, los cuales usan las memorias siempre y cuando estén disponibles y, en caso contrario, echan mano de un traductor automático.

miércoles, 11 de abril de 2012

Traducción Automática

La traducción automática se podría definir como los sistemas informáticos que traducen un texto de una lengua origen a una lengua meta con o sin ayuda de la intervención humana. Teóricamente, esos programas informáticos deberían respetar 3 normas principales: traducir todo lo que dice el original, no añadir nada que no esté en el texto fuente y usar la lengua meta de la forma más correcta y natural posible.

El término "traducción automática" engloba dos tipos de traducciones: por un lado, la que es llevada a cabo sin la intervención humana de principio a fin, llamada "traducción automática de alta calidad"; por otro lado, está la "traducción automática con participación humana", en la que el ser humano interviene en cualquiera de las fases de la traducción. Esta intervención humana se puede clasificar en tres etapas: interacción, preedición y postedición.

Como con cualquier otro tema, es importante acudir a las raíces para estudiar y entender con profundidad el alcance y la importancia de la cuestión, por lo que vamos a analizar de manera sencilla los inicios de la traducción automática. A finales de la década de 1950 se empezó a desarrollar este estudio, sin embargo, los pocos resultados obtenidos a corto plazo llevaron al cese de financiación orientado al desarrollo de estos sistemas informáticos.

Warren Weaver, en 1949, reveló en el llamado "Memorandum Weaver" la idea de traducción automática sugiriendo cuatro métodos: análisis estadísticos, exploración de la lógica subyacente, técnicas criptográficas del periodo de guerras y las características universales del lenguaje. A raíz de esto, se empezaron a desarrollar proyectos de traducción automática en Estados Unidos. A partit 1951, Yehoshua Bar-Hillel, nombrado como primer investigador, se dedicó exclusivamente a esta aplicación. En la década de 1960, la TA se basó en métodos empíricos de tanteo y en la década de 1970, los proyectos más importante se trasladaron a Canadá.

Desde que empezó a desarrollarse la traducción automática, se han creado numerosos programas (algunos de los cuales estudiaremos más adelante). Éstos se pueden dividir atendiendo a diferentes características:

- Número de lenguas: se dividen en bilingües, de una lengua origen se traduce a una sola lengua meta; y multilingües, de una lengua origen a varias lenguas meta.

- Dirección de la traducción: los programas pueden ser unidireccionales, si traducen sólo en una dirección (por ejemplo, de inglés a español); o bidireccionales, si traducen en ambas direcciones (por ejemplo, de inglés a español y de español a inglés).

-Enfoque: se pueden distinguir tres enfoques, cada uno de ellos relacionado estrechamente con una de las 3 etapas fundamentales en el desarrollo de estos sistemas informáticos.

1. Sistemas de traducción directa: correspondientes a la primera etapa. Básicamente son grandes diccionarios que traducen palabra por palabra, por lo que la calidad final de la traducción no es muy alta.

2. Sistemas de transferencia: correspondientes a las segunda etapa. Además de ser grandes diccionarios monolingües y bilingües, tienen un amplio conocimiento sintáctico-semántico de las lenguas. Esto quiere decir que, en vez de traducir simplemente las palabras, es capaz de reconocer el contexto que rodea a ésta para decidir qué significado darle. También reconoce las estructuras sintácticas, con lo que puede modificar el orden de las palabras de una misma frase para reordenarlas de la forma más adecuada.

3. Sistemas interlingua: correspondientes a la tercera etapa de la traducción automática. Es un caso particular de los sistemas anteriores en los que se realiza un análisis mucho más profundo de cada frase.

Después de este análisis de la traducción automática, cabe añadir que, si bien es una gran ayuda para el traductor, todos estos programas requieren de la maño del hombre para que la calidad de la traducción sea más que aceptable. Esto es así puesto que las lenguas no son sistemas cerrados y completamente programados, sino que existen aspectos que relacionan la lengua con el mundo real que los ordenadores no pueden advertir (anáforas, actos de habla...).

Esta entrada es resumen del artículo Posibilidades y realidades de la Traducción Automática, redactado por Victoria López y publicado en La Linterna del Traductor.

Disponible en: http://traduccion.rediris.es/3/tr_au.htm