sábado, 12 de noviembre de 2011

MT, Internet y polémica

Hoy me dispongo a escribir sobre los sistemas de memorias de traducción (MT systems), un tema cuya importancia trasciende su mero uso, y alcanza la controversia que se ha desatado su alrededor. Aclaremos primero los conceptos básicos para entender su funcionamiento y su polémica.
Una MT es una herramienta que se incluye dentro de las tecnologías de TAO cuya función es la de una base lingüística que almacena «segmentos» y sus traducciones en otra lengua con vistas a poder reutilizarlos en futuros trabajos («leveraging»), formando un «corpus paralelo» o un «bitext». El funcionamiento interno de uno de estos sistemas es bastante simple: al introducir un texto nuevo, el programa busca «segmentos» que ya se han traducido antes y muestra las coincidencias. Los llamados «segmentos» son frases en su mayoría, acotadas por signos de puntuación (lo que en ocasiones puede inducir a error), aunquela última palabra sobre dicha segmentación siempre la tiene el usuario. Las coincidencias pueden ser de varios tipos: exacta, cuando los dos extractos  son completamente idénticos en todas las cuestiones; completas si varían los «elementos variables» como números, fechas o nombres propios; casuales (fuzzy matching) en el caso de segmentos similares cuyo porcentaje de similitud puede ser elegido; coincidencias terminológicas; y coincidencias de subsegmentos, en la cuales se busca la coincidencia dentro del segmento, y no el segmento entero como tal. En el resultado de la comparación de los segmentos también puede no aparecer ninguna coincidencia. Así pues, las traducciones resultantes son traducciones análogas de otros textos anteriormente traducidos.

Estos sistemas de gestión de memorias de traducción tienen un objetivo principal, y este es facilitarle al traductor su tarea haciéndole ganar tiempo en no traducir algo ya traducido. Sin embargo, entendido el punto anterior, podemos imaginar la gran cantidad de tiempo y de traducciones que se necesita para que una memoria de traducción comience a ser útil. Por ello, una de las tendencias más seguidas es la de compartir memorias de traducción. Sin embargo, para el correcto uso interpersonal de éstas se necesita un formato unificado (de manera que no se pierda más tiempo). Este formato es el TMX (Translation Memory Exchange format; Melby, 1998). Otro objetivo primordial es mejorar la calidad de las traducciones. No obstante, no revisar ni actualizar estas bases de datos que conforman las memorias de traducción puede conllevar consecuencias muy negativas. Un texto sin revisar podría presentar cualquier tipo de problema que comete una traducción automática; el no actualizar la memoria puede suponer que sigamos utilizando términos que han caído en desuso (cosa muy normal en el campo de la traducción técnica). Vemos por tanto, que estos gestores significan mejoras de calidad en nuestra tarea, sin embargo, requieren más tiempo y esfuerzo por parte del traductor: aprender a usarlas, conformar un corpus, utilizarlo en cada traducción, actualizarlo, etc. sin tener en cuenta el esfuerzo económico, ya que en ocasiones el coste de estos programas supera los mil euros. Tienen por tanto, sus pros y sus contras.

Considero de vital importancia conocer cómo potenciar y aprovechar el uso de estos sistemas. Las coincidencias exactas pueden ser peligrosas en lo que a homonimia se refiere. Por esto, se aconseja crear distintos bloques de memorias con los distintos temas que se vayan a tratar, pudiendo así neutralizar la homonimia (la homonimia en un mismo campo conceptual es imposible o muy escasa). Ten también en cuenta que lo que estos gestores muestran son los fragmentos ya antes traducidos; serán por tanto de mayor utilidad en textos de la misma especialidad o textos con muchas repeticiones internas. Será por consiguiente muy útil en textos legales, técnicos o científicos, pero de escasa utilidad en textos creativos o expresivos (literatura, publicidad, etc). En caso de revisión, reedición, o actualización de un texto, nos aportan también una gran ventaja, ya que la mayor parte del texto ya estará traducida, será localizada y únicamente tendremos que traducir aquellos segmentos nuevos o editados. Son muy útiles también al trabajar con un mismo cliente ya que crear bloques por clientes (al igual que antes lo hacíamos por materias) nos permite adecuarnos a su estilo sin transferirlo a otros documentos.

Resulta curioso comprobar como cuanto más vemos lo útiles que pueden llegar a ser comprendemos todo el trabajo que hay detrás. Por eso, la idea de compartir estos corpora no es tan descabellada. Minako O'Hagan (autora de The coming industry of teletranslation) propuso hacer de Internet una gigantesca memoria de traducción. Y quizá esta realidad no esté tan lejos. Podríamos considerar a Wikipedia un enorme corpus, lleno de coincidencias exactas, completas, casuales, terminológicas y coincidencias de subsegmentos en cada uno de sus artículos traducidos, de hecho, ¿cuántas veces hemos accedido a ella para comprobar «cuál es el nombre exacto de esto en este otro idioma»? El único coste que tenemos que pagar es que los segmentos no están alienados y tenemos que encontrar las coincidencias de manera manual. Pero, ¿y Linguee (www.linguee.com)?


En realidad lo que Linguee nos muestra son comparaciones de segmentos traducidos en dos idiomas, marcando nuestra búsqueda (nuestro subsegmento). En este caso, aunque sí están alineados, al introducir una búsqueda homónima («renacimiento») nos presenta resultados ruidosos, ya que la base de datos no está delimitada por áreas temáticas. También podríamos incluir a IATE (http://iate.europa.eu/iatediff/SearchByQueryEdit.do) en este tipo de búsquedas, aunque en su caso, además nos permitiría la búsqueda por áreas temáticas. Estos son solo algunos de los muchos ejemplos de corpus de datos traducidos a varios idiomas en los que poder encontrar los segmentos correspondientes.

Sin embargo, el uso de estas herramientas ha dado lugar a una terrible controversia ¿debería cobrar menos el traductor por utilizar memorias de traducción? Resulta obvio que el traductor que utiliza una memoria de traducción no traduce desde el principio todas las palabras, sino que reutiliza los fragmentos anteriormente traducidos. No es por tanto un trabajo vacío, si no aprovechado. De todas formas, ¿no debería pagarse por la calidad en lugar de por las herramientas utilizadas?, ¿sería de más calidad el trabajo de un mecánico que trabajase sin una llave inglesa?, ¿debería cobrar más un arquitecto que trabajase sin planos? Las memorias de traducción son una herramienta útil de la que no se debe prescindir ni por supuesto pagar menos por utilizarla. ¿No deberíamos, a caso, cobrar más por todo el esfuerzo antes mencionado que conlleva configurar una memoria efectiva? Pero la realidad es mucho más amarga. Aunque todo depende del cliente para el que se traduzca, por lo general, los segmentos del nuevo texto que tengan una coincidencia exacta en las memorias, no se cobran. El resto de coincidencias también desgravan en mayor o menos medida sobre el cargo total de la traducción. Y esto es algo que ya está establecido. Así pues, ¿deberíamos crear nosotros, el gremio de traductores, distintas tarifas de cobro a los diferentes clientes?, ¿deberíamos establecer las tarifas  más altas a aquellos clientes nuevos en concepto de «creación de Memorias de Traducción», otra igualmente alta pero más reducida para aquellos clientes con una Memoria ya creada pero insuficiente en concepto de «desarrollo», y así ir rebajando la tarifa hasta los clientes habituales a los cuales se cobraría las tarifas ordinarias, manteniendo siempre un pago extra en concepto de «mantenimiento de Memorias»? Sin lugar a dudas, estas tarifas subsanarían el problema causado por los segmentos infracotizados.

 
Otra línea de enfrentamiento es la relativa a la posesión legítima de las memorias. Los clientes afirman que les pertenecen a ellos y que forman parte de su propiedad intelectual. Los traductores, obviamente opinan lo contrario. En este caso, mi opinión es muy clara: ya que los textos de la lengua origen han sido cedidos a los traductores para que realicen con ellos su tarea y parte de su tarea incluye constituir memorias de traducción, sería totalmente lícito el aprovechamiento de los segmentos como segmentos independientes que entre sí no conforman un texto,  y no como texto cohesionado, gozando así de derecho de usufructo. Por otra oparte, los textos en lengua meta han sido producidos por el traductor, por lo que la propiedad intelectual de estos textos traducidos también les pertenece.

*Bibliografía

-Translation memory system
-Memorias de traducción en TMX compartidas por Internet, Joseba Abaitua, Universidad   de Deusto (http://www.fti.uab.es/tradumatica/revista/)
-www.linguee.com

No hay comentarios:

Publicar un comentario