Traducción e informática: Proyecto Omega T. Traducción asistida por ordenador y otros métodos de traducción.(II)

2. Desarrollo del proyecto con Omega T

Sin más dilación, queremos presentar la primera parte de nuestro proyecto: la traducción con Omega T. Una vez descargado e instalado el programa (en nuestro caso la versión 2.3.0_3), podemos empezar con nuestro trabajo. La primera vez que abrimos el programa, encontramos una guía rápida para el usuario que conviene leer, ya que contiene información sobre diversos temas, a saber: introducción a Omega T, guía de inicio rápido, introducción a la interfaz del usuario, explicación de los menús y de los comandos, información sobre el uso del traductor automático integrado y del corrector ortográfico, etc. A esta información se puede volver siempre que uno quiera pulsando F1 o desde Ayuda>Manual de usuario.

Así, una vez que queremos iniciar nuestro proyecto nos dirigimos a Proyecto>Nuevo, momento en el que elegiremos la ubicación de nuestro proyecto. Una vez elegida su ubicación, nos encontraremos con una nueva pantalla en la que se nos pedirán los idiomas de trabajo, el del texto original y el del texto meta. Asimismo, encontraremos la opción de Segmentar a nivel de frase, seleccionada por defecto. Es preferible no modificarla, ya que las búsquedas de coincidencias en las memorias de traducción resultarían mucho menos efectivas. Sin embargo, sí es conveniente modificar la configuración de la segmentación, con la finalidad de segmentar de manera acorde al idioma del texto origen en algunas construcciones rígidas. Para seleccionar dicho idioma, sólo hay que pinchar sobre él en la lista y pulsar Subir hasta colocarlo en primer lugar de preferencia. También es posible eliminar aquellos patrones que no nos interesen. En la misma pantalla en la que nos encontrábamos, también se acepta la creación automática de cinco subcarpetas dentro del proyecto: source, target, glossary, tm, y omegat (aunque esta última no aparece en la imagen). De momento, todas estas carpetas se encuentran vacías. Para volver a abrir el proyecto en el que estamos trabajando seleccionamos Proyecto>Abrir.

Así, el siguiente paso consiste en seleccionar el texto origen que se va a traducir. Este texto puede importarse desde cualquier dominio de MediaWiki o bien importar el archivo fuente. Omega T soporta los siguientes archivos:

-Textos planos (es decir, únicamente texto, sin información de formato):

·Texto ASCII (*.txt, etc.)

·Texto codificado (*.UTF8)

·Paquetes de recursos Java (*.properties)

·Archivos PO (*.po)

·Archivos INI (clave=valor) (*.ini)

·Archivos DTD (*.DTD)

·Archivos DocuWiki (*.txt)

-Textos con formato (tras configurar los filtros de los archivos)

·OpenOffice.org / OpenDocument (*.ods, *.ots, *.odt, *.ott, *.odp, *.otp)

·Microsoft Office Open XML (*.docx, *.dotx, *.xlsx, *.xltx, *.pptx)

· (X)HTML (*.html, *.xhtml,*.xht)

·Compilador de ayuda HTML (*.hhc, *.hhk)

·DocBook (*.xml)

·XLIFF (*.xlf, *.xliff, *.sdlxliff) - monolingüe, es decir, una posible combinación de idioma por proyecto.

·QuarkXPress CopyFlowGold (*.tag, *.xtg)

·Archivos de títulos subRip (*.srt)

·Archivos ResX (*.resx)

·Recurso Android (*.xml)

·LaTex (*.tex, *.latex)

·Archivos de ayuda (*.xml) y (*.hmxp)

·Typo3 LocManager (*.xml)

·Localización WiX (*.wxl)

·Iceni Infix (*.xml)

·Flash XML export (*.xml)

De esta manera, una vez que la importación del proyecto sea aceptada, aparecerá un cuadro estadistico previo que informa de la cantidad de segmentos. No obstante, también existe la opción de cargar el texto origen copiándolo en la carpeta Source de nuestro proyecto, aunque se tendrá que volver a cargar el proyecto para empezar a trabajar con él (Proyecto>Volver a cargar, o pulsando F5). Para poder trabajar con mi texto, extraído de Internet, lo he copiado a Word y lo he guardado sin formato, para que OmegaT pueda abrirlo ya que como hemos visto, a diferencia de otros gestores de memorias, no soporta documentos Word.

2.1. Puesta a punto del proyecto. Herramientas básicas: memorias de traducción, glosario terminológico y diccionarios

Las memorias de traducción, el glosario terminológico y los diccionarios son las herramientas clave que van a determinar el uso de este programa que analizamos. Contar con estas tres utilidades de manera previa a la traducción es primordial para el correcto desarrollo de nuestra tarea. Así pues, conozcamos cómo importarlos a nuestro proyecto, gestionarlos durante su uso y prepararlos para usos posteriores. Veamos estos pasos con detenimiento:

Como sabemos, una memoria de traducción es una base de datos en la cual se almacena contenido de segmentos originales y traducidos, y es, de hecho, la herramienta que caracteriza a los programas de traducción asistida por ordenador. El uso de esta herramienta evita tener que traducir segmentos anteriormente traducidos. Como ya señalamos en entradas anteriores (http://iatpaula-f.blogspot.com/2011/11/mt-internet-y-polemica.html), hay muchos criterios por lo que se pueden crear nuevas bases de datos, pero los dos más comunes son por tipo de texto y por tipo de cliente, opción que hemos elegido para este proyecto. Así pues, hemos seleccionado una memoria de traducción sobre la malaria, memoria que hemos importado a la carpeta mt de nuestro proyecto. Este paso es tan simple como copiarla desde su ubicación y pegarla en su lugar de destino (susodicha carpeta).

Quizás, lo más problemático de este proceso sea poder abrir esa memoria de traducción, ya que por lo general estas bases de datos suelen encontrarse en formato TMX (Translation Memory eXchange). En caso de que tu ordenador no te permita abrirla, es conveniente descargar el programa NotePad++, que se puede realizar de manera gratuita desde http://notepad-plus-plus.org/. Con este programa se pueden abrir las bases de datos con dicha extensión, así como modificarlas, o realizar búsquedas léxicas, entre otras muchas acciones. Así mismo, podemos aunar varias memorias de traducción en una sola si copiamos el contenido de una y lo incluimos en la otra (aunque habría que valorar la funcionalidad de esta acción).

Una vez importada la MT a nuestro proyecto, podemos hacer una valoración previa del estado de nuestra traducción, para así calcular el tiempo y el presupuesto. Esta opción se encuentra en Herramientas>Estadísticas de coincidencias. Por otra parte, en Herramientas>Estadísticas podemos leer un análisis detallado de nuestro encargo, con el número total de segmentos, palabras y caracteres.

Como vemos, el número de coincidencias en nuestro trabajo es mínimo, debido al carácter más divulgativo que científico del texto origen y a la especificidad técnica de la memoria de traducción. Si se dispone de más memorias de traducción, en este momento podemos plantearnos si aunarlas lograría un efecto positivo en nuestra traducción.

Por otra parte, existe un aspecto importante relativo a las memorias de traducción el cual se refiere a su actualización: cada segmento es susceptible de ser guardado en la memoria con la que actualmente trabajamos para recuperarlo en un nuevo proyecto posterior; únicamente hace falta saber exportarlo a la memoria, donde quedará grabado. Este proceso se puede realizar de manera manual copiando el formato en la memoria de traducción y añadiendo la nueva coincidencia, o a través de Editar>Exportar selección. No debemos olvidar que a medida que utilizamos este programa se crea de manera automática una MT con los segmentos de el proyecto en concreto, aunque esto se detallará posteriormente.

Por su parte, las bases de datos terminológicas contienen entradas de términos en varios idiomas, que se muestran como equivalentes, lo que nos ahorra tiempo ya que no tenemos que desatar laboriosas búsquedas terminológicas. La creación de un glosario terminológico es muy sencilla, yo misma he creado una para este proyecto. Con el programa Bloc de notas se escribe el primer término en la lengua origen, se separa por una tabulación y se inserta su equivalente en el otro idioma. Si se desea añadir comentarios, sólo hace falta añadir una tabulación más antes de escribirlos. No hay que olvidarse de añadirle la extensión .tab, y de guardarlo con la codificación UTF-8. Estos dos pequeños detalles marcarán la diferencia entre que tu glosario pueda ser leído completamente o no.

Debido a la brevedad del texto, crear este glosario no ha conllevado mayores dificultades, pero cuando la extensión de éste es mayor, el vaciado terminológico puede resultar una tarea muy ardua. Para estas ocasiones se prefiere contar con un extractor terminológico automático. Aunque muchos de estos programas todavía se encuentran en la fase beta o son de pago, podemos encontrar algunos recursos en línea que nos ayuden a hacer frente a esta tarea. De esta manera, Lingo 4.0 es un sistema de gestión terminológica para Windows, que crea diccionarios y glosarios monolingües y bilingües. Aunque la adquisición de este programa no es gratuita (cuesta alrededor de 80€), se puede descargar una versión de prueba, válida durante 30 días, cuya interfaz está en inglés. Puedes descargarlo desde la página de lexicool, http://www.lexicool.com/soft_lingo2.asp?IL=3. Más válido todavía es Lexterm, que cuenta con un sistema multiplataforma válido para GNU/Linux, MS Windows y MacOS, con interfaces en inglés y catalán, aunque debemos contar con un corpus bilingüe.

Una vez que tenemos preparado nuestro glosario, el siguiente punto es incorporarlo al proyecto. Para esto, copiaremos el archivo que contiene el fichero preparado, y lo pegaremos en la subcarpeta glossary de nuestro proyecto.

En consonancia con el punto anterior, sigue siendo igualmente cierto que mantener al día los glosarios terminológicos también es un asunto de extrema importancia. Al igual que podíamos exportar las memorias de manera manual y automática, el glosario terminológico también puede ser modificado desde el mismo archivo, con las tabulaciones anteriormente explicadas, o mediante la ruta Editar>crear entrada en el glosario, donde también se habilita un espacio para insertar comentarios.

Finalmente, los diccionarios han de basarse en la plataforma Stardict y se deben incluir en la carpeta Dictionary. Es posible añadir tantos como se quiera, monolingüe o bilingüe. Para este proyecto he descargado la versión 3.2.1 desde la página www.stardict.org. Al igual que en las ocasiones anteriores, sólo hace falta importarlo a la carpeta correspondiente para comenzar a usarlo.

2.2. Trabajar con Omega T

En este momento en el que ya tenemos importado tanto el texto sobre el que vamos a trabajar como las herramientas que vamos a emplear, podemos comenzar a traducir plenamente.

La pantalla aparece dividida en dos grandes cuadros. En uno aparece el texto segmentado; el otro, por configuración personalizada, se divide en tres cuadros horizontales, que corresponden a «coincidencias parciales», «glosario» y «diccionario». En cualquier momento podemos minimizar estos cuadros, que aparecerán en la de herramientas barra inferior, donde actualmente se localiza el traductor automático.

Seleccionemos ahora el primer segmento de nuestra traducción. Lo primero que observamos es que al seleccionar cualquier segmento, este se colorea en verde y los términos que aparecen en el glosario, se subrayan en azul de manera automática. Asimismo, Omega T nos ofrece las coincidencias que encuentra en la base de datos y de manera paralela, las entradas terminológicas que se encuentran en dicho segmento. En caso de localizar más de una coincidencia parcial, como nos ocurre con este segmento, el programa nos las ordena por el parecido (expresado en tanto por ciento). Para insertar la coincidencia, sólo tenemos que pulsar CTRL+I, o bien Editar>Instertar coincidencia. La diferencia entre esta opción y la de «Reemplazar con coincidencia» (CTRL+R) es que mientras que la primera sólo inserta esa coincidencia (tantas veces como se quiera) y no modifica nada más, al elegir «reemplazar» se reemplaza todo el segmento, incluso lo anteriormente traducido.

Cuando ya hemos completado el segmento y queremos movernos al siguiente, sea cual sea, podemos hacerlo de manera manual haciendo «click» sobre el nuevo segmento, o podemos avanzar pulsando CTRL+N ó Dirigirse a>Nuevo segmento. Imaginemos ahora que nos enfrentamos a un texto mucho más amplio con mucha más cantidad de segmentos, que los siguientes ya están traducidos y que no sabemos cuál es el que tenemos que traducir ahora. En ese caso podemos pulsar CTRL+U, que nos llevará directamente al próximo segmento cuya traducción no haya sido tratada. Omega T es consciente de la monotonía gráfica que puede suponer tener un texto segmentado y las dificultades que esto puede conllevar. Por eso, dispone de una serie de opciones de marcado, para que identificar los segmentos, tantos los traducidos como los no traducidos, los originales y los meta, las repeticiones internas, etc. sea mucho más fácil. Para maquetarlo de esta manera, sólo tenemos que acceder al menú Ver. Podemos elegir marcar los segmentos traducidos, que aparecerán en color amarillo; los segmentos no traducidos, que aparecerán en color azul; y podemos hacer aparecer los segmentos originales que desaparecen una vez se ha completado su traducción. Éstos aparecen señalados en negrita y coloreados en verde.

A medida que vayamos avanzando en nuestro proyecto es conveniente ir guardándolo (Proyecto>Guardar; CTRL+S), a pesar de que éste se guarda automáticamente cada cierto tiempo en la carpeta Omegat, donde a modo de memoria de traducción se guardan todos los segmentos originales junto con su traducción. De la misma manera, al cursar la ruta Proyecto>Crear documento final (CTRL+D) se crea en la carpeta target el documento final, que acogerá el mismo formato que el texto de origen. Para comprobar cómo se está desarrollando el documento final, tan sólo hay que acceder a ella desde la carpeta del proyecto. El documento que se crea es modificable y susceptible convertido a otro formato. En este momento del proyecto, todas las carpetas que creamos al principio del proyecto ya tienen contenido.

2.3. Otras utilidades y comandos

●Insertar una coincidencia entre varias a elegir. Cuando en la memoria de traducción aparece más de una coincidencia, es posible elegir la que se va a insertar a partir de la ruta Editar>Seleccionar coincidencia # (número de coincidecia) o, mediante CTRL+ número de coincidencia. Es decir, si quisiéramos insertar la tercera coincidencia, cursaríamos el siguiente recorrido: Editar>Seleccionar coincidencia #3, o, CTRL+3. De esta manera ya la tenemos elegida como coincidencia a insertar, y para insertarla finalmente tan sólo hay que proceder como anteriormente hemos explicado, CTRL+I, o bien Editar>Instertar coincidencia.

●Incorporar traducciones generadas automáticamente. Omega T 2.3.0_3 permite trabajar con una serie de traductores automáticos: Google Translate, Google Translate v2, Apertium y Belezar. Su selección no es exclusiva, ya que se puede trabajar con todos ellos a la vez; los resultados aparecen en la barra Traductor Automático. Este recuadro aparece minimizado en nuestra interfaz personalizada, debido a que este recurso no se ha explotado para este proyecto, ya que más adelante compararemos las traducciones que resultan, de una parte de este proyecto gestionado con Omega T, y de la otra, de una traducción realizada por Google Translate. Para insertar el segmento resultante de esta herramienta hay que pulsar CTRL+M, o Editar>Reemplazar con traducción automática.

●Umbral de sensibilidad. Se refiere al porcentaje de similitud que tiene que registrar una coincidencia de la memoria de traducción para que sea tratada como una coincidencia parcial. En anteriores entradas de este blog ya hemos explicado las ventajas y desventajas que se producen al variar dicho porcentaje (http://iatpaula-f.blogspot.com/2011/11/mt-internet-y-polemica.html). A esta opción se accede desde Opciones>Comportamiento del campo de edición. En esta misma pestaña también puede seleccionarse cómo preferimos que se visualice en los segmentos que aún no se han traducido: vacíos o con el texto original.

●Subrayar las palabras con equivalente en el glosario. Habilitando las opciones del menú Opciones>Consejos de traducción, se subrayan, en el segmento seleccionado, las palabras que tienen entrada en nuestro glosario terminológico. Asimismo, al cursar sobre ellas y pinchar el botón derecho aparece la opción de insertar automáticamente ese término

●Búsqueda interna en el proyecto. Al igual que en la mayoría de las aplicaciones, el comando CTRL+F permite una búsqueda semántica dentro del cuerpo del texto. En este caso, la búsqueda semántica incluye opciones más restrictivas, como por ejemplo, acotar la búsqueda a palabras claves, a palabras exactas o en los distintos textos en los que se quiere buscar. La pestaña «Opciones Avanzadas» acota todavía más la búsqueda por autor, fecha, y número máximo de coincidencias que quieres encontrar. Otra ruta posible para llegar es desde Editar>Buscar en el proyecto

●Correción ortográfica. Mediante la herramienta «corrector ortográfico» es posible revisar la ortografía en nuestro proyecto. Requiere una instalación previa, que puede descargarse desde www.softonic.com. Sólo admite archivos con extensión .dic y .aff. Para cada idioma al que se traduzca se necesita un corrector ortográfico relativo a tal idioma. Existe la posibilidad (no marcada por defecto) de comprobar la ortografía automáticamente. Para habilitarla debes acudir a Opciones>Revisión ortográfica. Esta herramienta trabaja de manera muy cercana al diccionario ya que si una palabra es marcada como incorrecta, se aportan palabras semejantes extraídas desde el diccionario. Asimismo, es posible añadir esa palabra «incorrecta» al diccionario.

1 comentario:

Unknown21 de febrero de 2014 a las 7:46
He estado trabajando con esta herramienta de traducción : https://poeditor.com/ y lo que realmente hace un gran trabajo. Soporta un gran número de traductores en el mismo proyecto, trabajando en diferentes idiomas. También trabaja con archivos de Excel. Se lo recomiendo.
ResponderEliminar
Respuestas

Añadir comentario

martes, 3 de enero de 2012

Proyecto Omega T. Traducción asistida por ordenador y otros métodos de traducción.(II)

1 comentario: