miércoles, 4 de enero de 2012

Proyecto Omega T. Traducción asistida por ordenador y otros métodos de traducción (VI)


6 .Bibliografía

-QUAH, C.K. Translation and Technology. Textbooks in translation and interpreting
-CLIMENT, Salvador; MORÉ, Joaquín; OLIVER, Antoni. Traducción y tecnología. UOC
- HUTCHINS, W. John y SOMERS, Harold, L. 1992. An Introduction to Machine Translation. London: Academic Press

- http://www.omegat.org
-http://www.opentranslation.es
- http://www.traducciónymundolibre.com

martes, 3 de enero de 2012

Proyecto Omega T. Traducción asistida por ordenador y otros métodos de traducción (V)



5. APÉNDICE: TEXTO ORIGEN

In the long fight against malaria, progress finally seems to be coming, if incrementally. The number of people who died from malaria in 2010 fell 5 percent from the previous year and has dropped 26 percent from 2000 levels, according to anew World Health Organization (WHO) report.

The decline might seem modest given the $2 billion that has been given to fight the disease in the past year. But even this small most recent dip suggests that “investment inmalaria control brings results,” Margaret Chan, director-general of the WHO, said in a statement.

The parasitic disease killed approximately 655,000 people in 2010, most of whom were children under the age of 5. The preponderance of malaria cases is still in Africa, where people are also more likely to succumb to the disease.

Although treatment via artemisinin-based combination therapies (ACTs) has greatly helped to bring the number of deaths down worldwide, Chen and others are worried by cases of artemisinin resistance reported in the past few years. With quick and cheap diagnostic tests now more widespread, the WHO recommends that no one receive malaria drugs without a test. And because the parasite can quickly develop resistance to a single drug, Chan says all monotherapies should be taken off the market.

“The estimated yearly number of malaria cases, though declining, is still 223 million,” she said. “That would be a huge and totally unacceptable number of people to be left with no effective treatment.”

Even with effective available therapies, the WHO failed to meet the goal of 50 percent decline in deaths between 2000 and 2010. And it seems to have a battle ahead if it hopes to meet the target of ending all deaths from malaria by 2015.

Proyecto Omega T. Traducción asistida por ordenador y otros métodos de traducción (IV)


4. Conclusiones: Comparación y crítica


En este apartado nos gustaría hacer un pequeño comentario sobre lo que ha supuesto trabajar con Omega T como herramienta de traducción asistida por ordenador, y de la misma manera la experiencia con Google Translate como programa de traducción automática asistida, aportando las ventajas y desventajas que aportan comparación de la traducción tradicional.

Para comenzar, diremos que desde bajo nuestro punto de vista, trabajar con una herramienta como Omega T requiere una inversión de tiempo que se amortiza, suponemos, con el uso. Son muchos los programas que se necesitan para poder sacar máximo rendimiento a todas las utilidades que este tipo de software ofrece.  Aunque en nuestro caso ya contábamos con una MT que incorporamos al proyecto, necesitamos descargar muchas otras aplicaciones, empezando por un lector de MT que nos permitiera hacer uso de ellas, diccionarios monolingües y bilingües, extractores terminológicos, correctores ortográficos, etc. Cada programa implica no solo su descarga, sino también el tiempo que empleamos en encontrarlo, en configurarlo y sobre todo, en aprender a usarlo. De entre todos los programas descargados, Omega T es el que más tiempo requiere para comprender su funcionamiento, ya que es necesario investigar cada una de las opciones para comprobar los resultados exactos que ofrece. El manual de usuario que Omega T integra es demasiado extenso, y en ocasiones poco clarificador. Sin embargo, no dudamos de lo crucial que resulta la descarga de dichas aplicaciones, ya que hemos podido comprobarlo a lo largo del trabajo.

Por otra parte, creemos que la interfaz de Omega T puede pecar de ser demasiado simple. Si bien es cierto que poder personalizar la interfaz es un punto muy positivo, y que la claridad en ocasiones resulta gratificante, echamos de menos iconos como puedan ser los de añadir pares terminológicos o segmentos a las bases de datos correspondientes o algún otro tipo de acceso directo como los que se pueden encontrar en Déjà vu. El hecho de que todas las opciones y herramientas estén integradas en la barra de herramientas, crea la necesidad de recorrer todo el menú, pudiendo ocasionar problemas de memorización de ruta al comienzo del uso, mientras que de la otra manera, con accesos directos, utilizar la herramienta es mucho más rápido y fácil de memorizar el acceso gráficamente.

Como puntos positivos, resaltamos la creación automática de la memoria de traducción integrada en el propio proyecto. Ya que posteriormente es posible unificar las memorias y ampliarlas no sólo por proyecto sino por tema, no dudamos de la coherencia interna de las traducciones que se acaba logrando, ni tampoco de la gestión y ahorro de tiempo que finalmente se consigue y de las mejoras que esto supone frente a una traducción convencional. (http://iatpaula-f.blogspot.com/2011/11/mt-internet-y-polemica.html)

De la misma manera, nos resultan especialmente atractivas las opciones de búsqueda integradas que permiten no sólo buscar en el archivo sobre el que se trabaja sino también sobre las distintas memorias, con distintos parámetros de búsqueda.


En cuanto al análisis de Google Translate como traducción automática asistida, concluimos que, una vez más, la efectividad de este tipo de herramientas es muy reducida. El texto que hemos introducido no contaba con dificultades léxicas que pudieran depender del tipo de texto (en un texto literario encontraremos más dificultades de este tipo que en uno técnico), y sin embargo ha seguido fallando en cuestiones simples de concordancia cuando el espacio entre los elementos relacionados era algo mayor de lo esperado. Por otra parte, falta trabajo en la base de datos, ya que las cuestiones ortotipográficas en las que falla son simples elementos algorítmicos no adaptados. Por supuesto, hace falta solucionar el problema de los espacios al que antes nos referíamos.

Todo esto simplemente significa algo que ya conocíamos de antemano: la traducción asistida es sólo un elemento de ayuda al traductor, pero que en ningún caso ha de reemplazarle, ya que es éste  quien realiza la función profesional de la traducción y sobre el que recaen todas las responsabilidades. Un programa de traducción automática no ofrece los segmentos ya traducidos de manera previa por un traductor profesional, sino que traduce de manera algorítmica y porcentual todas las oraciones de un texto, sin un conocimiento lingüístico del texto, sin una comprensión textual, ni conocimiento enciclopédico.


Para aprovechar las ventajas que un traductor automático puede ofrecernos, debemos conocer a priori sus limitaciones, que en reglas generales afectan, como hemos visto, al estilo y a la inteligibilidad; aunque en otros niveles puede afectar también a la precisión y a la fidelidad. Este método de trabajo implica una serie de requisitos, como que las oraciones sean cortas y que, en la medida de lo posible, estén expresadas en un lenguaje controlado. De la misma manera también implica que las tareas de revisión (anterior y posterior) relativas a la gramática, al léxico y al estilo, se alarguen en tiempo y atención a la calidad.  Tal y como hemos podido comprobar en el desarrollo de esta investigación,  en muchas ocasiones, el producto es tan incomprensible que hace falta recurrir al texto origen para comprender la solución facilitada y ver dónde se han cometido los fallos. Una vez más, y esta de forma definitiva, descartamos los traductores automáticos como una solución traductológica única viable.

Es cierto, sin embargo, que existen varios tipos de traductores automáticos, y que algunos como los sistemas «con conocimiento lingüístico» son capaces de generar traducciones acordes a reglas sintácticas sencillas, que solventarían algunas de las erratas cometidas por el traductor automático que hemos utilizado para este proyecto. Personalmente, no consideramos que este tipo de programas vayan a ser investigados y desarrollados tanto como lo fueron en los años 50 y 60 del siglo anterior, pero que probablemente tampoco van a dejar de utilizarse debido a las ventajas (como la producción de grandes cantidades de textos traducidos en poco tiempo) que pueden aportar con un factor humano tras ellas. Desde mi punto de vista, si a los traductores automáticos pudieran agregarse bases y datos, glosarios terminológicos y por supuesto, se resolvieran los problemas algorítmicos de los que antes hablábamos, se mejoraría notoriamente la calidad de los textos. Sería igualmente fructífero, que en los programas de traducción asistida fuera posible incorporar la opción de modificar el umbral de sensibilidad de coincidencias, con el objetivo de insertar la traducción generada automáticamente a un nivel porcentual en el que la coincidencia parcial encontrada en la base de datos pudiera resultar infructuosa, de manera que tampoco se creara ruido documental. Otra solución que ya se puede contemplar en algunos de estos programas de traducción asistida como el que hemos utilizado es insertar la traducción automática para aquellos segmentos en los que no se tengan coincidencias en la base de datos. En nuestro proyecto no se utilizó esa opción debido a que el porcentaje de coincidencias en la base de datos era muy bajo, por lo que en la mayoría de los segmentos hubiera aparecido la traducción automática, conllevando las tareas de preedición y pos-edición que hemos explicado y explotado en la segunda parte del proyecto que se basaba en el trabajo con un traductor automático.

 Sin embargo, desde un punto de vista personal, creo resulta mucho más gratificante elaborar una traducción de manera manual que automática, ya que aporta conocimiento y experiencia al traductor, y  a la vez que produce satisfacción cuando el producto está terminado. De la misma manera, una traducción manual decente, siempre contará con unos niveles mínimos  de corrección de gramatical y estilística, coherencia interna y tanto conocimiento enciclopédico como posea el traductor.

Proyecto Omega T. Traducción asistida por ordenador y otros métodos de traducción (III)


3. Comparación Omega T como asistente de traducción y Google Translate como traductor automático

En numerosas ocasiones hemos tratado el tema de la traducción automática y, tras numerosos intentos, la hemos descartado como  modelo de traducción adecuada. Sin embargo, ¿podría llegar a ser adecuada una traducción tras una revisión humana?, es decir, ¿qué pasaría si una traducción automática fuera asistida por el traductor?, ¿obtendría los mismos resultados que una traducción humana asistida por ordenador? En este apartado, nos disponemos a verificar la calidad que subyace de estos dos modelos de traducción: traducción asistida por ordenador (Machina-aided human translation) y traducción automática asistida (por traductor) (Human-aided machine translation). Para esta comprobación utilizaremos Omega T y Google Translation, elegido por ser el que mejores resultados nos ofreció en una de nuestras comprobaciones anteriores(http://iatpaula-f.blogspot.com/2011/11/machine-trynslations.html) y por poder modificar el texto meta en el mismo cuerpo de texto.

Una traducción automática asistida es aquella en la que el ordenador es el responsable de producir la traducción per se, pudiendo interaccionar con un revisor humano en muchos puntos a lo largo del proceso. (Slocum 1988:5).

 En otras palabras, este proceso se opone a la mera traducción automática, ya que no se basa exclusivamente en la lingüística computacional, sino que el proceso está asistido por un traductor en las llamadas etapas de «preedición» y «pos-edición».  En la etapa de preedición, el traductor se encarga de encontrar elementos que puedan crearle problemas al traductor automático, como modismos, fraseologismos, etc. Durante la fase de pos-edición el traductor revisa la traducción generada automáticamente, para amoldar el texto a unos ciertos estándares de estilo y uso apropiado de los términos. Existen por supuesto softwares de traducción automática asistida, pero ya que no contamos con ninguno de ellos, vamos a realizar la tarea de traducción mediante el traductor automático ya mencionado, preeditando y pos-editando manualmente, es decir, detectando posibles errores a priori para tenerlos en cuenta en la etapa de pos-edición del producto. Este tipo de softwares, trabajan con un número de lenguas origen muy reducidas, aquellas que cuentan con reglas gramaticales muy rígidas y un vocabulario «fácil de procesar», es decir, en el que no abundan procesos semánticos como sinonimia, polisemia, homonimia, etc. Somos conscientes de que el español no es una de estas lenguas; sin embargo, al tratarse de un  artículo que lidia con lengua de especialidad, la gramática, por las características intrínsecas a este tipo de lenguaje, es más rígida, así como los fenómenos semánticos antes citados se ven cuantiosamente reducidos.
           
            Procedemos así a la traducción de nuestro texto origen mediante el traductor automático.


3.1. Análisis de resultados.

En la etapa de preedición se ha procedido a una lectura del texto origen, detectando aquellos puntos que pudieran suponer un problema para el traductor o algo que tener en cuenta para la traducción. Así, se observaron algunos asuntos sintácticos y de estilo (uso de pasivas) y cuestiones ortotipográficas (uso de comillas americanas y emplazamiento de signos de divisas) que se han anotado y tenido en cuenta. No constan más problemas sintácticos ni semánticos como pudieran ser pequeñas metáforas, ni cuestiones de algún otro tipo.

            En la pos-edición se revisó la traducción ofrecida por el software de Google. Los pronósticos de fallo se han cumplido: las normas ortotipográficas han sido violadas y no se han producido mejoras estilíticas, respetando la sintaxis del texto original. Por otra parte, se han producido otras incorrecciones que podían llegar a esperarse, como la mala concordancia entre sujeto y verbo, o la concordancia de género incorrecta:
«Chan dice que todas las monoterapias debe ser retirado  del mercado (…)»
●«El descenso puede parecer modesta (…)»
           
            Asimismo se originan otros problemas más graves que conciernen al espectro gramatical: de una parte, las omisiones son frecuentes, originando frases agramaticales. De otra, la reordenación de los elementos resulta en una sintaxis impropia del español y que además difiere del mensaje del texto de origen. Podemos además comprobar los calcos léxicos que sufre nuestro texto meta.
«Aunque el tratamiento a través de terapias de combinación basadas en la artemisinina (TCA) ha ayudado mucho a que el número de muertes por todo el mundo, Chen y otros están preocupados por los casos de resistencia a la artesinina reportados en los últimos años.»
● « “Eso sería un gran número y totalmente inaceptable de las personas que se quedaron sin un tratamiento efectivo” (…)».

De la misma manera, encontramos que el estilo es pobre, muy pegado al texto origen y sin apenas adaptaciones.
●« el progreso por fin parece que puede venir, si de forma incremental (…)»
●« La enfermedad parasitaria mató aproximadamente a 655.000 personas en 2010 (…)».

Por otra parte, nos sorprende un error que se repite en toda la extensión del texto, y se trata de la omisión de los espacios entre palabras. A este error no encontramos una posible justificación, ya que si hay algo paralelo en los dos textos, es sin duda, el espacio que separa las palabras.
● «El número depersonas que murieron de malaria en el 2010 cayeron un 5 porciento respecto al año anterior y se ha reducido un 26 por cientode los niveles de 2000, según la Organización Mundial de la Salud de nuevo (OMS)».
         

Proyecto Omega T. Traducción asistida por ordenador y otros métodos de traducción.(II)


2. Desarrollo del proyecto con Omega T

Sin más dilación, queremos presentar la primera parte de nuestro proyecto: la traducción con Omega T. Una vez descargado e instalado el programa (en nuestro caso la versión 2.3.0_3), podemos empezar con nuestro trabajo. La primera vez que abrimos el programa, encontramos una guía rápida para el usuario que conviene leer, ya que contiene información sobre diversos temas, a saber: introducción a Omega T, guía de inicio rápido, introducción a la interfaz del usuario, explicación de los menús y de los comandos, información sobre el uso del traductor automático integrado y del corrector ortográfico, etc. A esta información se puede volver siempre que uno quiera pulsando F1 o desde Ayuda>Manual de usuario.

Así, una vez que queremos iniciar nuestro proyecto nos dirigimos a Proyecto>Nuevo, momento en el que elegiremos la ubicación de nuestro proyecto. Una vez elegida su ubicación, nos encontraremos con una nueva pantalla en la que se nos pedirán los idiomas de trabajo, el del texto original y el del texto meta. Asimismo, encontraremos la opción de Segmentar a nivel de frase, seleccionada por defecto. Es preferible no modificarla, ya que las búsquedas de coincidencias en las memorias de traducción resultarían mucho menos efectivas. Sin embargo, sí es conveniente modificar la configuración de la segmentación, con la finalidad de segmentar de manera acorde al idioma del texto origen en algunas construcciones rígidas. Para seleccionar dicho idioma, sólo hay que pinchar sobre él en la lista  y pulsar Subir hasta colocarlo en primer lugar de preferencia. También es posible eliminar aquellos patrones que no nos interesen. En la misma pantalla en la que nos encontrábamos, también se acepta la creación automática de cinco subcarpetas dentro del proyecto: source, target, glossary, tm, y omegat (aunque esta última no aparece en la imagen). De momento, todas estas carpetas se encuentran vacías. Para volver a abrir el proyecto en el que estamos trabajando seleccionamos Proyecto>Abrir.

 Así, el siguiente paso consiste en seleccionar el texto origen que se va a traducir. Este texto puede importarse desde cualquier dominio de MediaWiki o bien importar el archivo fuente. Omega T soporta los siguientes archivos:
-Textos planos (es decir, únicamente texto, sin información de formato):

·Texto ASCII (*.txt, etc.)
·Texto codificado (*.UTF8)
·Paquetes de recursos Java (*.properties)
·Archivos PO (*.po)
·Archivos INI (clave=valor) (*.ini)
·Archivos DTD (*.DTD)
·Archivos DocuWiki (*.txt)
           
            -Textos con formato (tras configurar los filtros de los archivos)
           
·OpenOffice.org / OpenDocument (*.ods, *.ots, *.odt, *.ott, *.odp, *.otp)
·Microsoft Office Open XML (*.docx, *.dotx, *.xlsx, *.xltx, *.pptx)
· (X)HTML (*.html, *.xhtml,*.xht)
·Compilador de ayuda HTML (*.hhc, *.hhk)
·DocBook (*.xml)
·XLIFF (*.xlf, *.xliff, *.sdlxliff) - monolingüe, es decir, una posible combinación de idioma por proyecto.
·QuarkXPress CopyFlowGold (*.tag, *.xtg)
·Archivos de títulos subRip (*.srt)
·Archivos ResX (*.resx)
·Recurso Android (*.xml)
·LaTex (*.tex, *.latex)
·Archivos de ayuda (*.xml) y (*.hmxp)
·Typo3 LocManager (*.xml)
·Localización WiX (*.wxl)
·Iceni Infix (*.xml)
·Flash XML export (*.xml)


De esta manera, una vez que la importación del proyecto sea aceptada, aparecerá un cuadro estadistico previo que informa de la cantidad de segmentos.  No obstante, también existe la opción de cargar el texto origen copiándolo en la carpeta Source de nuestro proyecto, aunque se tendrá que volver a cargar el proyecto para empezar a trabajar con él (Proyecto>Volver a cargar, o pulsando F5). Para poder trabajar con mi texto, extraído de Internet, lo he copiado a Word y lo he guardado sin formato, para que OmegaT pueda abrirlo ya que como hemos visto, a diferencia de otros gestores de memorias, no soporta documentos Word.





2.1. Puesta a punto del proyecto. Herramientas básicas: memorias de traducción, glosario terminológico y diccionarios

Las memorias de traducción, el glosario terminológico y los diccionarios son las herramientas clave que van a determinar el uso de este programa que analizamos. Contar con estas tres utilidades de manera previa a la traducción es primordial para el correcto desarrollo de nuestra tarea. Así pues, conozcamos cómo importarlos a nuestro proyecto, gestionarlos durante su uso y prepararlos para usos posteriores. Veamos estos pasos con detenimiento:

 Como sabemos, una memoria de traducción es una base de datos en la cual se almacena contenido de segmentos originales y traducidos, y es, de hecho, la herramienta que caracteriza a los programas de traducción asistida por ordenador. El uso de esta herramienta evita tener que traducir segmentos anteriormente traducidos. Como ya señalamos en entradas anteriores (http://iatpaula-f.blogspot.com/2011/11/mt-internet-y-polemica.html), hay muchos criterios por lo que se pueden crear nuevas bases de datos, pero los dos más comunes son por tipo de texto y por tipo de cliente, opción que hemos elegido para este proyecto. Así pues, hemos seleccionado una memoria de traducción sobre la malaria, memoria que hemos importado a la carpeta mt de nuestro proyecto. Este paso es tan simple como copiarla desde su ubicación y pegarla en su lugar de destino (susodicha carpeta).

 Quizás, lo más problemático de este proceso sea poder abrir esa memoria de traducción, ya que por lo general estas bases de datos suelen encontrarse en formato TMX (Translation Memory eXchange). En caso de que tu ordenador no te permita abrirla, es conveniente descargar el programa NotePad++, que se puede realizar de manera gratuita desde http://notepad-plus-plus.org/. Con este programa se pueden abrir las bases de datos con dicha extensión, así como modificarlas, o realizar búsquedas léxicas, entre otras muchas acciones. Así mismo, podemos aunar varias memorias de traducción en una sola si copiamos el contenido de una y lo incluimos en la otra (aunque habría que valorar la funcionalidad de esta acción).

Una vez importada la MT a nuestro proyecto, podemos hacer una valoración previa del estado de nuestra traducción, para así calcular el tiempo y el presupuesto. Esta opción se encuentra en Herramientas>Estadísticas de coincidencias. Por otra parte, en Herramientas>Estadísticas podemos leer un análisis detallado de nuestro encargo, con el número total de segmentos, palabras y caracteres.



Como vemos, el número de coincidencias en nuestro trabajo es mínimo, debido al carácter más divulgativo que científico del texto origen y a la especificidad técnica de la memoria de traducción. Si se dispone de más memorias de traducción, en este momento podemos plantearnos si aunarlas lograría un efecto positivo en nuestra traducción.

Por otra parte, existe un aspecto importante relativo a las memorias de traducción el cual se refiere a su actualización: cada segmento es susceptible de ser guardado en la memoria con la que actualmente trabajamos para recuperarlo en un nuevo proyecto posterior; únicamente hace falta saber exportarlo a la memoria, donde quedará grabado. Este proceso se puede realizar de manera manual copiando el formato en la memoria de traducción y añadiendo la nueva coincidencia, o a través de Editar>Exportar selección. No debemos olvidar que a medida que utilizamos este programa se crea de manera automática una MT con los segmentos de el proyecto en concreto, aunque esto se detallará posteriormente.

Por su parte, las bases de datos terminológicas contienen entradas de términos en varios idiomas, que se muestran como equivalentes, lo que nos ahorra tiempo ya que no tenemos que desatar laboriosas búsquedas terminológicas. La creación de un glosario terminológico es muy sencilla, yo misma he creado una para este proyecto. Con el programa Bloc de notas se escribe el primer término en la lengua  origen, se separa por una tabulación y se inserta su equivalente en el otro idioma. Si se desea añadir comentarios, sólo hace falta añadir una tabulación más antes de escribirlos. No hay que olvidarse de añadirle la extensión .tab, y de guardarlo con la codificación UTF-8. Estos dos pequeños detalles marcarán la diferencia entre que tu glosario pueda ser leído completamente o no.

 Debido a la brevedad del texto, crear este glosario no ha conllevado mayores dificultades, pero cuando la extensión de éste es mayor, el vaciado terminológico puede resultar una tarea muy ardua. Para estas ocasiones se prefiere contar con un extractor terminológico automático. Aunque muchos de estos programas todavía se encuentran en la fase beta o son de pago, podemos encontrar algunos recursos en línea que nos ayuden a hacer frente a esta tarea. De esta manera, Lingo 4.0 es un sistema de gestión terminológica para Windows, que crea diccionarios y glosarios monolingües y bilingües. Aunque la adquisición de este programa no es gratuita (cuesta alrededor de 80€), se puede descargar una versión de prueba, válida durante 30 días, cuya interfaz está en inglés. Puedes descargarlo desde la página de lexicool, http://www.lexicool.com/soft_lingo2.asp?IL=3. Más válido todavía es Lexterm, que cuenta con un sistema multiplataforma válido para GNU/Linux, MS Windows y MacOS, con interfaces en inglés y catalán, aunque debemos contar con un corpus bilingüe.

Una vez que tenemos preparado nuestro glosario, el siguiente punto es incorporarlo al proyecto. Para esto, copiaremos el archivo que contiene el fichero preparado, y lo pegaremos en la subcarpeta glossary  de nuestro proyecto.

En consonancia con el punto anterior,  sigue siendo igualmente cierto que mantener al día los glosarios terminológicos también es un asunto de extrema importancia. Al igual que podíamos exportar las memorias de manera manual y automática, el glosario terminológico también puede ser modificado desde el mismo archivo, con las tabulaciones anteriormente explicadas, o mediante la ruta Editar>crear entrada en el glosario, donde también se habilita un espacio para insertar comentarios.

Finalmente, los diccionarios han de basarse en la plataforma Stardict y se deben incluir en la carpeta Dictionary. Es posible añadir tantos como se quiera, monolingüe o bilingüe. Para este proyecto he descargado la versión 3.2.1  desde la página www.stardict.org. Al igual que en las ocasiones anteriores, sólo hace falta importarlo a la carpeta correspondiente para comenzar a usarlo.

2.2. Trabajar con Omega T

En este momento en el que ya tenemos importado tanto el texto sobre el que vamos a trabajar como las herramientas que vamos a emplear, podemos comenzar a traducir plenamente.

La pantalla aparece dividida en dos grandes cuadros. En uno aparece el texto segmentado; el otro, por configuración personalizada, se divide en tres cuadros horizontales, que corresponden a «coincidencias parciales», «glosario» y «diccionario».  En cualquier momento podemos minimizar estos cuadros, que aparecerán en la de herramientas barra inferior, donde actualmente se localiza el traductor automático.



Seleccionemos ahora el primer segmento de nuestra traducción. Lo primero que observamos es que al seleccionar cualquier segmento, este se colorea en verde y los términos que aparecen en el glosario, se subrayan en azul de manera automática. Asimismo, Omega T nos ofrece las coincidencias que encuentra en la base de datos y de manera paralela, las entradas terminológicas que se encuentran en dicho segmento. En caso de localizar más de una coincidencia parcial, como nos ocurre con este segmento, el programa nos las ordena por el parecido (expresado en tanto por ciento). Para insertar la coincidencia, sólo tenemos que pulsar CTRL+I,  o bien Editar>Instertar coincidencia. La diferencia entre esta opción y la de «Reemplazar con coincidencia» (CTRL+R) es que mientras que la primera sólo inserta esa coincidencia (tantas veces como se quiera) y no modifica nada más, al elegir «reemplazar» se reemplaza todo el segmento, incluso lo anteriormente traducido.



Cuando ya hemos completado el segmento y queremos movernos al siguiente, sea cual sea, podemos hacerlo de manera manual haciendo «click» sobre el nuevo segmento, o podemos avanzar pulsando CTRL+N ó Dirigirse a>Nuevo segmento. Imaginemos ahora que nos enfrentamos a un texto mucho más amplio con mucha más cantidad de segmentos, que los siguientes ya están traducidos y que no sabemos cuál es el que tenemos que traducir ahora. En ese caso podemos pulsar CTRL+U, que nos llevará directamente al próximo segmento cuya traducción no haya sido tratada. Omega T es consciente de la monotonía gráfica que puede suponer tener un texto segmentado y las dificultades que esto puede conllevar. Por eso, dispone de una serie de opciones de marcado, para que identificar los segmentos, tantos los traducidos como los no traducidos, los originales y los meta, las repeticiones internas, etc. sea mucho más fácil. Para maquetarlo de esta manera, sólo tenemos que acceder al menú Ver. Podemos elegir marcar los segmentos traducidos, que aparecerán en color amarillo; los segmentos no traducidos, que aparecerán en color azul; y podemos hacer aparecer los segmentos originales que desaparecen una vez se ha completado su traducción. Éstos aparecen señalados en negrita y coloreados en verde.



A medida que vayamos avanzando en nuestro proyecto es conveniente ir guardándolo (Proyecto>Guardar; CTRL+S), a pesar de que éste se guarda automáticamente cada cierto tiempo en la carpeta Omegat, donde a modo de memoria de traducción se guardan todos los segmentos originales junto con su traducción. De la misma manera, al cursar la ruta Proyecto>Crear documento final (CTRL+D) se crea en la carpeta target el documento final, que acogerá el mismo formato que el texto de origen. Para comprobar cómo se está desarrollando el documento final, tan sólo hay que acceder a ella desde la carpeta del proyecto. El documento que se crea es modificable y susceptible convertido a otro formato. En este momento del proyecto, todas las carpetas que creamos al principio del proyecto ya tienen contenido.


2.3. Otras utilidades y  comandos

Insertar una coincidencia entre varias a elegir. Cuando en la memoria de traducción aparece más de una coincidencia, es posible elegir la que se va a insertar a partir de la ruta Editar>Seleccionar coincidencia # (número de coincidecia) o, mediante CTRL+ número de coincidencia. Es decir, si quisiéramos insertar la tercera coincidencia, cursaríamos el siguiente recorrido: Editar>Seleccionar coincidencia #3, o, CTRL+3. De esta manera ya la tenemos elegida como coincidencia a insertar, y para insertarla finalmente tan sólo hay que proceder como anteriormente hemos explicado, CTRL+I,  o bien Editar>Instertar coincidencia.

Incorporar traducciones generadas automáticamente. Omega T 2.3.0_3 permite trabajar con  una serie de traductores automáticos: Google Translate, Google Translate v2, Apertium y Belezar. Su selección no es exclusiva, ya que se puede trabajar con todos ellos a la vez; los resultados aparecen en la barra Traductor Automático. Este recuadro aparece minimizado en nuestra interfaz personalizada, debido a que este recurso no se ha explotado para este proyecto, ya que más adelante compararemos las traducciones que resultan, de una parte de este proyecto gestionado con Omega T, y de la otra, de una traducción realizada por Google Translate. Para insertar el segmento resultante de esta herramienta hay que pulsar CTRL+M, o Editar>Reemplazar con traducción automática.

Umbral de sensibilidad. Se refiere al porcentaje de similitud que tiene que registrar una coincidencia de la memoria de traducción para que sea tratada como una coincidencia parcial. En anteriores entradas de este blog ya hemos explicado las ventajas y desventajas que se producen al variar dicho porcentaje (http://iatpaula-f.blogspot.com/2011/11/mt-internet-y-polemica.html). A esta opción se accede desde Opciones>Comportamiento del campo de edición. En esta misma pestaña también puede seleccionarse cómo preferimos que se visualice en los segmentos que aún no se han traducido: vacíos o con el texto original.

●Subrayar las palabras con equivalente en el glosario. Habilitando las opciones del menú Opciones>Consejos de traducción, se subrayan, en el segmento seleccionado, las palabras que tienen entrada en nuestro glosario terminológico. Asimismo, al cursar sobre ellas y pinchar el botón derecho aparece la opción de insertar automáticamente ese término


Búsqueda interna en el proyecto. Al igual que en la mayoría de las aplicaciones, el comando CTRL+F permite una búsqueda semántica dentro del cuerpo del texto. En este caso, la búsqueda semántica incluye opciones más restrictivas, como por ejemplo, acotar la búsqueda a palabras claves, a palabras exactas o en los distintos textos en los que se quiere buscar. La pestaña «Opciones Avanzadas» acota todavía más la búsqueda por autor, fecha, y número máximo de coincidencias que quieres encontrar. Otra ruta posible para llegar es desde Editar>Buscar en el proyecto



Correción ortográfica. Mediante la herramienta «corrector ortográfico» es posible revisar la ortografía en nuestro proyecto. Requiere una instalación previa, que puede descargarse desde www.softonic.com. Sólo admite archivos con extensión .dic y .aff. Para cada idioma al que se traduzca se necesita un corrector ortográfico relativo a tal idioma. Existe la posibilidad (no marcada por defecto) de comprobar la ortografía automáticamente. Para habilitarla debes acudir a Opciones>Revisión ortográfica. Esta herramienta trabaja de manera muy cercana al diccionario ya que si una palabra es marcada como incorrecta, se aportan palabras semejantes extraídas desde el diccionario. Asimismo, es posible añadir esa palabra «incorrecta» al diccionario.




Proyecto Omega T. Traducción Asistida por ordenador y otros métodos de traducción.


1. Introducción
2. Desarrollo del proyecto con Omega T
         2.1. Puesta a punto
         2.2. Trabajar con Omega T
         2.3. Otras utilidades y  comandos
3. Comparación Omega T como asistente de traducción y Google Translate como traductor automático
3.1. Análisis de resultados
4. Conclusiones
5. Apéndice: texto origen
6. Bibliografía

1. Introducción
             
Durante todos estos meses hemos estado tratando temas relacionados con la informática y los avances tecnológicos aplicados a la traducción y nos hemos dado cuenta de la importancia que adquieren a la hora de realizar nuestra tarea. En muchas ocasiones hemos hablado de los traductores automáticos y de sus particularidades; hemos criticado su funcionamiento y hemos comprobado sus limitaciones. Sin embargo, soy consciente de que a penas se han ofrecido alternativas a estos programas, alguna solución que nos ayude a gestionar el tiempo y nos facilite la traducción. Sin duda alguna, son los  programas de Traducción Asistida por Ordenador (TAO) los que pueden resolver estos problemas. Estos programas funcionan a partir de memorias de traducción y bases de datos terminológicas, a los que sí hemos prestado atención y hemos explicado y hemos valorado su utilidad como herramienta (http://iatpaula-f.blogspot.com/2011/11/mt-internet-y-polemica.html). Sin embargo, es igualmente cierto que durante toda la extensión de este Blog  jamás hemos profundizado en el funcionamiento de uno de estos programas, sino que nos hemos limitado a la descripción del uso de Dejà vú.  

Esta es la razón por la cual en esta entrada pretendemos, por una parte, acercar el uso de  OmegaT, un software de TAO de código libre con el que traduciremos un texto valiéndonos de una memoria de traducción, explicando su funcionamiento, valorando las herramientas, sus utilidades y sus particularidades. Por otra parte, y una vez que esté lista la traducción mediante este programa, traduciremos el mismo texto mediante un traductor automático, asitiéndolo en varios momentos de la traducción, para finalmente, comparar ambas traducciones. A continuación, elaboraremos una crítica de estos dos tipos de herramientas basada las traducciones y en su calidad; en esta crítica también incluiremos un apartado sobre las ventajas que este tipo de programas nos aporta frente a la traducción convencional (es decir, sin asistencia computerizada). El texto a traducir será Malaria deaths falling aslowly, WHO report says, extraído de la revista Scientific American Online

Así, antes de comenzar conviene aclarar unas cuantas cuestiones teóricas sobre OmegaT. OmegaT es una herramienta de traducción asistida por ordenador, diseñada para facilitar la tarea de la traducción a través del uso de memorias de traducción (TM), glosarios terminológicos y diccionarios. Este software es de código libre, es decir, que puede descargarse sin previa aportación pecuniaria, está programada en Java y funciona sobre diversos sistemas operativos (Windows, Mac, Linux, Unix, etc) gracias a su sistema multiplataforma. Este software puede descargarse de la página de Omega T, www.omegat.org, en la que se encuentran diferentes versiones, todas adaptadas a cada sistema operativo.



lunes, 12 de diciembre de 2011

Catálogo de recursos online para la traducción de árabe

Cada día me sorprendo más de la cantidad de información que podemos encontrar en Internet. Sin embargo, me sorprendo a la par de la dificultad que puede suponer encontrar aquello que buscas. Sin ir más lejos, durante esta semana he empleado mis buenas horas intentando hacer una recopilación de tesauros, tesauros especialmente centrados en medicina. La búsqueda resultó bastante escasa e infructuosa. Fueron estos hechos los que me llevaron a pensar cómo serían los recursos en línea para la traducción del árabe, una lengua que muy pocas personas utilizan como segunda o tercera lengua, y la verdad es que los resultados son bastante halagüeños. Y es que, el árabe es una de las lenguas más habladas en todo el mundo, motivo por el cual  ocupa el lugar de lengua oficial en organismos tales como la ONU y todas sus entidades derivadas.

Así pues, me decidí a hacer una recopilación de herramientas online para la traducción del árabe. A continuación os expongo los resultados de aquellas fuentes que a mi parecer pueden resultar más útiles. Junto a ellas, ofrezco mi valoración personal de esta fuente, expresada mediante asteriscos  sobre un máximo de cinco asteriscos

DICCIONARIOS

Como todos sabemos, esta es la herramienta base a la hora de confrontar una traducción, por lo que es necesario contar con un buen diccionario. Quizás una de las tareas más arduas del árabe sea localizar la raíz de las palabras, ya que sus vastísimas formas de flexión e irregularidades complican este proceso. Si no damos con la raíz, la búsqueda en el diccionario es nula, por lo que un diccionario que sepa identificar la flexión, tiene un punto a su favor.

http://www.wordreference.com/aren/ ****           
Este diccionario nos ofrece una búsqueda inglés-árabe y árabe inglés,  búsqueda por formas flexionadas y con ejemplos contextualizados.  Ofrece la palabra explicada en cada una de las acepciones.

http://dictionary.sakhr.com/SearchResults.aspx  ****        
Diccionario multilingue  alemán-árabe, árabe alemán; turco-árabe, árabe-turco; francés-árabe, árabe-francés; inglés-árabe, árabe-inglés. Interfaz multilingüe con caracteres árabes y latinos, potenciado por la empresa  egipcia de software Sakhr, especializada en lengua árabe y tecnologías. No busca palabras flexionadas, pero a su favor tiene que se pueden añadir pares de palabras en las diversas combinaciones de idiomas. Además, tiene enlaces a música y radio árabe. Ofrece definición de la palabra y sinónimos.


Los diccionarios de Almadrasa se presentan en formato PDF y no permiten realizar una búsqueda indizada, por lo que se tiene que buscar el término de manera manual y por su raíz (tal y como un diccionario analógico), por lo tanto. Para poder disfrutar plenamente de este recurso, es necesario que el ordenador cuente con un procesador de caracteres árabes (fuente «Tradicional Arabic») ya que si  no, no pueden ser leídos. Incluye una amplia variedad de diccionarios como árabe-español; español-árabe, árabe para principiantes o árabe para viajeros entre otros.


GLOSARIOS

Cuando nos enfrentamos a una traducción especializada, contar con un catálogo de palabras de la misma disciplina puede sernos muy beneficioso, especialmente si las entradas cuentas con definición o comentarios a cerca de estas.


http://www.atinternational.org/forums/showthread.php?t=758 *                           
Glosario de términos islámicos. La principal deficiencia de esta fuente es que no se encuentra el término original, sino tan sólo su transcripción, lo que puede originar un verdadero problema teniendo en cuenta la extensa fonología y archifonemas de le lengua árabe. Bastante extenso, aunque no se encuentra indizado por lo que es necesario realizar una búsqueda alfabética, siguiendo el abecedario español, no el árabe.

Glosario de términos jurídico-económicos árabe-español. A pesar de su brevedad, incluye algunos de los términos más importantes en un total de 180 entradas. Las entradas figuran con el término en árabe, no con su transcripción.


Glosario multilingüe de la UNESCO relativa al campo de la hidrología. Términos ordenados alfabéticamente en cada uno de los idiomas (entre los que se encuentran árabe, español, inglés, francés, alemán, portugués, turco, ruso y chino). Contiene un índice numérico para facilitar las búsquedas.

http://www.un-interpreters.org/glossaries.html   *           
 Glosario multidisciplinar multilingüe de los intérpretes de la ONU. La indización de los términos es confusa. No en todas las entradas aparece el mismo par de lenguas. El árabe no aparece en muchas de las entradas.


Glosario de términos para la normalización de nombres geográficos desarrollado por el Grupo de Expertos en nombres geográficos de las Naciones Unidas.  Se trata de un glosario multilingüe (inglés, francés, español, chino, árabe y ruso). Glosario muy completo con definiciones extensas y referentes en otras lenguas.


TESAUROS

Como decíamos, el árabe es una de las lenguas oficiales de la ONU, por lo que contamos con su presencia en los tesauros que esta entidad o sus derivados desarrollan.

****http://www.eionet.europa.eu/gemet/search?langcode=en                
 Tesauro multilingüe (incluye más de 30 idiomas) sobre el Medio Ambiente. Ofrece búsquedas muy detalladas aunque  no ofrece los equivalentes lingüísticos.

http://www.semide.net/thematicdirs/glossaries/portal_thesaurus   ****                 
Tesauro en inglés, francés y árabe sobre hidrología y materias asociadas. Incluye varios tipos de búsqueda: temática, alfabética, jerárquica y búsqueda mediante tesauro.


Este tesauro se trata de la información bibliográfica de las Naciones Unidas (UNBIS). Permite búsquedas en los seis idiomas oficiales de esta entidad.  A la hora de buscar, permite realizar una búsqueda simple o una búsqueda del texto completo. De la misma manera permite seleccionar el tipo de búsqueda lógica mediante el operador boleano Y o mediante el operados boleano O, o seleccionar toda la frase completa.

BASES DE DATOS


http://unterm.un.org/dgaacs/arabterm.nsf  *****                
 Base de datos terminológica en lengua árabe, ARABTERM, desarrollada por las Naciones Unidas. Interfaz en inglés.



TECLADOS
Tal y como exponíamos en una de las entradas anteriores, es necesario contar con un teclado en árabe para poder realizar gestiones online con esta lengua. Así, os facilito el que yo uso, ya que lo considero completo:


 No te olvides de que puedes acercar el zoom de la pantalla pulsando las teclas CTRL+  . De esta manera, el teclado no te resultará demasiado pequeño.


CONJUGADORES

Cuando nos movemos en una gramática tan complicada como es la gramática árabe, siempre viene bien tener a mano un conjugador verbal por si nos encontramos en un apuro.


Conjugador sencillo pero práctico. Interfaz en inglés. El único punto en su contra es que en ocasiones no encuentra el verbo aunque cada radical esté bien.


http://acon.baykal.be/ *****                 
Al igual que el anterior, este conjugador es sencillo, práctico y a la vez, completo. Te conjuga los verbos en voz activa y pasiva. Interfaz en inglés.

http://www.logosconjugator.org/verbi_utf8/all_verbs_index_ar.html      ****            
Este conjugador del portal italiano Logos, ofrece una lista de 760 verbos conjugados, aunque se requiere, como en anteriores ocasiones, un navegador arabizado.


MÉTODOS DE ENSEÑANZA
Si eres autodidacta y quieres aprender árabe, Internet cuenta con multitud de portales que se dedican a esta tarea, incluso es posible encontrar métodos de enseñanza de renombre y completos.

Una completa gramática árabe de mano de uno de los arabistas más conocidos.

http://lexicorient.com/babel/arabic/  *****                
Curso de árabe elemental en línea. El acceso es libre. Incluye diecinueve lecciones que contienen materiales orales y escritos en torno a situaciones comunicativas elementales, así como nociones de escritura y de gramática.


http://sites.google.com/site/arabevivo/     *****                 
Material didáctico audiovisual pensado para profesores y alumnos de árabe. Utiliza sellos y billetes de banco como soporte para enseñar vocabulario y nociones culturales básicas. Incluye enlaces a vídeos de canciones famosas con la transcripción de sus letras en árabe y la correspondiente traducción al castellano