Pasar al contenido principal
CORRAL MALTA
2024 | 20 Marzo

Investigación para la integración de la terminología especializada en sistemas de traducción automática, en la conferencia EACL 2024

El investigador de Orai NLP Teknologiak Ander Corral ha presentado su investigación en la conferencia EACL 2024, celebrada en Malta.

La European Chapter of the Association for Computational Linguistics celebra estos días su 18.ª Conferencia en Saint Julian, Malta, en la que Orai ha tenido la oportunidad de presentar el trabajo “Morphology Aware Source Term Masking for Terminology-Constrained NMT”, realizado por Ander Corral y Xabier Saralegi.

Corral ha presentado un nuevo método para integrar terminología especializada en sistemas de traducción automática. Este método permite identificar y ocultar términos en el texto original, para utilizar en la traducción los términos determinados por el usuario; asimismo, se extrae la información gramatical (declinación, plural, género…) de los términos, antes de ocultarlos.

Corral considera que “este método es imprescindible cuando el proceso de traducción parte de lenguas con una morfología rica”, ya que el término oculto se sustituye por el término de la lengua de destino y la información gramatical del término original. Con esta información, el sistema traduce la frase, copiando correctamente el término y adaptándolo a la traducción en función del contexto en el que se encuentre.

El método desarrollado por Orai ha sido evaluado en dos direcciones de traducción de diferente complejidad morfológica: euskera-castellano e inglés-alemán. El investigador afirma que se ha obtenido una mejora notable (de hasta el 38 %) en la precisión del proceso de inserción de terminología personalizada, sobre todo en el caso de test complejos específicamente elaborados para este proyecto.

Corral afirma que este método es “muy útil” para que los clientes puedan utilizar terminología personalizada a nivel de producción, ya que las traducciones se adaptan a las necesidades de los dominios o empresas. Por último, Corral añade que permite garantizar la coherencia terminológica entre las diferentes traducciones.