Proyecto IKA: Estimación automática de la calidad de la traducción

IKA es un proyecto liderado por Mondragon LinguaAlecop, y en consorcio con Bakun, Berba, TaiGabe, y Vicomtech. El consorcio cuenta con la colaboración en labores de gestión de I+D de ISEA S.Coop. y ha estado financiado en 2023 dentro de la convocatoria HAZITEK del Grupo SPRI.

Las actividades socioeconómicas actuales se enmarcan en un mercado global multilingüe, donde las barreras lingüísticas fragmentan el mercado y frenan los desarrollos económicos, en comunidades y mercados fuertemente multilingües, como pueden ser la Comunidad Autónoma Vasca o la Unión Europea.

A estas dificultades se suman los retos que conlleva el crecimiento de las infraestructuras digitales, en particular el crecimiento exponencial de los volúmenes de datos generados de forma continua. Frente a los amplios volúmenes de contenidos multilingües, los necesarios procesos de traducción humana de alta calidad requieren un soporte tecnológico adecuado basado en tecnologías del lenguaje.

La traducción automática (TA) se ha impuesto como una de las principales tecnologías de apoyo frente a los obstáculos mencionados, notablemente a raíz del cambio reciente hacia la traducción automática neuronal (TAN), basada en redes neuronales artificiales y aprendizaje profundo (Deep Learning). Las mejoras significativas de calidad obtenidas mediante TAN han impuesto esta tecnología como el nuevo paradigma a nivel científico como comercial. Las principales empresas del sector como Google2, Microsoft3, DeepL4 o Systran se basan en TAN para sus ofertas tecnológicas de traducción. Los avances obtenidos con el enfoque TAN se han obtenido también para idiomas con menor soporte tecnológico como el euskera, a raíz de proyectos de investigación como MODELA y MODENA, donde se ha logrado un salto cualitativo de alto impacto que permite impulsar la integración de la TA en el espacio socioeconómico de la Comunidad Autónoma Vasca.

En este contexto y con intención de optimizar los procesos de traducción se presenta IKA. Este proyecto persigue la identificación de los errores habituales en traducciones que requieren de un soporte tecnológico para la estimación de calidad de dichas traducciones. Dados los volúmenes de datos generados de forma continua, y la escasez de referencias humanas de traducción con las que comparar las traducciones automáticas, es necesario el desarrollo de tecnología de estimación automática de calidad (EAQ) que pueda dar soporte a una estimación fiable y robusta de la calidad de cada traducción sin acceso a referencias humanas, es decir, considerando únicamente las características de los textos de entrada y sus traducciones.

Todo esto mediante una herramienta integrada que permita estimar de forma robusta la calidad de las traducciones automáticas a nivel de frase, de palabra y de documento completo. El proyecto IKA pretende dar el soporte tecnológico necesario para este fin.

Fecha de publicación

05/01/2024

Sectores:

  • Formación y educación

Tópicos:

  • Idiomas
  • Innovación

Comunidad:

  • Inteligencia Artificial