Proyecto IKA: Estimación automática de la calidad de la traducción

IKA es un proyecto liderado por Mondragon LinguaAlecop, y en consorcio con Bakun, Berba, TaiGabe, y Vicomtech. El consorcio cuenta con la colaboración en labores de gestión de I+D de ISEA S.Coop. y ha estado financiado en 2023 dentro de la convocatoria HAZITEK del Grupo SPRI.

Las actividades socioeconómicas actuales se enmarcan en un mercado global multilingüe, donde las barreras lingüísticas fragmentan el mercado y frenan los desarrollos económicos, en comunidades y mercados fuertemente multilingües, como pueden ser la Comunidad Autónoma Vasca o la Unión Europea.

A estas dificultades se suman los retos que conlleva el crecimiento de las infraestructuras digitales, en particular el crecimiento exponencial de los volúmenes de datos generados de forma continua. Frente a los amplios volúmenes de contenidos multilingües, los necesarios procesos de traducción humana de alta calidad requieren un soporte tecnológico adecuado basado en tecnologías del lenguaje.

La traducción automática (TA) se ha impuesto como una de las principales tecnologías de apoyo frente a los obstáculos mencionados, notablemente a raíz del cambio reciente hacia la traducción automática neuronal (TAN), basada en redes neuronales artificiales y aprendizaje profundo (Deep Learning). Las mejoras significativas de calidad obtenidas mediante TAN han impuesto esta tecnología como el nuevo paradigma a nivel científico como comercial. Las principales empresas del sector como Google2, Microsoft3, DeepL4 o Systran se basan en TAN para sus ofertas tecnológicas de traducción. Los avances obtenidos con el enfoque TAN se han obtenido también para idiomas con menor soporte tecnológico como el euskera, a raíz de proyectos de investigación como MODELA y MODENA, donde se ha logrado un salto cualitativo de alto impacto que permite impulsar la integración de la TA en el espacio socioeconómico de la Comunidad Autónoma Vasca.

En este contexto y con intención de optimizar los procesos de traducción se presenta IKA. Este proyecto persigue la identificación de los errores habituales en traducciones que requieren de un soporte tecnológico para la estimación de calidad de dichas traducciones. Dados los volúmenes de datos generados de forma continua, y la escasez de referencias humanas de traducción con las que comparar las traducciones automáticas, es necesario el desarrollo de tecnología de estimación automática de calidad (EAQ) que pueda dar soporte a una estimación fiable y robusta de la calidad de cada traducción sin acceso a referencias humanas, es decir, considerando únicamente las características de los textos de entrada y sus traducciones.

Todo esto mediante una herramienta integrada que permita estimar de forma robusta la calidad de las traducciones automáticas a nivel de frase, de palabra y de documento completo. El proyecto IKA pretende dar el soporte tecnológico necesario para este fin.

Related companies

Published Date

05/01/2024

Community:

  • Artificial Intelligence and Data Analytics

Sign up

You are one step away from being part of Shaking HUB! We want to get to know you so we can share with you the opportunities and content that best fit your profile.

"*" indicates required fields

This field is hidden when viewing the form
A qué campaña pertenece este campo?
This field is hidden when viewing the form
This field is hidden when viewing the form
This field is hidden when viewing the form
Full name*
Which community are you interested in? You can check more than 1. *
Select between 1 and 4 choices.

Privacy Overview
Shaking HUB

This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.

Strictly Necessary Cookies

Strictly Necessary Cookie should be enabled at all times so that we can save your preferences for cookie settings.

Analytics

This website uses Google Analytics to collect anonymous information such as the number of visitors to the site, and the most popular pages.

Keeping this cookie enabled helps us to improve our website.

Marketing

This website uses the following additional cookies:

(List the cookies that you are using on the website here.)