IKA proiektua: Itzulpen kalitatearen estimazio automatikoa

IKA Mondragon LinguaAlecop buru duen proiektua da, eta Bakun, Berba, TaiGabe eta Vicomtech elkarteekin partzuergoan. Partzuergoak ISEA S.Coop. enpresaren I+Gko kudeaketa-lanetan laguntzen du. eta 2023an finantzatu da, SPRI Taldearen HAZITEK deialdiaren barruan.

Gaur egungo jarduera sozioekonomikoak merkatu global eleaniztun batean kokatzen dira, non hizkuntza-oztopoek merkatua zatikatzen duten eta garapen ekonomikoak geldiarazten dituzten, oso eleaniztunak diren erkidego eta merkatuetan, hala nola, Euskal Autonomia Erkidegoan edo Europar Batasunean.

Zailtasun horiei azpiegitura digitalen hazkundeak dakartzan erronkak gehitu behar zaizkie, bereziki etengabe sortutako datu-bolumenen hazkunde esponentziala. Eduki eleaniztunen bolumen zabalaren aurrean, kalitate handiko giza itzulpengintzako beharrezko prozesuek hizkuntzaren teknologietan oinarritutako euskarri teknologiko egokia behar dute.

Itzulpen automatikoa (IA) izan da aipatutako oztopoen aurrean laguntzeko teknologia nagusietako bat, neurona-itzulpen automatikorako (NMT) duela gutxi egin den aldaketaren ondorioz. Aldaketa hori sare neuronal artifizialetan eta ikaskuntza sakonean oinarritzen da (Deep Learning). Itzulpen Automatikoaren bidez lortutako kalitate-hobekuntza esanguratsuek ezarri dute teknologia hori, paradigma zientifiko eta komertzial berria den aldetik. Google2, Microsoft3, DeepL4 edo Systran bezalako sektoreko enpresa nagusiek IA dute oinarri itzulpen eskaintza teknologikoetarako. Itzulpen automatikoaren ikuspegiarekin lortutako aurrerapenak euskarri teknologiko txikiagoa duten hizkuntzetarako ere lortu dira, hala nola euskararako, MODELA eta MODENA ikerketa proiektuen ondorioz, non eragin handiko jauzi kualitatibo bat lortu den, itzulpen automatikoa Euskal Autonomia Erkidegoko eremu sozioekonomikoan integratzea bultzatzeko.

Testuinguru horretan, eta itzulpen-prozesuak optimizatzeko asmoz, IKA aurkezten da. Proiektu honen bidez, itzulpenen kalitatea kalkulatzeko euskarri teknologikoa behar duten itzulpenetan ohikoak diren akatsak identifikatu nahi dira. Etengabe sortutako datu-bolumenak eta itzulpen automatikoak alderatzeko giza erreferentzia gutxi daudenez, beharrezkoa da kalitate-estimazio automatikoko teknologia (EAQ) garatzea, giza erreferentziarik gabeko itzulpen bakoitzaren kalitatearen estimazio fidagarria eta sendoa egin ahal izateko, hau da, sarrera-testuen eta horien itzulpenen ezaugarriak soilik kontuan hartuta.

Hori guztia, esaldi, hitz eta dokumentu osoko itzulpen automatikoen kalitatea modu sendoan balioesteko tresna integratu baten bidez. IKA proiektuak helburu horretarako behar den euskarri teknologikoa eman nahi du.

Argitalpen-data

05/01/2024

Sektoreak:

  • Prestakuntza eta heziketa

Gaiak:

  • Berrikuntza
  • Hizkuntzak

Komunitatea:

  • Adimen artifiziala