Skip to main content
CORRAL MALTA
2024 | Martxoa 20

Itzulpen automatikoko sistemetan terminologia espezializatua integratzeko ikerketa, EACL 2024 konferentzian

Orai NLP teknologiak lantaldeko Ander Corral ikertzailea Maltan ospatu den EACL 2024 konferentzian egon da bere ikerketaren berri aurkezten.

European Chapter of the Association for Computational Linguistics-en 18. konferentzia ospatzen ari da egun hauetan Maltako Saint Julian hirian. Oraik bere tartea izan du bertan, Ander Corralek eta Xabier Saralegik egindako “Morphology Aware Source Term Masking for Terminology-Constrained NMT” lana aurkezteko.

Terminologia espezializatua itzulpen automatikoko sistemetan integratzeko metodo berria aurkeztu du Corralek. Metodo honi esker, jatorrizko testuan terminoak identifikatu eta ezkutatzen dira, itzulpenetan erabiltzaileak zehaztutako terminoak egon daitezen; halaber, termino horiek ezkutatu aurretik, haien informazio gramatikala (deklinazioa, plurala, generoa…) erauzten du.

Corralen hitzetan, “metodo hau ezinbestekoa da itzulpen-prozesua morfologia aberatsa duten hizkuntzetatik abiatzen denean”, ezkutatutako terminoaren ordez helburu-hizkuntzako terminoa eta jatorrizko terminoaren informazio gramatikala txertatzen baita. Informazio horrekin guztiarekin, sistemak esaldia itzultzen du, terminoa egoki kopiatuz eta dagokion testuinguruaren arabera itzulpenera egokituz.

Oraik garatu duen metodoa konplexutasun morfologiko ezberdina duten bi itzulpen-norabidetan balioztatu da, euskara-gaztelania eta ingelesa-alemana. Ikertzaileak dionez, “hobekuntza nabarmena” lortu da terminologia pertsonalizatua txertatzeko prozesuaren zehaztasunean (% 38ra arte), batez ere proiektu honetan berariaz landutako test zailetan.

Corralek dio metodo hau “oso erabilgarria” dela produkzio-mailan bezeroek terminologia pertsonalizatua erabili ahal izateko, itzulpenak domeinu edo enpresen beharretara egokitzen baitira. Azkenik, Corralek gehitu du aukera ematen duela terminologia-koherentzia bermatzeko itzulpen ezberdinen artean.