Arrakasta kasuak
Kimu, zerbitzari propioetan instalatzeko euskarazko txatbota:
Enpresa eta erakundeen eguneroko lanetan lagungarri izango den euskarazko txatbot bat garatu dugu: Kimu. Eredua arina denez, enpresa eta erakundeen zerbitzarietan eta ordenagailuetan instala daiteke, eta horrek datuen pribatutasuna eta konfidentzialtasuna zaintzeko aukera ematen du. Hizkuntza arrunta baliatuz erabiltzaileak euskaraz eskatutako hainbat ataza ulertu eta gauzatzeko gai da. Gainera, enpresen eta erakundeen beharren arabera, eredua eginkizun zehatzetarako espezializatzeko aukera ere badago, emaitzen kalitatea are gehiago hobetzeko. Euskararako sortu arren, Kimuk emaitza onak ematen ditu beste hainbat hizkuntzatan ere: gaztelania, ingelesa, frantsesa, italiera…
Kimu, zerbitzari propioetan instalatzeko euskarazko txatbota:
Azalpen orokorra
Enpresa eta erakundeen eguneroko lanetan lagungarri izango den euskarazko txatbot bat garatu dugu: Kimu. Eredua arina denez, enpresa eta erakundeen zerbitzarietan eta ordenagailuetan instala daiteke, eta horrek datuen pribatutasuna eta konfidentzialtasuna zaintzeko aukera ematen du. Hizkuntza arrunta baliatuz erabiltzaileak euskaraz eskatutako hainbat ataza ulertu eta gauzatzeko gai da. Gainera, enpresen eta erakundeen beharren arabera, eredua eginkizun zehatzetarako espezializatzeko aukera ere badago, emaitzen kalitatea are gehiago hobetzeko. Euskararako sortu arren, Kimuk emaitza onak ematen ditu beste hainbat hizkuntzatan ere: gaztelania, ingelesa, frantsesa, italiera…
Erronka
Kimu ereduaren abantaila nagusietako bat bere tamaina txikia da: 9.000 milioi parametro ditu, eta hizkuntza-eredu txikien (SLM, Small Language Models) kategorian kokatzen da LLMen artean. Hizkuntza-eredu txiki libreek emaitza lehiakorrak ematen dituzte hizkuntza handietan (gaztelania, ingelesa eta abar); ez, ordea, baliabide urriko hizkuntzen kasuan, hala nola euskaraz erabiltzean. Eta hizkuntza txikiek ez dute baliabide nahikorik horrelako ereduak zerotik sortzeko. Hain zuzen ere, hizkuntzen arteko transferentzia baliatu dugu euskarazko gaitasunak hizkuntza-eredu txiki batean txertatzeko: euskarara egokitu dugun oinarri-eredu bat eta euskarara egokitu gabe dagoen eredu instruitu bat bateratu ditugu.
Elkarlana
Euskaraz ondo ez dakien eredu fundazionalari euskara irakasteko Zelai Haundi corpusa erabili dugu; Oraik sortutako 500 milioi hitzeko corpusa, lizentzia libreko edukiak soilik dituena.
Emaitza
Hizkuntza arrunta baliatuz erabiltzaileak euskaraz eskatutako hainbat ataza ulertu eta gauzatzeko gai da eredua; besteak beste, itzulpenak eta laburpenak egiteko, dokumentuen gaineko galderei erantzuteko, informazioa erauzteko, testuak zuzentzeko, egokitzeko.
Proiektuaren irudiak