Skip to main content
Igor Letura_Zientzia.eus
2023 | Martxoa 27

Mycroft.eus: euskarazko bozgorailu adimenduna

Igor Leturiak Elhuyar aldizkarian idatzitako artikulua.

Bozgorailu adimendunak asko ugaritzen ari dira gure etxeetan. Gure ahozko aginduei men egin eta hitz eginez erantzuten duten gailu horiek, baina, ez dute euskaraz egiten. Horregatik, Orai-n, Elhuyarren adimen artifizialaren eta hizkuntza- eta hizketa-teknologien langunean, Talaios eta Skura kooperatibekin elkarlanean, Mycroft.eus proiektuari heldu genion. Bozgorailu adimendun bat garatzea zen gure asmoa, erraldoi teknologikoek egiten dituztenen bestelako ezaugarriak izango zituena: euskalduna, software librekoa, pribatutasuna babesten duena, genero-ikuspegia duena, tokiko zerbitzuekin lotua...

Amazon-en Echo eta Google-ren Nest (lehen Home) bozgorailu adimendunak, esate baterako, oso lagungarriak izan daitezke gauden tokitik mugitu gabe eta soilik hitz eginez musika jartzeko, eguraldiaz galdetzeko, alarmak eta gogorarazleak ipintzeko... Tamalez, beste behin, erraldoi teknologikook gailu horietan ere ez dute kontuan izan euskara, eta gure etxean bertan gaztelaniaz edo frantsesez egitera behartzen gaituzte, gure haurrak barne, zeinak horrelakoen oso zale baitira oso txikitatik.

Mycroft.eus egitasmoa

Alabaina, hizkuntza-teknologietan ikertzeko Elhuyarrek sortutako Orai langunean, baditugu bozgorailu adimendun batek euskaraz egiteko behar dituen teknologiak; badira urte batzuk hizketa-ezagutzako ASR (Automatic Speech Recognition) eta hizketa-sintesiko TTS (Text To Speech) teknologiak garatu genituela. Eta badira software libreko bozgorailu adimendunen zenbait proiektu norberak nahieran molda ditzakeenak, behar beste aldaketa eta gehikuntza eginez. Ziurrenik ezagunena eta aurreratuena Mycroft.AI da.

Oinarri guztiak eskura genituenez, 2020an euskarazko bozgorailu adimendun bat garatzeko proiektuari heldu genion, software eta hardware librearekin lan egiten esperientzia handia duten bi kooperatibarekin elkarlanean: Talaios eta SkuraMycroft.eus da proiektu hori, zeinaren arduradun izateko ohorea eta plazera izan baitut. Mycroft.eus-ek Gipuzkoako Foru Aldundiaren Etorkizuna Eraikiz, Eusko Jaurlaritzaren Hazitek eta Europako Batzordeko ELG edo European Language Grid programen laguntza jaso du (azken horretan, aurkeztutako 100 proiektu baino gehiagoren artean hautatutako 10etako bat izan zen, Espainiar Estatuko bakarra).

Mycroft.eus proiektuaren asmoa, beraz, euskarazko bozgorailu adimendun bat egitea zen, Mycroft.AI-n oinarritua eta Orai-ren euskarazko ASR eta TTS teknologiak baliatuko zituena. Baina beste ezaugarri batzuk ere eman genizkion, garrantzitsuak direnak eta merkatuko antzeko gailuek ez dituztenak: batetik, software librekoa izango zen; bestetik, pribatutasuna zainduko zuen gailuak; horrez gain, genero-ikuspegia landuko zuen; eta, azkenik, tokiko edo hurbileko zerbitzuak baliatuko zituen.

Proiektuan egindakoak

Gaur egun, proiektuan denbora luzez aritu eta lan asko egin ondoren, esan daiteke softwarea garatzeko fasea amaituta dagoela. Mycroft-en muina euskaratu dugu (mezuak, esaldiak, testuak...), haren hizkuntza-modulua ere bai (zenbakiak, orduak, datak eta abarrak interpretatu eta esaten dituena), Orai-ren euskarazko ASR eta TTS teknologiak baliatu ahal izan ditzzan egokitu dugu (plugin batzuk sortuz) eta dituen skill edo trebetasunetako 40 baino gehiago euskaratu ditugu (bolumena egokitzekoak, ezarpenak aldatzekoa, trebetasunak instalatzekoa, data, ordua edota eguraldia esatekoak, efemerideak, alarmak, gogorarazpenak, zerrendak, domotika, Wikipedia, musika...).

Beste ezaugarriei dagokienez ere helburua bete dugula esan daiteke. Software librekoa izatearena ezinbestean bete da, oinarri hartutako Mycroft bera ere hala baita, eta egindako garapenak Mycroft-en software-biltegira igota daude, edonork baliatu edota hobetzeko moduan. Pribatutasuna zaintzeari dagokionez, Mycroft-ek gailuan bertan detektatzen du aktibatze-agindua (“Hey, Mycroft!”), inongo zerbitzaritara ezer bidali gabe; ondorengo komandoentzat Orai-ren ASR eta TTS zerbitzarietara bidalitako audio eta esaldiak ez ditugu gordetzen, ezta haiekin negozioa egiten ere, jakina. Genero-ikuspegia lantzeari dagokionez, Unescoren I’d blush if I could txostenak dio bozgorailu komertzialek genero-alborapenak indartu eta zabaltzen dituztela (gure zerbitzura eta gure eskaerak betetzeko dauden gailu horiek emakumezko izena, pertsonalitatea eta ahotsa izaten dute, eta, are, adeitsuki erantzuten diete galdera erasokorrei, abusuzko eta sexu-jazarpenezkoei barne), eta hainbat neurri gomendatzen ditu, defektuz gizonezko ahotsa izatetik generorik gabeko ahotsak baliatzeraino doazenak. Mycroft-en kasuan, normalean erabiltzen ez den fikziozko izena izan arren, gizonezko izena du (Sherlock Holmes-en anaia argia da Mycroft), pertsonalitate neutroa eta ez dio sumisioz erantzuten jazarpenari edo abusuari. Gainera, guk gizonezko ahotsa jarri diogu defektuz, eta hainbat ikerketa egiten ari gara generorik gabeko ahots neutro bat sintetizatzeko. Azkenik, tokikotasunari dagokionez, dozena erdi bat trebetasun berri garatu ditugu, albisteak euskal webguneetakoak izan daitezen, bertako irratiak entzuteko, euskal musika entzuteko, jaiak hurbil zein herritan diren galdetzeko...

Gainera, proiektuan euskarazko ASR eta TTS teknologiei hainbat egokitzapen eta hobekuntza egin dizkiegu. Adibidez, ezagutzailea hobetu dugu, kalitate txarreko audioekin edo atzeko zarata edo musika dutenekin (hau da, etxean dagoen bozgorailu baten kasuan aurki ditzakegun modukoekin) hobeto funtziona dezan, eta sintesiko teknologia neuronala garatu dugu, askoz naturalagoa (ia ezin da pertsonen benetako audioetatik bereizi).

Eta orain zer?

Beraz, Mycroft.eus-en software-garapena amaituta egonik, zertan da proiektua egun? Dena bukatuta dago? Bada, ez. Proiektuak euskarazko bozgorailu adimendun bat euskal gizartearen eskura jartzea zuen eta du helburu, eta, horretarako, hardwarearen gaia ere konpondu behar da, hau da, gailu batean integratu behar da, eta gailu hori banatu eta salgai jarri. Eta gai hori askoz konplexuagoa da guretzat, hizkuntza-teknologietan eta software garapenean bai baitugu esperientzia, baina hardwarean gutxiago.

Euskarazko Mycroft prest dago mikrofonoa eta bozgorailua eta Linux sistema eragilea dituen ordenagailu batean instalatzeko, edo baita horretarako berariaz prestatutako gailu batean instalatzeko ere; adibidez, iazko iraileko artikuluan aipatzen genuen Raspberry Pi batean oinarritutako gailu batean. Gu Google-ren AIY Voice Kit batekin aritu gara, eta harentzat ere prestatuta dago (Google-k kaleratutako bozgorailu eta mikrofonodun Raspberry Pi bat da, kartoizko kutxa batean dagoena, jendeak bere ASR eta TTSa baliatuz garapenak eta hack-ak egin ditzan; Mycroft komunitateak asko erabili du). Baina ez dago edonoren esku horrelako instalazio bat egitea, eta, ordenagailu normal baten kasuari dagokionez, praktikoa ere ez da.

Eta gu geu hardware berezitu bat diseinatu eta ekoizten hastea baino, errazagoa eta egokiagoa da Mycroft.AI enpresak berak merkaturatzen duen gailuan integratzea. Baina COVID-19ak gailu digitalen ekoizpenari ekarritako arazoek (txip-eskasia, prezioak garestitzea...) haiei ere eragin die. Zenbait urtez atzeratu dute gailua merkatuan jartzea, eta ez dute nahiko zuketen edo genukeen prezioan egiterik izan...

Duela urtebete pasatxo, aukera eman zieten garatzaileei gailuaren lehen prototipoa, Mark II DevKit izenekoa, erosteko. Metakrilatozko karkasa baten barruan, Raspberry Pi bat, plaka bat, bozgorailua, mikrofonoa, pantaila, kamera, argiak eta botoiak zekartzan. Haietako bat erosita, euskarazko Mycroft bertan ongi ibil zedin prestatu eta testatu genuen. Eta duela hilabete batzuk, azkenik, behin betiko gailua atera zuten, Mark II izenekoa, eta halako bat ere erosi genuen euskara bertan integratu eta probatzeko. Azken horretan funtzionatzeko, softwareari aldaketa asko egin dizkiote, eta, euskaraz ere funtziona dezan, zenbait egokitzapen egin behar dizkiegu orain arte eginda geneuzkan garapenei, eta horretan ari gara.

Bestalde, gailuari izena eta esnatze-agindua aldatu nahi dizkiogu, eta euskaldunoi ahoskatzen errazagoa eta naturalagoa zaigun zerbait jarri. Horrez gain, hasierako hiru garatzaileon taldetik euskal garatzaileen komunitatera eta euskal enpresetara zabaldu nahi dugu garapena, elkarrekin trebetasun gehiago garatzeko, eta tokikotasunaren ezaugarriari bultzada bat eman eta gailua erakargarriago bihurtzeko.

Azkenik, bozgorailu adimendunaz harago, hizketa bidezko laguntzaile birtualak bestelako inguruneetara eramateko lanetan ari gara, telefono mugikorretara kasu. Eta industriara begirako aplikazioak ere garatzen hasita gaude.

Mycroft.eus proiektu polit, anbiziotsu eta beharrezkoa da. Euskarazko bozgorailu adimenduna garatu dugu, eta ea laster gauden gailua merkaturatzeko moduan. Baina horrez gain, euskarazko hizketa-ezagutzaren eta -sintesiaren arloko teknologietan sakondu da, etorkizunean ere ziur emankorra izango den Orai, Skura eta Talaios-en arteko elkarlanari ekin zaio, eta bide berriak ireki dira hizketa bidezko interfazeetan.

Laguntzaile adimendunak