Skip to main content
SERMAS
2024 | Ekaina 05

Ahotsa ezagutzeko sistemak ingurune zaratatsuetarako

Orai zentroak ASR teknologia hobetu du Europako SERMAS proiektuaren esparruan

SERMAS proiektua (Socially-Acceptable Extended Reality Models and Systems) ikerketa- eta berrikuntza-proiektu bat da, Horizon Europe programaren funtsekin finantzatua. Sozialki onargarriak diren errealitate hedatuko sistemen hurrengo belaunaldiaren oinarriak ezartzea du xede, eta, horretarako, pertsonen eta teknologiaren arteko harremana eta elkarreragina aztertzen ditu. Errealitate hedatuko sistemak dira mundu fisikoa eta digitala konbinatzen dituzten murgiltze-teknologia guztiak, errealitate areagotua, errealitate birtuala eta errealitate mistoa barne.

SERMASen helburua da laguntzaile adimendun edo birtual aurreratuak eraikitzea hainbat esparrutarako, puntako adimen artifizialaren ikerkuntza eta garapenaren bidez. Proiektu honetan, Oraik ahotsa ezagutzeko teknologia garatu behar du bost hizkuntzatan (euskara, gaztelania, frantsesa, ingelesa eta italiera), ingurune zaratatsuetan balio duena eta hiztunak bereizten dituena.

Lehenengo fasean, ingeleserako ASR sistema (Automatic Speech Recognition) baliozkotu du Oraik. Ahotsa ezagutzeko sistema bat da, zarata handiko giroetan erabiltzeko garatua. Zentroan garatutako sistemak oso emaitza onak izan ditu, Igor Leturiak, Oraiko hizkuntza-teknologien arduradunak, adierazi duenez: “Honekin emaitza hobeak lortu ditugu Whisper eredua erabilita baino; ahotsa transkribatzeko eta ezagutzeko OpenAIk sortutako ikaste automatikoko eredu bat da Whisper”.

“Seinalearen (ahotsa) eta zarataren arteko erlazioa 10 dB-ekoa denean, ingurune-zarata altua dela jotzen da; erlazio hori 0 dB-ekoa denean, ahotsak eta zaratak bolumen bera dute”, azaldu du. Ikerketa-taldeak adierazi duenez, “10 eta 8 dB-etan, errore-tasa % 5ekoa da. 5 eta 0 dB-en kasuan, nahiz eta emaitzak onak izan, errore-tasa pixka bat okerragoa da”. Pozik agertu da Leturia: “Hondo-zaratarik gabeko audioekin lortutako emaitzek, gainera, ez dute okerrera egin, eta hori garrantzitsua da”. Bestalde, Oraiko lantaldeak API baten (edo aplikazioak programatzeko interfaze baten) bidez jarri du SERMAS proiektuaren eskura ASR sistema hori.

Proiektuaren bigarren fasean, Orai zentroko lantaldeak euskara eta gaztelania ingurune zaratatsuetan ezagutzeko sistemak garatuko ditu.

Informazio osagarria

SERMASen partzuergoa honako hauek osatzen dute: Università Degli Studi di Modena e Reggio Emilia (UNIMORE, Italia), Technische Universitat Darmstadt (Alemania), King 's College London (Erresuma Batua), University of Applied Sciences and Arts of Southern Switzerland (SUPSI, Suitza), Deutsche Welle (Alemaniako irrati-zerbitzua), Poste Italiane (Italiako posta-zerbitzua), F6S (mundu osoko sektore publikoko erakundeei proiektu teknikoak eta ikerkuntzakoak sustatzen, komunikatzen eta zabaltzen laguntzeko mundu mailako sarea) eta Spindox Labs (ikerkuntza teknologikoan eta prototipoen sorreran diharduen Trentoko (Italia) berrikuntza-zentroa).

Proiektu honetan ari da Orai, parte hartu zuelako erakunde berritzaileak, puntako teknologiako enpresa berriak, ETEak eta eragile industrialak erakartzeko deialdi batean, zeinaren helburua baita errealitate hedatuko soluzioak eta teknologiak garatu, hedatu eta baliozkotzea.