Skip to main content
ZelaiHandi
2024 | Martxoa 05

ZelaiHandi aurkeztu dugu, lizentzia libreko testuen euskarazko corpusik handiena

Corpusak 521,5 milioi hitz ditu, eta hautatutako webguneen bilduma batetik bildu dira testuak, kalitatezkoak eta askotarikoak direla ziurtatzeko. Corpusaren edukia aldian-aldian eguneratuko da.

Euskara ulertzeko eta sortzeko gaitasuna duten hizkuntza-eredu neuronalen garapena eta ikerketa errazteko sortu da corpusa.

https://huggingface.co/datasets/orai-nlp/ZelaiHandi

ZelaiHandi Oraik garatu du ICL4LANG Elkartek proiektuaren barnean. Proiektu horretan, gure industriaren beharretara egokitzen diren zehaztasun handiko hizkuntza-teknologia eskalagarriak ikertzen dihardugu, Tecnalia eta HiTZ zentroarekin batera.