Pasar al contenido principal

Casos de éxito

Kimu, un chatbot en euskera para ser instalado en servidores propios:

Kimu pantaila-irudia
Hemos desarrollado un chatbot en euskera capaz de ayudar en el día a día a empresas e instituciones: Kimu. La ligereza del modelo permite su instalación en servidores y ordenadores de empresas e instituciones, lo que posibilita preservar la privacidad y confidencialidad de los datos. El modelo es capaz de comprender y ejecutar las tareas solicitadas por el usuario en euskera utilizando un lenguaje natural. Además, en función de las necesidades de empresas e instituciones, existe la posibilidad de especializar el modelo para realizar determinadas tareas y de ese modo mejorar la calidad de los resultados. Si bien Kimu se ha creado para el euskera, ofrece buenos resultados también en otras lenguas: castellano, inglés, francés, italiano...hainbat hizkuntzatan ere: gaztelania, ingelesa, frantsesa, italiera…

Descripción general

Hemos desarrollado un chatbot en euskera capaz de ayudar en el día a día a empresas e instituciones: Kimu. La ligereza del modelo permite su instalación en servidores y ordenadores de empresas e instituciones, lo que posibilita preservar la privacidad y confidencialidad de los datos. El modelo es capaz de comprender y ejecutar las tareas solicitadas por el usuario en euskera utilizando un lenguaje natural. Además, en función de las necesidades de empresas e instituciones, existe la posibilidad de especializar el modelo para realizar determinadas tareas y de ese modo mejorar la calidad de los resultados. Si bien Kimu se ha creado para el euskera, ofrece buenos resultados también en otras lenguas: castellano, inglés, francés, italiano...

Reto

Una de las principales ventajas de Kimu es su reducido tamaño: cuenta con 9.000 millones de parámetros y se encuadra en la categoría de pequeños modelos de lenguaje (SML Small Language Models) dentro de los LLM. Los pequeños modelos de lenguaje libres ofrecen resultados competitivos en las grandes lenguas (castellano, inglés, etc.), pero no en las lenguas con recursos limitados, como es el caso del euskera. Y las lenguas pequeñas no tienen recursos suficientes para crear ese tipo de modelos desde cero. De hecho, a través de la transferencia lingüística, hemos integrado las competencias del euskera en un modelo de lenguaje pequeño: hemos combinado un modelo fundacional que hemos adaptado al euskera con un modelo instruido que no está adaptado al euskera.

Cooperación

Para enseñar euskera al modelo fundacional que no sabe bien euskera se ha utilizado el corpus Zelai Haundi, creado por Orai; un corpus de 500 millones de palabras, que alberga únicamente contenidos de licencia libre.

Resultado

El modelo es capaz de comprender y ejecutar las tareas solicitadas por el usuario en euskera utilizando un lenguaje natural; por ejemplo, elaborar traducciones y resúmenes, responder preguntas sobre documentos, extraer información, corregir o adecuar textos…

Imágenes del proyecto

Kimu aurkezpena