Pedro Sánchez anuncia el lanzamiento de los primeros modelos de ALIA: así es la IA "pública y abierta” que impulsa el Estado

Pedro Sánchez anuncia el lanzamiento de los primeros modelos de ALIA: así es la IA "pública y abierta” que impulsa el Estado

El presidente del Gobierno, Pedro Sánchez, ha anunciado este lunes el lanzamiento de los primeros modelos de lenguaje de ALIA. Se trata de una iniciativa que de la que hablamos a principios del año pasado, pero que inició en 2019 y que este 2025 comienza a materializarse. Según explican en un comunicado oficial, el objetivo de la misma es impulsar el desarrollo de la inteligencia artificial (IA) poniendo a disposición de todos recursos en español y lenguas cooficiales (catalán y valenciano, euskera y gallego).

La idea es que los usuarios individuales y las empresas puedan utilizar estos recursos para realizar investigaciones o desarrollar sus propios productos de IA, aunque esta tecnología también aterrizará en algunos organismos públicos. De hecho, la activación de ALIA llega acompañada de la puesta en marcha de dos proyectos piloto: un chatbot interno que promete agilizar el trabajo de la Agencia Tributaria, y una solución destinada a la medicina de atención primaria que permitirá "un diagnóstico precoz y más preciso de las insuficiencias cardíacas".

ALIA ya está disponible para todos

Cuando hablamos de ALIA estamos haciendo referencia a una serie de recursos de IA financiados con fondos públicos y verificados por la Agencia Española de Supervisión de la Inteligencia Artificial (AESIA). En el caso de los modelos de lenguaje, estos han sido entrenados utilizando parte de la infraestructura del Barcelona Supercomputing Center, en concreto supercomputador MareNostrum 5, una pieza clave para las ambiciones científicas de España que está en funcionamiento desde 2023 y ha tenido un coste de más de 200 millones de euros.

Al momento de escribir este artículo se han publicado cinco modelos bajo licencia Apache 2.0 con su correspondiente documentación en Hugging Face y GitHub. Esto permite que aquellos interesados en sumergirse en ALIA puedan descargar los modelos y ajustarlos a sus propias necesidades. Cabe señalar que acceder a ellos no es tan fácil como abrir la aplicación de ChatGPT y comenzar a chatear. Es necesario contar con ciertos conocimientos técnicos para ponerlos en marcha. A continuación, los modelos disponibles:

  • ALIA-40B: modelo de lenguaje grande entrenado de 40 mil millones de parámetros, entrenado desde cero con 9,2 billones de tokens. Comprende 36 idiomas.
  • Salamandra-7b: modelo de lenguaje grande de 7 mil millones de parámetros, entrenado desde cero con 7,8 billones de tokens. Comprende 36 idiomas.
  • Salamandra-7b-instruct: modelo de lenguaje grande entrenado con 276 mil instrucciones en inglés, castellano y catalán recogidas de varios corpus abiertos.
  • Salamandra-2b: modelo de lenguaje grande de 2 mil millones de parámetros, entrenado desde cero con 7,8 billones de tokens. Comprende 35 idiomas.
  • Salamandra-2b-instruct: modelo de lenguaje grande con 276 mil instrucciones en inglés, castellano y catalán recogidas de varios corpus abiertos.

Una pregunta que nos hacemos a menudos es con qué datos han sido entrenados los modelos de IA. No todos los actores del mundo de la IA son transparentes en este caso, pero esto no debería ser un problema en el caso de ALIA, donde se promete la transparencia. Poniendo como ejemplo ALIA-40B, podemos decir que se han utilizado una variedad de fuentes. Aquí encontramos datos de Common Crawl, GitHub, Wikimedia (Wikimedia, incluidas Wikipedia, Wikilibros, Wikinoticias, Wikiquote, Wikisource y Wikivoyag), EurLex, entre otros.

Pues bien, ahora que ya están aquí los primeros modelos puede que también te preguntes qué viene a continuación. En principio, más modelos de IA de la familia ALIA con el paso del tiempo. Adicionalmente, el Gobierno ha prometido destinar 150 millones de euros para ayudar a las empresas españoles a integrar el uso de la IA. No se trata de una promesa nueva, sino de una que se remonta a la Estrategia de Inteligencia Artificial 2024. Una porción de dinero (20 millones de euros) se destinará a 500 pequeñas y medianas empresas.

Imágenes | La Moncloa | ALIA

En Xataka | OpenAI prepara una IA con nivel de doctorado. Es tan prometedor que primero se lo enseñará al Gobierno de EEUU

-
La noticia Pedro Sánchez anuncia el lanzamiento de los primeros modelos de ALIA: así es la IA "pública y abierta” que impulsa el Estado fue publicada originalmente en Xataka por Javier Marquez .

Fuente

Xataka.com

Xataka.com

Lo + visto

Comentarios

Escribe un comentario