OSI publica su definición de IA de código abierto

Thursday 31st October 2024 09:12 AM

En All Things Open 2024, uno de los eventos de la industria de código abierto más importantes de América del Norte, la Open Source Initiative (OSI) anunció la publicación de la primera definición oficial de código abierto de IA, OSAID.

Modelos como Gemma de Google a menudo se denominan modelos “abiertos”, lo que puede generar confusión con el término “código abierto” al presentarlos. Aunque todos los modelos de código abierto son abiertos, no todos los modelos abiertos necesariamente cumplen con los criterios de código abierto.

Para OSI, un sistema de IA de código abierto proporciona no solo una estructura funcional, sino también elementos distintos como modelos, pesos y parámetros en condiciones que garantizan cuatro libertades esenciales:

Libertad de uso : Usar el sistema de IA para cualquier propósito, sin autorización previa.
Libertad de inspección : Estudiar el funcionamiento interno del sistema.
Libertad de modificación : Modificar el sistema para adaptar sus respuestas o capacidades para otros fines.
Libertad para compartir : Distribuir el sistema o sus versiones modificadas a otros usuarios, para diversos fines.

Los requisitos técnicos de la IA de código abierto

Un modelo de IA se compone de tres elementos: la arquitectura, los parámetros o pesos y el código de inferencia. Para que un modelo sea considerado de código abierto, cada uno de estos elementos debe ir acompañado de la información necesaria para modificarlo y comprenderlo. Según OSI, es esencial brindar acceso a tres elementos clave:

Información de datos : Se debe documentar el origen, procesamiento y características de los datos de entrenamiento (origen de los datos, métodos de selección, etiquetado y filtrado);
Código fuente completo : El código utilizado para entrenar y ejecutar el modelo debe estar disponible, incluido el procesamiento, las pruebas y la validación de datos;
Parámetros del modelo y peso. : Los pesos y otros parámetros aprendidos (puntos de control de entrenamiento, estado final del optimizador, etc.) deben ser accesibles para permitir la reproducción o personalización del modelo.

Stefano Maffulli, director ejecutivo de OSI, comenta:

“Llegar hoy a la versión 1.0 de OSAID ha sido un viaje difícil, lleno de nuevos desafíos para la comunidad OSI. A pesar de este delicado proceso, lleno de opiniones divergentes y límites técnicos inexplorados, y ocasionales intercambios acalorados, los resultados están alineados con las expectativas establecidas al inicio de este proceso de dos años. Este es un punto de partida para un esfuerzo continuo por involucrarnos con las comunidades para mejorar la definición con el tiempo, a medida que desarrollamos con la comunidad de código abierto más amplia el conocimiento necesario para leer y aplicar OSAID v.1.0”.

Validación y soporte a OSAID

Como parte de la validación y prueba de OSAID, los voluntarios evaluaron si 13 sistemas de IA proporcionaban las libertades esperadas. Los modelos que han pasado la fase de validación son: Pythia (Eleuther AI), OLMo (AI2), Amber y CrystalCoder (LLM360) y T5 (Google). Otros modelos, como BLOOM (BigScience), Starcoder2 (BigCode) y Falcon (TII), podrían aprobarse si cambian sus licencias o términos legales.

Por otro lado, algunos modelos, como Llama2 (Meta), Grok (X/Twitter), Phi-2 (Microsoft) y Mixtral (Mistral), no han sido validados por falta de componentes o acuerdos legales incompatibles con los principios de código abierto.

La Open Source Initiative aclara que estos resultados deben considerarse parte del proceso de definición y aprendizaje, y no constituyen certificaciones. Continuará validando únicamente documentos legales y no validará ni revisará sistemas de IA individuales, del mismo modo que no valida ni revisa proyectos de software.

Por el momento, una veintena de empresas u organizaciones apoyan esta versión 1.0 de OCAID. Entre ellos, el instituto de investigación EleutherAI, Bloomberg, Mozilla, LLM360, CommonCrawl, Linagora Labs, Nextcloud, OpenInfra Foundation, SUSE, Eclipse Foundation, Mercado Libre…

Como era de esperar, las empresas cuyos modelos fueron refutados como de código abierto prefirieron abstenerse… Un portavoz de Meta dijo:

“Estamos de acuerdo con nuestro socio OSI en muchas cosas, pero nosotros, como otros en la industria, no estamos de acuerdo con su nueva definición. No existe una definición única de IA de código abierto, y definirla es un desafío porque las definiciones de código abierto anteriores no abarcan las complejidades de los modelos de IA que están evolucionando rápidamente en la actualidad. Hacemos que Llama sea gratuito y esté disponible gratuitamente, y nuestra política de licencias y uso aceptable ayuda a mantener a las personas seguras al implementar algunas restricciones. Continuaremos trabajando con OSI y otros grupos de la industria para hacer que la IA sea más accesible y responsablemente gratuita, independientemente de las definiciones técnicas”.