Breaking news
Tercer Boletín Deportivo – footboom1.com -
Una meseta al alcance de Staal contra los Sabres -
Pronóstico Ons Jabeur Camila Osorio GRATIS -
Arsenal y Newcastle se acercan cada vez más al Liverpool -
Espaly/PSG (2-4), París estaba caliente -
Publicidad por cuenta propia: Sané prospera en el Bayern -
Bundesliga – victorias de Múnich y Stuttgart -
El cambio de Leroy Sané está dando sus frutos -

2025, ¿el año en el que nos faltan datos para la IA?

2025, ¿el año en el que nos faltan datos para la IA?
2025, ¿el año en el que nos faltan datos para la IA?
-

Si 2024 fue el año en que pusimos el pie en el freno de la IA, ¿podría ser 2025 el año en que la IA comience a quedarse sin datos nuevos confiables?

Este sería un problema de consecuencias mucho mayores para el desarrollo de estas inteligencias artificiales generativas como ChatGPT: porque para “entrenarlas” hemos podido alimentarlas hasta ahora con cantidades astronómicas de información disponible en Internet, y datos en continuo. crecimiento. Gracias a ellos, ChatGPT y otras aplicaciones de este tipo pueden producir textos o imágenes a una velocidad fenomenal: estas IA generativas tienen la capacidad de “predecir” una respuesta a una pregunta, una secuencia de palabras o un píxel, a partir de una masa de datos que ponemos a su disposición.

Pero ni siquiera Internet es infinito: y han pasado dos años desde que los expertos predijeron que alcanzaríamos sus límites con bastante rapidez. El “contenido de alta calidad” utilizable para impulsar estas aplicaciones se acabará en 2026, según una evaluación resumida realizada en octubre de 2022 por un grupo de investigadores de la empresa EpochAI. El mismo grupo publicó una estimación en 2024 situando este límite en 2028, pero la diferencia radica en cómo definimos “contenido de alta calidad”.

En su última estimación, el tamaño de las bases de datos utilizadas para entrenar la IA está creciendo un 100% por año, mientras que el tamaño del contenido “utilizable” en Internet sólo está creciendo un 10% por año – de ahí un “cuello de botella”. “estrangulamiento inminente”.

Una de las soluciones más preocupantes sería continuar “entrenando” IA generativas, pero con contenido diseñado… por otras IA generativas. Sin embargo, si ya carecemos de soluciones para limitar la producción de información falsa por parte de estas IA, entramos en un territorio aún más vago si las IA deben alimentarse de contenido creado por IA.

Incluso es posible que ya hayamos empezado a entrar en este cuello de botella, comentado en diciembre en la revista Naturalezala investigadora Shayne Longpre quien, en el Instituto de Tecnología de Massachusetts, lidera un proyecto para evaluar la calidad de los datos utilizados para impulsar la IA.

Los propietarios de datos contraatacan

Al mismo tiempo, algunos propietarios de estos datos disponibles en Internet, como los editores de periódicos, han comenzado a exigir que las empresas de inteligencia artificial les paguen regalías por el uso de su contenido, considerando que se supone que este contenido generará ingresos. Crecimiento exponencial para las empresas de TI. EL New York Times fue el primero, en diciembre de 2023, en demandar a la empresa OpenAI y a su socio Microsoft; En abril de 2024, ocho periódicos estadounidenses presentaron una demanda conjunta.

Los autores de la evaluación de 2022 también tuvieron cuidado de distinguir el contenido de “calidad”, que incluía libros, informes periodísticos, investigaciones científicas y códigos informáticos; estos contenidos tienen en común que su producción es económicamente costosa, a diferencia del texto generado por IA.

También hay producciones de menor calidad, que van desde vídeos de YouTube hasta textos de todo tipo que circulan en los foros de Facebook, mensajes de WhatsApp, etc.: la cantidad total de esta otra parte de información es difícil de medir, pero los diseñadores de una IA sobre la que Se supone que el público debe confiar en la información fiable, podría dudar en dejarse abrumar por contenidos de menor calidad.

Suscríbete a nuestro extenso boletín

Anímate por el precio de un café.

-

PREV Risas con los actores de Fraternelle este fin de semana
NEXT Foto radares | Cien millones en multas en 2024