Hace unas semanas, Expertos destacaron que hemos llegado al límite de datos de entrenamiento para inteligencia artificial.. A raíz de la popularidad de ChatGPT, muchas empresas han buscado emular sus capacidades, incluidas Google, Apple y Meta, que están trabajando para ofrecer asistentes de IA generativa.
Sin embargo, la voz más reconocida de la industria tecnológica ha revelado que los datos necesarios para entrenar modelos de inteligencia artificial ya no están disponibles y existe una necesidad urgente de encontrar una solución.
>> No lo creerás: ¡Elon Musk y Mark Zuckerberg se unen contra los creadores de ChatGPT!
Como señala TechCrunch, Elon Musk ha afirmado que hemos alcanzado el límite de datos del mundo real para entrenar modelos de IA. Precisa, sin embargo, que esta situación no se produjo ahora, sino que tuvo lugar hace unos meses, todavía en 2024. Elon Musk subraya así las palabras de Ilya Sutskever, ex científico jefe de OpenAI, que ya indicó en 2022 que la La industria había llegado a una situación que él llamó “datos pico”. Ante lo sucedido, el multimillonario que está en conflicto con los creadores de ChatGPT propuso una solución temporal para seguir entrenando los modelos de IA.
Las grandes empresas ya utilizan datos sintéticos
Para Elon Musk, una gran opción es utilizar datos generados por la propia inteligencia artificial, aspecto conocido como “datos sintéticos”. Esto ayudará a crear canales de aprendizaje automático y seguir los pasos de empresas como Microsoft, Meta, OpenAI y Anthropic que ya están siguiendo este camino. De hecho, según algunas estimaciones, para 2024 el 60% de los datos utilizados serán sintéticos, ya que además de todo lo anterior habrá otros beneficios como la reducción de costos.
>> “Tenía que rogarle cada vez…“: Un ex empleado de Tesla describe cómo es trabajar con Elon Musk a diario
Sin embargo, algunas investigaciones sugieren que el uso de datos sintéticos podría provocar el colapso de diferentes modelos, reduciendo la creatividad y aumentando el sesgo en los resultados. De hecho, si los datos generados presentan sesgos o limitaciones, los modelos entrenados con estos datos reproducirán esos mismos problemas en sus resultados. Sin embargo, esto no parece ser una limitación ni para Elon Musk ni para empresas como Microsoft, Google o Anthropic, dado que los han utilizado en modelos como Phi-4, Gemma y Claude 3.5 Sonnet.
Artículo escrito en colaboración con nuestros colegas de Juegos 3d.