una plataforma de lanzamiento para la IA tradicional y generativa

una plataforma de lanzamiento para la IA tradicional y generativa
una plataforma de lanzamiento para la IA tradicional y generativa
-

Este método le permite crear conjuntos de datos de entrenamiento como desee. Esto presenta una ventaja significativa en áreas donde los datos de aprendizaje son escasos.

La IA generativa ha dado lugar a una nueva categoría de conjuntos de datos de entrenamiento: los datos sintéticos. Los modelos de cimentación permiten partir de un número reducido de ejemplares para aumentar artificialmente su volumen con vistas a ofrecer otros modelos que no habrían podido ver la luz sin este juego de manos. “Esta noción fue destacada en 2023 por el laboratorio de IA de la Universidad de Stanford”, recuerda Stéphane Roder, director ejecutivo de la consultora francesa AI Builders.

La IA sintética se puede utilizar por primera vez en el aprendizaje automático. Según el principio de Vapnik, cuanto más complejo sea un modelo de IA tradicional, más datos de entrenamiento necesitará. Sin información suficiente, no podrá generalizar y sus respuestas resultarán degradadas. “Pero muy a menudo nos enfrentaremos al problema. Y esto por múltiples razones. En muchos casos, tendremos un volumen de datos muy limitado. También pueden ser de mala calidad o demasiado viejos. A veces, no tenemos autorización para utilizarlos, ya que esta información no es anónima”, afirma Didier Gaultier, director de IA de Orange Business Digital Services.

Una palanca para el aprendizaje profundo

El enfoque de IA sintética es particularmente interesante para entrenar modelos de aprendizaje profundo. Redes neuronales complejas que también son similares a las tecnologías de IA generativa, aunque los científicos de datos coinciden en que esta tecnología sigue vinculada al campo de la IA tradicional. “En el campo del reconocimiento de imágenes, por ejemplo, será necesario utilizar miles de imágenes para entrenar este tipo de modelos. Y, evidentemente, será bastante raro tener contenidos de este tipo a mano”, reconoce Didier Gaultier.

En el marco de un proyecto realizado para una ONG cuya misión es la reforestación de macizos coralinos, Orange implementó una red neuronal artificial destinada a reconocer, a través de una cámara submarina, determinados tipos de peces. Objetivo: verificar que la vida silvestre realmente esté creciendo dentro de las especies objetivo. “La primera IA implementada logró contar los peces, pero no reconocerlos, ya que el modelo de aprendizaje profundo subyacente no estaba suficientemente entrenado”, indica Didier Gaultier.

“Podemos partir de unos pocos coches de diferentes marcas con sus especificaciones y luego generar un conjunto de datos de varios miles de imágenes”

¿Cómo procedió Orange Business? La ESN utilizó un generador de imágenes basado en fotografías de las principales zonas atacadas. Un generador que multiplicó estas fotografías mostrando los peces en todas las posiciones y morfologías posibles. “Obtuvimos decenas de miles de imágenes que nos permitieron volver a entrenar la red neuronal. Al final, la IA pudo reconocer todas las categorías de peces buscadas”, subraya Didier Gaultier.

Entre sus principales ventajas, la IA sintética evita el trabajo de etiquetado manual de imágenes. En el caso del reconocimiento de automóviles, podríamos, por ejemplo, comenzar con la misma lógica a partir de algunos automóviles de diferentes marcas con sus especificaciones y luego generar un conjunto de datos de varios miles de imágenes que se etiquetarán correctamente según la información inicial. Para obtener este resultado, variaremos los ángulos de disparo pero también las condiciones climáticas. Stéphane Roder opina: “Sin embargo, no es posible alcanzar la calidad de los datos etiquetados manualmente”.

La IA sintética también se puede aplicar a datos tabulares. Este método, sin embargo, requiere estar mucho más atento. “Es probable que el recurso a una regla matemática introduzca sesgos o correlaciones que no existían en los datos originales. Por lo tanto, será necesario poner en contacto a científicos de datos confirmados o incluso a estadísticos para verificar la correcta implementación del proceso”, advierte Didier Gaultier.

De la imagen al sonido

La IA sintética también se aplica al campo del vídeo y el sonido. Por ejemplo, permitirá reformular datos vocales en texto adaptado al formato escrito. Y viceversa. Conversiones que no se pueden realizar sin la intervención de un gran modelo multimodal. Este caso de uso es particularmente interesante para crear conjuntos de datos textuales a partir de grabaciones del centro de contacto y viceversa para entrenar, por ejemplo, un chatbot de audio utilizando datos textuales obtenidos de una base de datos de clientes.

“Es más que probable que OpenAI haya utilizado datos de Youtube para entrenar GPT4-o, tanto en su versión de audio como en su versión textual. Para este último, la pista de audio de la red social de vídeo se convirtió previamente en texto, lo que permitió ampliar los datos de aprendizaje”, ilustra Didier Gaultier. Y el consultor concluye: “Con la IA sintética, las empresas se darán cuenta de que tienen minas de oro de datos que no son explotables en su formato original, pero que gracias a la IA generativa pueden utilizarse en el corazón de las aplicaciones”.

-

PREV Nuki corrige todos los fallos de sus cerraduras conectadas con el Smart Lock Ultra
NEXT Predicciones de Quinté para el 15/01/2025 en Cagnes-sur-Mer