Dejar un rato Internet y coger un buen libro… En busca de datos para perfeccionar sus modelos, los gigantes de la IA parecen recurrir al mundo de los libros. La editorial estadounidense HarperCollins acaba de ofrecer a algunos de sus autores un contrato con una empresa de inteligencia artificial (IA), cuya identidad es confidencial, para permitirles utilizar sus obras publicadas para entrenar su modelo de inteligencia artificial generativa.
Al hacer clic en“Acepto”aceptas el depósito de cookies por parte de servicios externos y así tendrás acceso al contenido de nuestros socios.
Acepto
Y para pagar mejor 20 Minutos, no dude en aceptar todas las cookies, aunque sea por un solo día, a través de nuestro botón“Acepto por hoy” en el banner de abajo.
Más información en la página de Política de gestión de cookies
En una carta consultada por la AFP, la empresa de inteligencia artificial ofrece 2.500 dólares por libro seleccionado para entrenar su modelo lingüístico durante un período de tres años. Porque para poder producir todo tipo de contenidos a partir de una consulta sencilla en el lenguaje cotidiano, los modelos de IA generativa deben alimentarse con una cantidad cada vez mayor de datos.
No es la primera vez
La oferta fue muy bien recibida en el sector editorial y escritores como el estadounidense Daniel Kibblesmith la rechazaron tajantemente: “Probablemente lo haría por mil millones de dólares. Lo haría por una suma de dinero que ya no me requeriría trabajar, ya que ese es el objetivo final de esta tecnología”, se quejó el autor en la red social Bluesky. Si HarperCollins es una de las editoriales más grandes hasta la fecha en cerrar este tipo de acuerdo, no es la primera. La editorial estadounidense de libros científicos Wiley dio acceso a “el contenido de libros académicos y profesionales publicados para un uso específico en modelos de formación, por 23 millones de dólares, a una gran empresa tecnológica”, afirmó en marzo de este año, al presentar sus resultados financieros.
tendrás que pagar
Es posible que las empresas de tecnología ya no tengan otra opción para mejorar sus productos que profundizar, especialmente cuando comienzan a quedarse sin nuevos materiales para impulsar los modelos.
La prensa estadounidense informó recientemente que los nuevos modelos en desarrollo parecen haber llegado a su límite, en particular en Google, Anthropic y OpenAI.
“En Internet se recopilan contenidos lícitos e ilícitos y muchos contenidos pirateados. Esto plantea un problema jurídico. Sin olvidar el problema de la calidad de los datos”, observa Julien Chouraqui, de la SNE: “si queremos desarrollar un mercado sobre bases virtuosas, debemos implicar a todos los actores. »