Quién es Scale AI, la startup que hace el trabajo sucio de las estrellas de la IA, acusada de “esclavitud moderna”

Quién es Scale AI, la startup que hace el trabajo sucio de las estrellas de la IA, acusada de “esclavitud moderna”
Quién es Scale AI, la startup que hace el trabajo sucio de las estrellas de la IA, acusada de “esclavitud moderna”
-

Su última gran recaudación de fondos (1.000 millones de dólares) no hizo mucho ruido. Y por una buena razón: Scale AI es una empresa en la sombra. La que se define como “ una fundición de datos » trabaja para los gigantes del mundo: Microsoft, Meta, el favorito de la inteligencia artificial OpenAI, pero también para los fabricantes de automóviles y el ejército estadounidense. Escale las etiquetas de IA y verifique los datos utilizados por estas organizaciones para entrenar sus modelos de inteligencia artificial. Para obtener resultados mejores y más precisos, estos sistemas necesitan datos precisos y de buena calidad. Y aquí es donde opera la empresa californiana. Es ella en particular quien garantiza que ChatGPT esté filtrado de cualquier contenido violento y de odio, y quien edita algunas de sus producciones para evitar que produzca galimatías. También es quien etiqueta fotografías de árboles o peatones, para evitar que futuros vehículos autónomos los confundan.

Su nueva financiación proviene en particular del fabricante de chips Nvidia, Amazon, Meta, el fondo americano Accel, la incubadora Y Combinator (que es uno de sus inversores históricos) e incluso Nat Friedman, antiguo director de Github que se convirtió en la empresa favorita del sector. ángel. Scale AI había recaudado previamente alrededor de 600 millones de dólares desde su lanzamiento en 2016, incluida una Serie E de 325 millones de dólares en 2021 que la valoró en alrededor de 7 mil millones de dólares. Tres años después, y a pesar de un período más complicado durante el cual despidió al 20% de su fuerza laboral el año pasado, Scale AI está ahora valorada en 13.800 millones de dólares.

Cree “abundancia de datos” para lograr “GPT-10”

“Nuestra visión es la de abundancia de datos, donde tenemos los medios de producción para continuar ampliando los LLM de vanguardia en varios órdenes de magnitud. No debemos estar limitados por los datos para lograr GPT-10”, especifica Alexandr Wang, fundador de la empresa. Para el directivo, el problema de “ escasez de datos », que suele ser motivo de preocupación en el sector, es una elección. Él cree que su empresa es capaz de cumplir “ una gran cantidad de datos “. Cree que para ello debemos ir más allá de los datos simplemente accesibles en línea.

Inteligencia artificial: 16 gigantes (OpenAI, Google, Microsoft, Meta…) apuestan por una mayor seguridad

En una entrevista con el podcast Not Prior, el joven líder explica el problema un poco más claramente. “Desde que trabajamos en el tema de la IA generativa (…) las ambiciones han aumentado considerablemente. Pasamos del GPT-3, que fue un paso importante, pero siguió siendo un modelo modesto, a hoy donde queremos crear agentes autónomos, capaces de razonar, dominar diferentes medios y diferentes lenguajes…”

Para lograr estos objetivos mucho más ambiciosos, los modelos ya no pueden simplemente leer comentarios en Reddit y otros textos fácilmente accesibles en línea, explica. Necesitan datos valiosos, a los que él llama “datos de vanguardia” (datos de frontera). Puede ser la transcripción del razonamiento de los mejores expertos o incluso datos de empresas…

Para producir estos datos, Scale AI recurre desde hace dos años a expertos de diferentes campos: matemáticos, físicos, periodistas deportivos, escritores, historiadores, poetas, especialistas en una determinada lengua… Su papel: revisar las producciones de las grandes lenguas. modelos, o producir nuevos contenidos que se utilizarán para entrenarlos.

4 horas de trabajo por 20 céntimos

Aunque es esencial para el desarrollo de la inteligencia artificial, el trabajo de Scale AI no siempre es estelar. En el verano de 2023, el El Correo de Washington compara las condiciones de trabajo de Scale AI con las de un “taller de explotación digital”. Los medios estadounidenses fueron a encontrarse con los filipinos que trabajan para Scale AI. Todos son independientes y trabajan desde casa o en cibercafés. Se quejan de pagos atrasados ​​o cancelados, de salarios de miseria (a menudo por debajo de la media nacional de entre 6 y 10 dólares al día según la región). Charisse, de 23 años, dice por ejemplo que trabajó 4 horas para una tarea por la que le debían pagar 1 dólar. Finalmente recibió 30 centavos. Cuestionado, un portavoz de Scale AI afirma que las condiciones de pago “mejorando cada día”.

En el centro de esta investigación: la plataforma Remotetasks, propiedad de Scale AI. Esto permite a autónomos de todo el mundo (240.000 según la plataforma) conectarse para trabajar. “al trabajo”. Cuanto más complejo sea, mejor se supone que se les pagará. Esto es lo que anuncia Remotetasks en la página de inicio de su sitio. La remuneración también dependería de la velocidad de ejecución y de la calidad del trabajo, indica el Revisión de tecnología del MIT. Esto incita a los trabajadores a aceptar cargas de trabajo muy intensas. En Filipinas hay 10.000 personas conectadas al sitio, informa el El Correo de Washington. Pero la plataforma también está muy presente en Kenia y Venezuela.

Este modelo a veces se denomina “haga clic en trabajar ” O “trabajo digital” no es nuevo. Es incluso común en el mundo de la inteligencia artificial y ha sido denunciado desde hace varios años por investigadores como el sociólogo Antonio Casilli y la especialista en trabajo digital Sarah Roberts. Se trata, en particular, del modelo Amazon Mechanical Turks, que existe desde 2005 y que emplea a decenas de miles de personas. Muchos otros sitios utilizan este sistema: Appen, Hive Micro o incluso Mighty AI. Todos tienen su sede en los Estados Unidos.

97 trabajadores kenianos denuncian la “esclavitud moderna”

En los últimos meses, los trabajadores de estas plataformas, y en particular de Scale AI, se han movilizado más para exigir mejores condiciones laborales y remuneración.

Inteligencia artificial: ¿qué papel desempeñarán los investigadores dentro de 30 años?

El 22 de mayo, 97 trabajadores kenianos publicaron una carta abierta dirigida al presidente Joe Biden (en ese momento de visita en su país), transmitida por la revista cableado. Estos últimos se describen a sí mismos como “etiquetadores de datos” (etiquetadores de datos) que trabajan para Scale AI y otros subcontratistas de Meta, TikTok y OpenAI.

“Nuestras condiciones laborales son similares a la esclavitud moderna”, escriben. Hacemos este trabajo a costa de nuestra salud, nuestras vidas y nuestras familias. Los gigantes tecnológicos estadounidenses están exportando sus trabajos más duros y peligrosos al extranjero. Este trabajo es agotador mental y emocionalmente. Limpiamos la web (…) Etiquetamos imágenes y textos para entrenar herramientas de IA generativa como OpenAI. Nuestro trabajo implica observar asesinatos y decapitaciones, abuso y violación infantil, pornografía y bestialidad, a menudo durante más de 8 horas al día. Muchos de nosotros hacemos este trabajo por menos de 2 dólares la hora. »

Los expertos de diversos campos citados anteriormente, que permiten a Scale AI producir los datos. “vanguardia” para OpenAI y otros, también son independientes pero tienen su sede en Europa y Estados Unidos. Les pagan mucho mejor: entre 30 y 60 dólares la hora. Pero ellos también sufren de inestabilidad, informa cableado. En ocasiones, la plataforma los desconecta repentinamente, sin explicación, cortándolos de sus ingresos. Además, subrayan los medios estadounidenses, trabajan para una tecnología que potencialmente hará que su trabajo quede obsoleto. “Transmito a la máquina conocimientos que tengo y que ella no tiene”dice Jay (su nombre ha sido cambiado a petición suya), un matemático de unos veinte años, pagado por Remotasks para decirle a ChatGPT si su razonamiento matemático es correcto o no.

-

NEXT Sepa dónde ver transmisiones en vivo y transmisiones por televisión en India