[Màj] Microsoft niega categóricamente utilizar documentos de Office para formar a sus LLM

[Màj] Microsoft niega categóricamente utilizar documentos de Office para formar a sus LLM
[Màj] Microsoft niega categóricamente utilizar documentos de Office para formar a sus LLM
-

Actualización del 29 de noviembre: Microsoft nos respondió, con explicaciones más claras que las que ya se habían indicado a otros: “ Estas afirmaciones son falsas. Microsoft no utiliza datos de clientes de aplicaciones empresariales y de consumo de Microsoft 365 para entrenar modelos de lenguaje grande (LLM) fundamentales. En algunos casos, los clientes podrán consentir el uso de sus datos para atender necesidades específicas, como por ejemplo el desarrollo de modelos personalizados, por petición expresa de determinados clientes profesionales. »

La empresa añade que el “ Una configuración en Microsoft 365 llamada “Experiencias conectadas” a la que algunos se han referido recientemente no tiene nada que ver con la forma en que Microsoft entrena modelos de lenguaje grandes y fundamentales. “. Recuerda cómo funcionan las Experiencias Conectadas (que existen desde abril de 2019), que explicamos en la primera versión de este artículo.

Artículo original del 28 de noviembre: Microsoft ha tenido un problema durante varios días. El 24 de noviembre, la cuenta NixCraft, seguida por más de 374.000 suscriptores, publicó un mensaje de advertencia en X:

« Microsoft Office, como muchas empresas en los últimos meses, ha habilitado furtivamente una función de “exclusión voluntaria” que toma sus documentos de Word y Excel para entrenar sus sistemas internos de inteligencia artificial. Esta función está habilitada de forma predeterminada y debe desmarcar manualmente una casilla para deshabilitarla. Si es un escritor que utiliza MS Word para escribir contenido propietario (publicaciones de blog, novelas o cualquier otro trabajo sobre el que pretenda proteger y/o vender), querrá desactivar esta función inmediatamente.. »

¿Qué función es esta? Experiencias conectadas. Sin embargo, estos existen desde hace mucho tiempo. En su sitio, Microsoft enumera estos famosos experimentos. Contienen todo lo que directa o indirectamente se relaciona con una función en línea dentro de las aplicaciones de Office. Entre estas funciones encontramos cualquier llamada a datos externos, dictado, asistente de escritura (y por tanto corrección ortográfica y gramatical), lectura en voz alta, comprobación de similitudes, transcripción de grabaciones o incluso cocreación de documentos.

Estas funciones están disponibles en las versiones de Office para Windows y Mac, así como en las versiones en línea de la suite ofimática.

Análisis de datos versus capacitación

Rápidamente, la publicación sobre X generó muchas reacciones de indignación, pero no sólo eso. Las voces comenzaron a señalar que las Experiencias Conectadas no eran nuevas, y que no se mencionaba este uso de datos con fines de formación LLM.

En su declaración de privacidad, Microsoft indica que los datos pueden usarse con fines de análisis, de modo que las funciones solicitadas puedan surtir su efecto. Por otro lado, no hay indicios de que se recuperen para modelos de lenguaje grandes, a diferencia de otros servicios como Copilot o LinkedIn.

Microsoft responde, pero…

Para sofocar el debate, Microsoft respondió por primera vez a NixCraft el 25 de noviembre: “ En las aplicaciones M365, no utilizamos datos de clientes para capacitar a los LLM. Esta configuración solo habilita funciones que requieren acceso a Internet, como la coautoría de un documento. “. La empresa agregó el enlace que enumera Experiencias Conectadas.

Al mismo tiempo, comunicó a varios estadounidenses un mensaje que quería ser igual de claro: “ Microsoft no utiliza datos de clientes de aplicaciones comerciales y de consumo de Microsoft 365 para entrenar modelos de lenguaje grandes. Además, la configuración de Servicios conectados no tiene nada que ver con la forma en que Microsoft entrena modelos de lenguaje grandes. ».

Dependiendo del sitio podrás encontrar más o menos información adicional. En How-To Geek, un portavoz añadió: “ La configuración de Servicios conectados es una configuración estándar de la industria que habilita funciones que requieren una conexión a Internet. Las experiencias conectadas juegan un papel importante en la mejora de la productividad al integrar su contenido con los recursos disponibles en la web. ».

Pero la empresa también ha variado en sus declaraciones. A The Register, ella dijo: “ En las aplicaciones comerciales y de consumo de Microsoft 365, Microsoft no utiliza datos de clientes para entrenar modelos de lenguaje grandes sin su permiso. ».

¿Aceptar? ¿Optar por no participar? ¿Falta de claridad?

Nos hemos puesto en contacto con Microsoft para obtener aclaraciones sobre esta declaración. Tal como están las cosas, no sabemos realmente qué quiso decir la empresa. Esto podría ser un simple problema de comunicación o incluso una opción. En este caso, ¿se trata de una configuración de inclusión o exclusión voluntaria?

Se puede comprobar fácilmente qué está habilitado en Office. En Windows, desde el menú Archivo de una de las aplicaciones, debes dirigirte al panel Cuenta. Desde allí, hacemos clic en Administrar configuración. Se abre una ventana en la que puede desplazarse por las configuraciones propuestas. Un poco más abajo encontramos la opción vinculada a Experiencias Conectadas, que “ analiza tu contenido “. Está habilitado de forma predeterminada.

Recuerda que también puedes ver todas las configuraciones de confidencialidad de la cuenta de Microsoft desde esta página (debes iniciar sesión).

Actualizaremos esta noticia cuando la empresa nos responda.

-

NEXT Icono base de refuerzo de solución DCE EA FC 25 – Guías