Cocreator, subtítulos en vivo… Probamos las nuevas funciones de IA del PC Copilot+ de Microsoft

-

Presentadas en mayo por Microsoft, las PC Copilot+ están disponibles para su compra desde el martes 18 de junio. El JDN pudo probar las principales funciones de IA presentadas por Microsoft.

Microsoft los anuncia como el futuro de la informática personal. Las nuevas PC Copilot+ están disponibles para su compra desde el martes 18 de junio. La gama de Microsoft se basa en el Surface Pro de 11.ª generación, desde 1.115 € y el Surface Laptop 7 desde 1.199 €. Las nuevas funciones de IA anunciadas por Microsoft también deberían llegar muy pronto, gracias a una actualización de Windows, a los PC de las marcas asociadas de Microsoft equipados con una NPU (Dell, HP y Samsung en particular).

La NPU, ¿el chip que lo cambia todo?

De hecho, las nuevas PC Copilot+ se centran en un componente importante: la NPU, por Neural Processing Unit, que permite que el aprendizaje automático y los modelos de IA generativa se ejecuten localmente de una manera más eficiente. El chip puede realizar cálculos complejos relacionados con el funcionamiento de redes neuronales artificiales. En el caso de los nuevos PC de Microsoft, las NPU las suministra actualmente Qualcomm. Están equipados con al menos, según la gama, 40 NPU TOPS, capaces de realizar 40×10^12 operaciones por segundo.

Con estas NPU, la inferencia será más rápida y energéticamente más eficiente que una CPU o GPU. Por lo tanto, el procesador y la tarjeta gráfica se “descargan” de la inferencia de los modelos AI y ML, lo que permite a la PC un ahorro sustancial de energía. La autonomía general, en un ordenador portátil, es aún mejor.

Como parte de un evento de presentación de prensa, pudimos tomar el control de las PC Copilot+. Por el momento, las principales funcionalidades de IA todavía parecían abstenerse de la NPU, pero Microsoft promete que una actualización que se está implementando actualmente permitirá el uso del 100% de la NPU para realizar inferencias.

Cocreator en Paint: para generar visuales rápidamente

Disponible en el software de edición de imágenes insignia de Windows Paint (redesignado para la ocasión), Cocreator facilita la creación de imágenes a partir de un mensaje y un boceto. El principio es simple: sólo hay que dibujar rápidamente, con el ratón o el lápiz digital, una forma o diagrama muy sencillo y añadir un mensaje que especifique la imagen esperada.

Por ejemplo, dibujamos una figura de palitos y le pedimos a la IA que dibuje a un hombre. En unos segundos, Cocreator genera un dibujo final: una silueta bastante limpia de un hombre. El resultado no es excepcional. La IA sigue el patrón enviado y genera una imagen generalmente coherente (ver más abajo) pero que sigue siendo muy simple lejos de una imagen generada por Midjourney. Los recursos de NPU no permiten ejecutar modelos de conversión de texto a imagen muy avanzados. El creador de imágenes también le permite seleccionar un estilo predefinido para usar en la generación de imágenes (Pixel Art, Photorealist, etc.). Paint también tiene una herramienta más clásica llamada “Creador de imágenes” que le permite generar una imagen completa con un mensaje.

El resultado final generado por la IA. BP/JDN © BP / JDN

Teóricamente, la generación de imágenes se realiza localmente, gracias a la NPU, pero en la práctica, el sistema aún requiere conectividad a Internet. Las solicitudes dirigidas a la IA se procesan parcialmente en la nube para, por un lado, filtrar las solicitudes inapropiadas (NSFW) y, por otro, comprobar si la imagen generada cumple con los derechos de autor antes de presentarla al usuario (es teóricamente imposible). para generar la imagen de una M amarilla sobre fondo rojo para reproducir el logo de McDonald’s). Hemos notado que es imposible utilizar Cocreator sin Internet.

Subtítulos en vivo: transcripción local en vivo

Funcionalidad 100% local y no depende de la nube, Live Captions le permite transcribir en vivo todo el contenido de audio que se reproduce en la computadora. El texto se transmite en vivo sin latencia a la pantalla del usuario. Captions es capaz de transcribir y traducir 44 idiomas a subtítulos, de momento sólo inglés. Sin embargo, Microsoft planea incluir nuevos idiomas en futuras actualizaciones.

Transcripción en vivo mostrada por Live Captions. © BP / JDN

Pudimos probar la herramienta en vivo en un video de YouTube: la transcripción se muestra en vivo casi sin latencia. Live Captions también te permite transcribir en vivo desde el micrófono, siempre de forma local. También en este caso la prueba resulta bastante buena. Sin embargo, la IA de Microsoft tiene dificultades para comprender con precisión el contexto de la discusión en presencia de ruido circundante. Live Captions todavía está lejos de ser un modelo OpenAI Whisper, pero su funcionamiento en el dispositivo lo convierte en una herramienta prometedora.

Efectos de Windows Studio: efectos elegantes en la cámara web en vivo

Windows Studio Effects permite, nuevamente gracias a la NPU, aplicar efectos de estilo en vivo a la transmisión de video entrante desde la cámara web de la PC Copilot+. Desenfoque de fondo, recorte automático, iluminación facial automática… Windows Studio Effects aplica los efectos en vivo. Muchos de estos efectos de estilo ya están disponibles de forma predeterminada en varias soluciones de videoconferencia, pero Windows Studio Effects permite ejecutarlos directamente en la NPU en lugar de en la CPU y/o GPU. Una ganancia notable en eficiencia energética para el PC.

Windows Studio Effects también ofrece una característica original para presentaciones por videoconferencia: Eye Contact. Eye Contact le permite estabilizar virtualmente el movimiento de sus ojos cuando lee sus notas. Tus interlocutores sólo verán tus ojos, fijos, delante de la cámara. Una característica que, en la práctica, deja espacio para un resultado final bastante artificial (los ojos no se mueven durante varios segundos).

Recordemos, en gran medida ausente del lanzamiento.

Esta era la característica más esperada pero falta. La recuperación permite, mediante la grabación periódica de la pantalla de la computadora, consultar a la IA sobre la actividad pasada en la computadora. Por ejemplo, después de planificar un viaje en su navegador, podría consultar la IA para solicitar la lista de hoteles vistos durante su última hora. Inicialmente planeado para su implementación pública, Recall inicialmente estará destinado solo a miembros del programa Windows Insider. De hecho, Microsoft ha retrasado la llegada de Recall tras numerosos problemas relacionados con la seguridad de la herramienta. Por el momento es imposible saber la fecha exacta de lanzamiento, pero el día D no parece inminente.

Con su PC Copilot+, Microsoft marca la llegada de la IA integrada a sus dispositivos. Con la presentación de Cocreator, Live Captions y Windows Studio Effects, la firma de Redmond pretende demostrar las primeras posibilidades que ofrecen las NPU. Sin embargo, lamentamos que Microsoft no haya impulsado más sus capacidades de IA en el dispositivo. Un LLM inferido localmente, como predice Apple Intelligence, podría haber atraído a muchos usuarios profesionales que buscaban una IA rápida, confidencial y utilizable fuera de línea.

-

PREV Buen trato: 200 € de descuento en la bicicleta de gravel Triban GRVL 520 de Decathlon
NEXT K 2000, Parque Jurásico, Regreso al futuro… Forza Horizon 5 repite clásicos del cine