Canonical, líder en código abierto y creador de Ubuntu, anunció hoy Data Science Stack (DSS), una solución innovadora que simplifica y acelera la creación y gestión de entornos de ciencia de datos. DSS permite a las empresas, investigadores y desarrolladores configurar de manera eficiente entornos de datos con herramientas diseñadas específicamente para satisfacer las necesidades específicas del aprendizaje automático, la inteligencia artificial (IA) y la ciencia de datos.
Es totalmente de código abierto, gratuito y nativo de Ubuntu. También está disponible en otras distribuciones de Linux, en Windows con Windows Subsystem Linux (WSL) y en macOS con Multipass. De forma predeterminada, DSS incluye acceso a Jupyter Notebook para el desarrollo de modelos, MLflow para el seguimiento de experimentos y el registro de modelos, y marcos de ML como Pytorch y Tensorflow. Sin embargo, los usuarios pueden personalizar Data Science Stack y agregar nuevas bibliotecas según su caso de uso.
DSS se puede configurar con solo tres comandos, lo que permite una exploración inicial rápida en estaciones de trabajo de IA. Todo lo que se necesita es configurar la capa de orquestación de contenedores, instalar la CLI de DSS e inicializar la pila de ciencia de datos para acceder al entorno. Esto se puede hacer en 10 a 30 minutos, según el nivel de experiencia del técnico. DSS también proporciona rutas de migración, lo que los ayuda a escalar sus iniciativas de IA a medida que los proyectos maduran.
Para obtener acceso anticipado a las mejoras de rendimiento y capacidades como la compatibilidad con GPU de Intel antes de que lleguen al mercado, puede acceder a ITEX e IPEX, las distribuciones de PyTorch y Tensorflow de Intel. IPEX e ITEX mejoran el rendimiento de la optimización en función del hardware, aprovechando las extensiones de vector avanzadas (AVX), las instrucciones de red neuronal vectorial (VNNI) y las extensiones de matriz avanzadas (AMX). Al integrar estas extensiones, además de la aceleración de GPU, DSS obtiene aceleración para operaciones comunes en casos de uso de IA, lo que reduce el tiempo de entrenamiento del modelo y acelera la fase de experimentación de los proyectos de ML.
Canonical ofrece mantenimiento de seguridad para todos los paquetes incluidos en la solución, lo que permite la aplicación oportuna de parches de vulnerabilidades y la protección tanto del software como de los artefactos creados. La oferta también incluye una gestión simplificada de las dependencias y versiones del software, lo que reduce los desafíos técnicos a los que suelen enfrentarse los científicos de datos al implementar modelos de IA y aprendizaje automático. Canonical ha puesto especial énfasis en la optimización de las infraestructuras en la nube para el Data Science Stack. Gracias a la integración con Kubernetes y al soporte nativo para Ubuntu, resulta más fácil implementar y escalar en entornos híbridos o multicloud, beneficiándose de una infraestructura robusta y segura.
“Esto elimina la carga de administrar dependencias de paquetes o configurar recursos computacionales, con comandos simples que los profesionales de IA pueden ejecutar”, dijo Chris Schnabel, líder del ecosistema de Silicon Alliance en Canonical. “De manera predeterminada, DSS incluye acceso a Jupyter Notebook para el desarrollo de modelos, MLflow para el seguimiento de experimentos y el registro de modelos, y marcos de ML como Pytorch y Tensorflow. Sin embargo, los usuarios pueden personalizar Data Science Stack y agregar nuevas bibliotecas según su caso de uso”.
Related News :