Aunque las principales empresas de inteligencia artificial están ubicadas en Estados Unidos y Europa, China se está poniendo al día rápidamente. vitessevitesse. El DeepSeek chino se destaca cada vez más por sus grandes modelos de lenguajes publicados bajo licencia libre y capaces de competir con los de OpenAI.
Después del lanzamiento de DeepSeek-V2.5 en septiembre, que superó GPT-4GPT-4y DeepSeek Coder V2 presentado en junio que supera a GPT-4 Turbo en matemáticas y programación, aquí está DeepSeek R1-Lite-Preview. Este es un primer vistazo a este nuevo modelo que, al igual que OpenAI o1, se especializa en razonamiento complejo. Y según DeepSeek, logra superar el modelo de OpenAI en varios puntos de referencia.
Un modelo de razonamiento complejo que explica su pensamiento.
Este modelo tiene la particularidad de explicar su cadena de pensamiento (CoT), permitiendo seguir las diferentes etapas de su razonamiento. Y se toma su tiempo. El chatbot indica el tiempo dedicado a pensar, que suele rondar los treinta segundos. Según las pruebas realizadas por DeepSeek, su R1-Lite-Preview es particularmente bueno en inferencias lógicas, razonamiento matemático y resolución de problemas en tiempo real. Incluso obtiene una puntuación mejor que OpenAI o1 en los puntos de referencia de matemáticas AIME y MATH, y puntuaciones muy similares en programación, incluidos Codeforces y LiveCodeBench.
DeepSeek aún no ha compartido el código y los pesos de su nuevo modelo, pero es posible probarlo gratis en su sitio chat.deepseek.com, con un límite de 50 mensajes por día. Sin embargo, la empresa indicó enGorjeoGorjeo) que el modelo yAPIAPI debería llegar pronto.