Mistral AI lanza una bomba llamada Pixtral-Large, capaz de vencer a Gemini 1.5 Pro y GPT-4o

Mistral AI lanza una bomba llamada Pixtral-Large, capaz de vencer a Gemini 1.5 Pro y GPT-4o
Mistral AI lanza una bomba llamada Pixtral-Large, capaz de vencer a Gemini 1.5 Pro y GPT-4o
-

Mistral AI acelera el ritmo. La start-up francesa más destacada en el ámbito de la IA quiere demostrar su valía. Y para conseguirlo, no duda en esforzarse al máximo en el desarrollo de sus modelos. Prueba de ello es su último modelo, recién lanzado: Pixtral Large. En detalle, es un modelo multimodal ponderado abierto con 124 mil millones de parámetros (solo eso) construido sobre la base de Mistral Large 2.

Segundo modelo de la familia de modelos multimodales, demuestra una comprensión de imágenes de “nivel fronterizo“, afirma la startup, destacando su capacidad para comprender documentos, gráficos e imágenes naturales, manteniendo al mismo tiempo la comprensión de textos de vanguardia de Mistral Large 2. También tiene una ventana de contexto de 128.000 tokens y puede contener al menos 30 archivos de alta definición. imágenes de resolución.

Mistral compite contra Anthropic, Google y OpenAI

En términos de rendimiento, Pixtral Large bate récords. Evaluado frente a modelos de tipo frontera en un conjunto de puntos de referencia multimodales estándar, resulta ser mejor que los modelos publicados por los competidores directos de Mistral. Así, en MathVista, que evalúa razonamientos matemáticos complejos sobre datos visuales, el modelo alcanza una puntuación del 69,4%, superando a todos los demás modelos. En comparación, Llama-3.2 90B alcanza el 49,1%, Gemini-1.5 Pro 67,8%, GPT-4o 65,4% y Claude-3.5 Sonnet 67,1%.

Para evaluar la capacidad de razonamiento en gráficos y documentos complejos, los equipos de Mistral se basaron en las pruebas ChartQA y DocVQA, donde Pixtral Large también supera a GPT-4o y Gemini-1.5 Pro.

Finalmente, Pixtral Large demuestra capacidades competitivas en la prueba MM-MT-Bench de código abierto destinada a reflejar casos de uso del mundo real de LLM multimodales. Supera a Claude-3.5 Sonnet, Gemini-1.5 Pro y GPT-4o (el más nuevo). El modelo está disponible bajo la Licencia de Investigación Mistral (MRL) para uso educativo y de investigación, afirma la startup, añadiendo que también está disponible bajo la licencia comercial Mistral para experimentación, pruebas y producción con fines comerciales.

Mistral grande actualizado

Además de Pixtral Large, Mistral Large, su modelo multilingüe publicado el pasado mes de febrero, se beneficia de una actualización. Dedicado al razonamiento de alto nivel para tareas complejas, ahora está disponible en pixtral-large-latest, la API de la startup, y bajo el nombre Mistral Large 24.11 en Hugging Face bajo la licencia Mistral Research para investigación, o con licencia comercial. de Mistral AI para uso comercial.

En comparación con Large 24.07, esta versión se beneficia de mejoras en la comprensión del contexto largo, la adición de un mensaje del sistema y una llamada de función más precisa. “El modelo funciona muy bien para RAG y flujos de trabajo agentes, lo que lo convierte en una opción adecuada para casos de uso empresarial como exploración e intercambio de conocimientos, comprensión semántica de documentos, tareas de automatización y mejora de la experiencia del cliente”, comenta la puesta en marcha. El modelo debería estar disponible rápidamente en las plataformas de proveedores, comenzandocer por Google Cloud y Microsoft Azure en una semana.

La interfaz “Le Chat” capaz de competir con ChatGPT

A Mistral le gusta hacer entradas notables. Y la última versión de su interfaz conversacional “Le Chat” es un buen ejemplo de ello. En su última actualización, la interfaz se beneficia de numerosas adiciones que harán palidecer a OpenAI y su famoso ChatGPT o incluso a Google con Gemini. Las últimas características incluyen: búsqueda web con citas, lienzo para ideas, edición y exportación en línea, integración de la última plantilla Pixtral Large para una mejor comprensión de documentos e imágenes, generación de imágenes, con tecnología de Black Forest Labs Flux Pro.

La herramienta Canvas se parece mucho a la interfaz del mismo nombre lanzada por OpenAI a principios de mes. En pocas palabras, la interfaz se muestra en la ventana de chat cuando el usuario necesita ir más allá de las conversaciones y comenzar a crear. Es posible utilizar las diferentes plantillas de Mistral en resultados compartidos y editar el contenido creado directamente en línea sin regenerar respuestas, crear versiones preliminares y previsualizar diseños.

Decidida a destacar, Mistral asegura que no busca seguir “AGI a toda costa; en cambio, nuestra misión es poner la IA de vanguardia en sus manos”. Por tanto, en “Le Chat”, el buque insignia francés ofrece un nivel gratuito con estas funciones beta y está trabajando en el desarrollo de versiones premium con mayores garantías de servicio.

Seleccionado para ti

-

PREV Daisy, la abuela IA, la pesadilla de los estafadores telefónicos
NEXT ¡El mejor televisor OLED de 2024 está a la venta para el Black Friday!