comparación de precios simbólicos

Wednesday 13th November 2024 02:50 AM

Resumen de los precios de los principales modelos de lenguajes grandes en función del número de tokens solicitados a través de su API. Los precios pueden variar completamente dependiendo de las ofertas.

Los LLM se facturan mediante “token”, una unidad de medida que representa segmentos de texto, es decir, palabras o fragmentos de palabras. En general, los modelos de lenguaje grande (LLM) valoran los tokens de entrada (los enviados al modelo) y los tokens de salida (los generados en respuesta) por separado. Este método de facturación permite a los usuarios estimar el costo en función del volumen de datos procesados por los LLM disponibles en forma de API. Según la definición de OpenAI, un token corresponde, en inglés, a 0,75 palabras. La siguiente tabla resume los precios estimados por token para los principales LLM del mercado, ya sean de entrada o de salida.

Precio de los principales LLM según la cantidad de tokens
Modelo	Proveedor	Precio por 1000 tokens de entrada	Precio por salida de 1000 tokens	Número total de tokens admitidos
GPT-4o (omni)	Abierto AI	0,05 dólar	0,15 dolares	128 000
GPT-4 Turbo	Abierto AI	0,1 dólar	0,3 dólar	128 000
GPT-4	Abierto AI	0,3 dólar	0,6 dólar	8 000
Claude 3 Haiku	antrópico	0,0025 dólares	0,0125 dólares	200 000
Soneto de Claudio 3	antrópico	0,03 dólar	0,15 dolares	200 000
Cerrar 3 Trabajo	antrópico	0,15 dolares	0,75 dolares	200 000
Llama 3 70b	Meta (a través de AWS)	0,00265 dólar	0,0035 dólar	8 000
Llama 2 70b	Meta (a través de AWS)	0,00195 dólar	0,00256 dólar	4 000
Géminis 1.0 Pro	Google	0,005 dólares	0,015 dólares	32 000
Géminis 1.5 Pro	Google	0,07 dolares	0,21 dólares	1 000 000
Dominio	Adherirse	0,1 dólar	0,2 dolares	4 000
Comando R	Adherirse	0,005 dólares	0,015 dólares	132 000
Comando R+	Adherirse	0,03 dólares	0,15 dolares	128 000
Mixtral 8x7B	Mistral AI (a través de Anyscale)	0,005 dólares	0,005 dólares	32 000
Mistral Pequeño	Mistral AI	0,02 dólares	0,06 dólares	32 000
Mistral grande	Mistral AI	0,08 dolares	0,24 dolares	32 000
GPT-3.5 Turbo	Abierto AI	0,12 dolares	0,16 dólares	4 000
Palma 2	Google	0,02 dólares	0,02 dólares	8 000

Análisis de modelos

GPT-4o y GPT-4 Turbo (OpenAI) – Dentro de la gama LLM de OpenAI, GPT-4o es una versión multimodal de alto rendimiento a un precio competitivo, mientras que GPT-4 Turbo es una opción liviana a costos reducidos. GPT-4 sigue siendo la versión principal para tareas complejas, pero a un coste mayor.
Géminis 1.5 y 1.5 Pro (Google DeepMind) – Desarrolladas por Google, las plantillas Gemini están optimizadas para texto e imágenes. La versión Pro es más potente y tiene mayor capacidad de token para casos de uso avanzados.
Claude 3.5 Soneto, Haiku y Opus (Antrópico) – Anthropic ofrece diferentes versiones de su LLM para necesidades específicas, respuestas rápidas (Haiku) o interacciones largas y profundas (Sonnet y Opus). Los precios varían dependiendo de las capacidades de cada persona.
Llama 3 70b et Llama 2 70b (Meta) – Desarrollados por Meta, estos modelos se ofrecen principalmente en la nube de Amazon. Proporcionan una mayor flexibilidad para tareas personalizadas.
Comando, Comando R y Comando R+ (Cohere) – Cohere ofrece una gama completa de modelos para investigación y análisis, que van desde opciones rentables para la investigación de datos básicos hasta LLM diseñados para análisis más complejos.
Mixtral y Mistral – Los modelos Mistral French están optimizados para tareas lingüísticas específicas (Mixtral) o interacciones rápidas (Mistral Small).
GPT-3.5 Turbo – Esta es una opción rentable de los modelos OpenAI, adecuada para tareas simples con capacidad de token limitada, y ofrece una buena alternativa para necesidades menos intensivas.