Resumen de los precios de los principales modelos de lenguajes grandes en función del número de tokens solicitados a través de su API. Los precios pueden variar completamente dependiendo de las ofertas.
Los LLM se facturan mediante “token”, una unidad de medida que representa segmentos de texto, es decir, palabras o fragmentos de palabras. En general, los modelos de lenguaje grande (LLM) valoran los tokens de entrada (los enviados al modelo) y los tokens de salida (los generados en respuesta) por separado. Este método de facturación permite a los usuarios estimar el costo en función del volumen de datos procesados por los LLM disponibles en forma de API. Según la definición de OpenAI, un token corresponde, en inglés, a 0,75 palabras. La siguiente tabla resume los precios estimados por token para los principales LLM del mercado, ya sean de entrada o de salida.
Modelo | Proveedor | Precio por 1000 tokens de entrada | Precio por salida de 1000 tokens | Número total de tokens admitidos |
---|---|---|---|---|
GPT-4o (omni) | Abierto AI | 0,05 dólar | 0,15 dolares | 128 000 |
GPT-4 Turbo | Abierto AI | 0,1 dólar | 0,3 dólar | 128 000 |
GPT-4 | Abierto AI | 0,3 dólar | 0,6 dólar | 8 000 |
Claude 3 Haiku | antrópico | 0,0025 dólares | 0,0125 dólares | 200 000 |
Soneto de Claudio 3 | antrópico | 0,03 dólar | 0,15 dolares | 200 000 |
Cerrar 3 Trabajo | antrópico | 0,15 dolares | 0,75 dolares | 200 000 |
Llama 3 70b | Meta (a través de AWS) | 0,00265 dólar | 0,0035 dólar | 8 000 |
Llama 2 70b | Meta (a través de AWS) | 0,00195 dólar | 0,00256 dólar | 4 000 |
Géminis 1.0 Pro | 0,005 dólares | 0,015 dólares | 32 000 | |
Géminis 1.5 Pro | 0,07 dolares | 0,21 dólares | 1 000 000 | |
Dominio | Adherirse | 0,1 dólar | 0,2 dolares | 4 000 |
Comando R | Adherirse | 0,005 dólares | 0,015 dólares | 132 000 |
Comando R+ | Adherirse | 0,03 dólares | 0,15 dolares | 128 000 |
Mixtral 8x7B | Mistral AI (a través de Anyscale) | 0,005 dólares | 0,005 dólares | 32 000 |
Mistral Pequeño | Mistral AI | 0,02 dólares | 0,06 dólares | 32 000 |
Mistral grande | Mistral AI | 0,08 dolares | 0,24 dolares | 32 000 |
GPT-3.5 Turbo | Abierto AI | 0,12 dolares | 0,16 dólares | 4 000 |
Palma 2 | 0,02 dólares | 0,02 dólares | 8 000 |
Análisis de modelos
- GPT-4o y GPT-4 Turbo (OpenAI) – Dentro de la gama LLM de OpenAI, GPT-4o es una versión multimodal de alto rendimiento a un precio competitivo, mientras que GPT-4 Turbo es una opción liviana a costos reducidos. GPT-4 sigue siendo la versión principal para tareas complejas, pero a un coste mayor.
- Géminis 1.5 y 1.5 Pro (Google DeepMind) – Desarrolladas por Google, las plantillas Gemini están optimizadas para texto e imágenes. La versión Pro es más potente y tiene mayor capacidad de token para casos de uso avanzados.
- Claude 3.5 Soneto, Haiku y Opus (Antrópico) – Anthropic ofrece diferentes versiones de su LLM para necesidades específicas, respuestas rápidas (Haiku) o interacciones largas y profundas (Sonnet y Opus). Los precios varían dependiendo de las capacidades de cada persona.
- Llama 3 70b et Llama 2 70b (Meta) – Desarrollados por Meta, estos modelos se ofrecen principalmente en la nube de Amazon. Proporcionan una mayor flexibilidad para tareas personalizadas.
- Comando, Comando R y Comando R+ (Cohere) – Cohere ofrece una gama completa de modelos para investigación y análisis, que van desde opciones rentables para la investigación de datos básicos hasta LLM diseñados para análisis más complejos.
- Mixtral y Mistral – Los modelos Mistral French están optimizados para tareas lingüísticas específicas (Mixtral) o interacciones rápidas (Mistral Small).
- GPT-3.5 Turbo – Esta es una opción rentable de los modelos OpenAI, adecuada para tareas simples con capacidad de token limitada, y ofrece una buena alternativa para necesidades menos intensivas.