Nvidia causó un gran revuelo con el anuncio oficial de sus próximas GPU Blackwell GeForce RTX serie 50 durante la conferencia magistral de CES 2025. Y aunque el halo RTX 5090 ciertamente parece un monstruo absoluto, para mucha gente, es el RTX 5070 convencional (-ish) a $ 549 el que será la estrella del espectáculo. La RTX 4070 ha sido una de las mejores tarjetas gráficas desde su lanzamiento y ahora su reemplazo está en camino.
Nvidia afirma que el 5070 ofrecerá niveles de rendimiento “RTX 4090”, a aproximadamente un tercio del precio y un poco más de la mitad de la potencia. Pero, ¿cómo se comparan realmente y cómo se compara el 5070 con el RTX 4070 existente? Averigüemos, y hemos completado algunos fragmentos con las mejores estimaciones por ahora, pero la mayoría de las especificaciones son correctas.
Tarjeta gráfica | RTX 5070 | RTX 4090 | RTX 4070 |
---|---|---|---|
Arquitectura | GB205 | AD102 | AD104 |
Nodo de proceso | TSMC4NP | TSMC 4N | TSMC 4N |
Transistores (miles de millones) | ? | 76,3 | 32 |
Tamaño del troquel (mm^2) | ? | 608.4 | 294,5 |
SM | 48 | 128 | 46 |
Sombreadores de GPU | 6144 | 16384 | 5888 |
Núcleos tensores | 192 | 512 | 184 |
Núcleos RT | 48 | 128 | 46 |
Reloj de refuerzo (MHz) | 2512 | 2520 | 2475 |
Velocidad de VRAM (Gbps) | 30? | 21 | 21 |
VRAM (GB) | 12 | 24 | 12 |
Ancho del bus VRAM | 192 | 384 | 192 |
L2 Cache | 48? | 72 | 36 |
Unidades de salida de renderizado | 64? | 176 | 64 |
Unidades de mapeo de textura | 192 | 512 | 184 |
TFLOPS FP32 (Impulso) | 30,9 | 82,6 | 29.1 |
TFLOPS FP16 (INT8 TOPS) | 494 (988) | 661 (1321) | 233 (466) |
Ancho de banda (GB/s) | 720? | 1008 | 504 |
TBP (vatios) | 250 | 450 | 200 |
Fecha de lanzamiento | ¿febrero de 2025? | octubre de 2022 | abril de 2023 |
Precio de lanzamiento | $549 | $1,599 | $599 |
Primero, seamos perfectamente claros: la idea de que el RTX 5070 coincidirá con el RTX 4090 en todas las cargas de trabajo parece unas gafas muy rosadas. Es obvio que Nvidia está apostando fuerte por la IA con Blackwell y cuenta con DLSS 4 y otras técnicas de renderizado neuronal para compensar la diferencia. Pero las especificaciones en bruto siguen siendo importantes en muchos juegos existentes, salvo una solución del lado del controlador que permite un mayor rendimiento sin necesidad de parches ni actualizaciones.
El RTX 5070 tendrá 48 SM en comparación con los 46 SM del 4070. Eso no es un cambio muy grande en absoluto, y está muy lejos de los 128 SM del 4090. El cálculo general de gráficos FP32 equivale a 31 TFLOPS para el 5070, 29 TFLOPS en el 4070 y 83 TFLOPS para el 4090. Es extremadamente difícil creer que, en general, el 5070 se acercará al 4090 en rendimiento sin aprovechar DLSS 4 y tecnologías relacionadas.
También hay que considerar la VRAM. El 4090 tiene 24 GB, en comparación con la mitad de esa cantidad en el 4070 y el 5070. No hay muchos juegos en los que 12 GB sean insuficientes, pero Indiana Jones and the Great Circle, con RT completo y sin escalado, definitivamente supera los 12 GB en 4K. Es probable que vengan más juegos que podrían superar los 12 GB de VRAM en resoluciones y configuraciones más altas.
Pero aquí es donde podría entrar en juego el “material neuronal RTX”. Esa parece ser la habilitación de la compresión de textura neuronal, algo que Nvidia discutió en 2023, completamente implementado en un juego. ¿Funcionará con cualquier ¿juego? Probablemente no, pero nos encantaría ver una solución del lado del conductor que haga realidad esta característica. Sin NTC o RTX Neural Materials, los 12 GB definitivamente evitarán que el 5070 coincida con un 4090.
También hay que considerar el ancho de banda. RTX 4090 tiene 21 Gbps GDDR6X en una interfaz de 384 bits, en comparación con 28 ~ 32 Gbps GDDR7 del 5070 en una interfaz de 192 bits. Sabemos que el 4090 tiene 1008 GB/s de ancho de banda. El 5070 debería terminar con entre 672 GB/s y 768 GB/s de ancho de banda. Una vez más, sin NTC o materiales neuronales, no podrá mantener el ritmo a resoluciones más altas.
A las cargas de trabajo de IA, como los LLM, también les gusta tener mucha capacidad de VRAM. La cuantificación solo te lleva hasta cierto punto, y la compresión neuronal de los LLM no existe (hasta donde sabemos). El RTX 4090 con 24 GB de VRAM puede simplemente cargar LLM más grandes que el 5070, que solo igualará al 4070 en términos de tamaños de modelo de IA.
La historia es diferente cuando analizamos el rendimiento computacional de la IA. Sabemos que la serie RTX 50 tendrá soporte para el formato numérico FP4, pero igual de importante es que parece tener el doble de cómputo por núcleo tensor que la serie RTX 40. Eso no es suficiente cálculo para que el 5070 supere al 4090, pero es “sólo” alrededor de un 25% más lento en rendimiento teórico. Y si algo puede aprovechar FP4 en el 5070 donde el 4090 necesita usar FP8, entonces podría funcionar mejor en el 5070. Pero incluso el INT8 TOPS favorece al 4090.
El verdadero truco es, por supuesto, el precio. Hay muchos jugadores que simplemente no pueden permitirse una tarjeta gráfica de $1,599, sin importar los precios de más de $2,000 inducidos por la escasez que estamos viendo actualmente en el 4090. Una GPU de $549, incluso si es más lenta en la mayoría de los juegos, es otra cuestión completamente distinta. . Las GPU de clase xx70 de Nvidia han sido tradicionalmente el punto ideal para los jugadores convencionales, y parece que la 5070 continuará ese patrón. Incluso si no supera al 4090, si puede ofrecer constantemente un rendimiento cercano al nivel del RTX 4080, debería terminar siendo un gran éxito.
DLS 4 | Nueva generación de fotogramas múltiples y todo mejorado: YouTube
Mirar
Pero en realidad, todo se reduce a las funciones de IA y DLSS 4. Aún no hemos probado la generación de cuadros múltiples y, después de nuestras experiencias con la generación de cuadros DLSS 3, somos, en el mejor de los casos, escépticos. Parece que generará hasta tres cuadros entre dos cuadros renderizados, lo que parece que solo aumentaría la latencia. Pero DLSS 4 también parece generar esos fotogramas más rápidamente, lo que significa que el resultado neto no sería peor latencia que la generación de fotogramas de DLSS 3, solo con fotogramas adicionales.
En nuestra opinión, mucho más prometedoras que la generación de fotogramas múltiples son las mejoras y actualizaciones del escalado DLSS y la reconstrucción de rayos. Hasta ahora, DLSS ha utilizado una CNN (red neuronal convolucional) para el entrenamiento y la inferencia de la IA. Ahora hay un nuevo modelo basado en transformador, que aparentemente se puede utilizar en cualquier juego DLSS 2/3 existente.
Los modelos de transformadores han revolucionado muchas áreas del desarrollo de la IA, y las secuencias de muestra en el video de arriba que muestran CNN vs Transformer DLSS parecen extremadamente prometedoras. Nvidia ha estado afirmando que el renderizado DLSS es “mejor que el nativo” desde hace un tiempo, pero el modelo de transformador DLSS finalmente puede cumplir esas afirmaciones. Si es así, esa podría ser la característica principal que hace que la serie 50 valga el precio de la entrada. Excepto que el modelo de transformador también funciona en GPU existentes, por lo que tal vez no.
Como hemos señalado en el pasado, si bien las GPU RTX prometían el trazado de rayos como una nueva tecnología, con el tiempo realmente han sido las características de IA las que han pasado a primer plano como el aspecto más importante de la serie RTX. Con la serie RTX 50, Nvidia vuelve a duplicar su apuesta por la IA y el software DLSS compatible sigue superando el aspecto RT. Independientemente de si la generación de cuadros múltiples resulta ser una característica excelente o no, si aún no tiene una GPU de la serie 40, la serie 50, incluida la RTX 5070, podría incitarlo a actualizar.