Los teraflops han sido una forma popular de medir la «potencia gráfica» durante años. El término se refiere a la cantidad de cálculos que puede realizar una GPU, pero si bien ha estado en las hojas de especificaciones desde siempre, más recientemente el teraflop se ha generalizado y aparece en los mensajes de marketing que se encuentran en el lanzamiento de consolas como la Xbox Series X. Con recuentos de núcleos de GPU alcanzando cinco cifras, es bueno tener un simple punto de comparación. Desafortunadamente, los teraflops nunca han sido menos útiles.

El término teraflop proviene de FLOP, o «operaciones de punto flotante por segundo», que simplemente significa «cálculos que involucran puntos decimales por segundo». Tera significa billones, por lo que, si se juntan teraflops, significa «billones de operaciones de punto flotante por segundo».

La GPU más popular entre los usuarios de Steam en la actualidad, la venerable GTX 1060 de NVIDIA, es capaz de realizar 4,4 teraflops, la 2080 Ti que pronto será usurpada puede manejar alrededor de 13.5 y la próxima Xbox Series X puede manejar 12. Estos números son calculados por tomar el número de núcleos de sombreado en un chip, multiplicarlo por la velocidad máxima de reloj de la tarjeta y luego multiplicar ese por el número de instrucciones por reloj. A diferencia de muchas cifras que vemos en el espacio de la PC, es un cálculo justo y transparente, pero eso no lo convierte en una buena medida del rendimiento de los juegos.

Casi todas las familias de GPU llegan con estos logros generacionales

La RX 580 de AMD, una GPU de 6.17 teraflop de 2017, por ejemplo, funciona de manera similar a la RX 5500, una tarjeta económica de 5.2 teraflop que la compañía lanzó el año pasado. Este tipo de mejora «oculta» se puede atribuir a muchos factores, desde cambios en la arquitectura hasta que los desarrolladores de juegos hagan uso de nuevas funciones, pero casi todas las familias de GPU llegan con estas ganancias generacionales. Es por eso que se espera que la Xbox Series X, por ejemplo, supere a la Xbox One X en más de lo que sugieren las cifras de “12 contra 6 teraflop”. (Lo mismo ocurre con la PS5 y la PS4 Pro).

Leer también  EA Play se une a Xbox Game Pass Ultimate el 10 de noviembre

El punto es que, incluso dentro de la misma compañía de GPU, con cada año, los cambios en la forma en que se diseñan los chips y los juegos hacen que sea más difícil discernir qué significa exactamente «un teraflop» para el rendimiento de los juegos. Tome una tarjeta AMD y una tarjeta NVIDIA de cualquier generación y la comparación tiene aún menos valor.

Todo lo cual nos lleva a la serie RTX 3000. Estos llegaron con algunas especificaciones realmente impactantes. La RTX 3070, una tarjeta de $ 500, tiene 5.888 núcleos cuda (el nombre de NVIDIA para shader) con capacidad para 20 teraflops. ¿Y la nueva tarjeta insignia de $ 1,500, la RTX 3090? 10,496 núcleos, para 36 teraflops. Para el contexto, la RTX 2080 Ti, a partir de ahora la mejor tarjeta gráfica para «consumidores» disponible, tiene 4.352 «núcleos cuda». NVIDIA, entonces, ha aumentado la cantidad de núcleos en su buque insignia en más del 140 por ciento y su capacidad de teraflops en más del 160 por ciento.

Bueno, lo ha hecho y no lo ha hecho.

Las tarjetas NVIDIA están compuestas por muchos «multiprocesadores de transmisión» o SM. Cada uno de los 68 SM «Turing» del 2080 Ti contiene, entre muchas otras cosas, 64 núcleos cuda «FP32» dedicados a la matemática de punto flotante y 64 núcleos «INT32» dedicados a la matemática entera (cálculos con números enteros). 

La gran innovación en el Turing SM, además de la inteligencia artificial y la aceleración del trazado de rayos, fue la capacidad de ejecutar matemáticas enteras y de punto flotante simultáneamente. Este fue un cambio significativo con respecto a la generación anterior, Pascal, donde los bancos de núcleos cambiarían entre números enteros y de punto flotante en una o dos bases.

NVIDIA

Las tarjetas RTX 3000 se basan en una arquitectura que NVIDIA llama «Ampere», y su SM, de alguna manera, adopta tanto el enfoque de Pascal como el de Turing. Ampere mantiene los 64 núcleos FP32 como antes, pero los otros 64 núcleos ahora se designan como «FP32 y INT32 ”. Entonces, la mitad de los núcleos de Ampere están dedicados al punto flotante, pero la otra mitad puede realizar operaciones matemáticas de punto flotante o enteros, como en Pascal.

Leer también  PlayStation Plus Collection ofrece a los propietarios de PS5 algunos de los mejores juegos de PS4

Con este conmutador, NVIDIA ahora cuenta que cada SM contiene 128 núcleos FP32, en lugar de los 64 que tenía Turing. Los «5.888 núcleos de cuda» del 3070 se describen mejor como «2944 núcleos de cuda y 2944 núcleos que lata ser cuda «.

A medida que los juegos se han vuelto más complejos, los desarrolladores han comenzado a apoyarse más en los números enteros. Una diapositiva de NVIDIA del lanzamiento original de RTX 2018 sugirió que las matemáticas enteras, en promedio, constituían aproximadamente una cuarta parte de las operaciones de GPU en el juego.

La desventaja del Turing SM es el potencial de subutilización. Si, por ejemplo, una carga de trabajo es matemática entera en un 25 por ciento, alrededor de una cuarta parte de los núcleos de la GPU podrían estar sentados sin nada que hacer. Ese es el pensamiento detrás de esta nueva estructura central semi-unificada y, en el papel, tiene mucho sentido: aún puede ejecutar operaciones de punto flotante y enteros simultáneamente, pero cuando esos núcleos enteros están inactivos, pueden ejecutar operaciones de punto flotante en lugar.

[Este episodio de Mejorado se produjo antes de que NVIDIA explicara los cambios de SM.]

En el lanzamiento del RTX 3000 de NVIDIA, el director ejecutivo Jensen Huang dijo que el RTX 3070 era «más poderoso que el RTX 2080 Ti». Usando lo que sabemos ahora sobre el diseño de Ampere, los números enteros, el punto flotante, las velocidades de reloj y los teraflops, podemos ver cómo se desarrollarán las cosas. En esa carga de trabajo de «25 por ciento entero», 4,416 de esos núcleos podrían estar ejecutando matemáticas FP32, con 1,472 manejando el INT32 necesario. 

Junto con todos los otros cambios que trae Ampere, el 3070 podría superar al 2080 Ti en quizás un 10 por ciento, asumiendo que al juego no le importa tener 8GB en lugar de 11GB de memoria para trabajar. En el peor de los casos absoluto (y altamente improbable), donde una carga de trabajo es extremadamente dependiente de los números enteros, podría comportarse más como el 2080. Por otro lado, si un juego requiere muy pocas matemáticas enteras, el impulso sobre el 2080 Ti podría ser enorme.

Leer también  Nintendo ha descontinuado la familia 3DS

Dejando a un lado las conjeturas, tenemos un punto de comparación hasta ahora: un Fundición digital video comparando el RTX 3080 con el RTX 2080. DF vio un aumento del 70 al 90 por ciento entre generaciones en varios juegos que NVIDIA presentó para pruebas, con una brecha de rendimiento mayor en los títulos que utilizan funciones RTX como el trazado de rayos. Ese rango da una idea del tipo de ganancia de rendimiento variable que esperaríamos dados los nuevos núcleos compartidos. Será interesante ver cómo se comporta un conjunto más grande de juegos, ya que es probable que NVIDIA haya dado lo mejor de sí con la selección de juegos autorizados. Lo que no verá es la mejora de casi el triple que implicaría el salto de la cifra de teraflop de 2080 a la cifra de teraflop de 3080.

Con las primeras tarjetas RTX 3000 llegando en semanas, puede esperar que las revisiones le den una idea firme del rendimiento de Ampere pronto. Aunque incluso ahora se siente seguro decir que Ampere representa un salto monumental para los juegos de PC. Es probable que el $ 499 3070 esté intercambiando golpes con el buque insignia actual, y el $ 799 3080 debería ofrecer un rendimiento más que suficiente para aquellos que anteriormente podrían haber optado por el «Ti». Sin embargo, independientemente de cómo se alineen estas cartas, está claro que su valor ya no puede ser representado por una figura singular como teraflops.