La arquitectura interna de la GPU GeForce RTX 4090 de NVIDIA muestra de lo que es capaz el chip AD102 | Gaming

NVIDIA ha presentado la serie RTX 4000 y presumen de haber creado las tarjetas gráficas más potentes de la historia. Y aunque no tenemos datos concretos que lo demuestren, el cambio de arquitectura nos deja ver el enorme potencial de la nueva generación.

la empresa de tarjetas gráficasNVIDIA, presentó el 20 de septiembre la serie RTX4000. Durante la conferencia vimos las RTX 4090 y 4080 junto a la arquitectura que les da vida: Ada Lovelace. Estas GPU promete ser el GeForce más fuerte de la historia.

Si ya hablamos de todo teníamos que hablar de la RTX 4000: modelos, fecha de lanzamiento, precios, especificaciones… Ahora es el momento de centrarse en su arquitectura, que hace que estas tarjetas gráficas sean únicas.

En el corazón de la GeForce RTX 4090 se encuentra el gigantesco silicio AD102. Basado en un proceso de fabricación de silicio de 4 nm, este chip mide 608 mm² de área y contiene 76,3 mil millones de transistores.

Y la buena noticia es que ahora hemos podido observar mejor el diagrama de bloques de nivel de silicio del AD102, que incluye la introducción de varios componentes nuevos.

Así queda la nueva arquitectura de las NVIDIA GeForce

El AD102 tiene una interfaz para PCI-Express 4.0 x16 y una interfaz de memoria GDDR6X de 384 bits. El motor Gigathread actúa como el principal componente de asignación de recursos del silicio.

Ada presenta el Acelerador de flujo óptico, un componente crucial para que DLSS 3 procese fotogramas completos sin que intervenga la maquinaria de renderizado de gráficos.

el chip tiene El doble de motores de hardware de codificación de medios que Ampere, incluida la codificación/descodificación AV1 acelerada por hardware. Múltiples aceleradores le permiten transcodificar múltiples secuencias de video (ideal para creadores de contenido).

Los principales componentes de representación de gráficos del AD102 son los GPC (Grupos de procesamiento de gráficos). Hay 12 de ellos, en comparación con 7 en la generación anterior de GA102. Cada GPC comparte un motor de rasterización y backends de renderizado con seis TPC (clusters de procesamiento de texturas).

Cada TPC contiene dos SM (multiprocesadores de flujo), la maquinaria indivisible de procesamiento de números de la GPU NVIDIA. El SM es donde NVIDIA realiza la mayor innovación arquitectónica y de donde deriva la gran actuación Lo que es esperado

Cada SM contiene un núcleo RT de tercera generación, un caché L1 de 128 KB y cuatro TMU., entre cuatro clústeres, cada uno con 16 núcleos CUDA FP32, 16 núcleos CUDA, 4 unidades de carga/almacenamiento, una pequeña caché L0; un archivo de registro y el importantísimo Tensor Core de cuarta generación.

Por lo tanto, cada SM contiene un total de 128 núcleos CUDA, 4 núcleos Tensor y un núcleo RT. Hay 12 SM por GPC, es decir, 1536 núcleos CUDA, 48 núcleos Tensor y 12 núcleos RT por GPC. Es decir, doce GPC suman 18.432 núcleos CUDA, 576 núcleos Tensor y 144 núcleos RT.

Luego, cada GPC contribuye con 16 ROP, por lo que hay 192 ROP en el chip. Un caché L2 sirve como un lugar para que varios GPC, controladores de memoria y la interfaz de host PCIe intercambien datos.

NVIDIA no ha mencionado el tamaño de esta caché L2, pero se dice que es significativamente más grande que la generación anterior. y que juega un papel importante en la lubricación del subsistema de memoria lo suficiente como para que NVIDIA mantenga la misma velocidad de datos de 21 Gbps y 384 bits que la generación anterior.

NVIDIA presenta el reordenamiento de ejecución de sombreadores (SER), una nueva tecnología que reorganiza las cargas de trabajo matemáticas para que sean relevantes para cada subproceso de trabajo, de modo que los componentes SIMD las procesen de manera más eficiente.

Se espera que esto tenga un impacto especialmente grande en el renderizado de juegos con trazado de rayos. En Ciberpunk 2077, con su nuevo ajuste preestablecido de gráficos Overdrive, que aumenta considerablemente los cálculos de RT por píxel, SER mejora el rendimiento hasta en un 44%.

NVIDIA tiene la Difícil trabajo de justificar su nueva generación tras dos años de escasez, precios altísimos y poca información. Seguro que lanzar estos primeros modelos de gama alta a precios -oficiales- nunca antes vistos no es la mejor de las ideas.

Con información de Telam, Reuters y AP