Doble ROP, gran caché L2 y un 50 % más de unidades FP32 que amplificadores, tensores de cuarta generación y núcleos RT de tercera generación.

Se han revelado detalles sobre la GPU NVIDIA Ada Lovelace Gaming que impulsará las tarjetas gráficas de la serie GeForce RTX 40. La nueva información proviene de Kopte7kimi y habla sobre el diagrama de bloques de la arquitectura de próxima generación.

Diagrama de bloques detallado de NVIDIA GeForce Ada Lovelace GPU SM: ¡más grande y mejor que nunca para los jugadores!

La arquitectura de la GPU NVIDIA Ada Lovelace ya no es un misterio. Aprendimos sobre las configuraciones específicas que impulsarán la próxima generación de AD10 * SKU para las tarjetas gráficas de la serie GeForce RTX 40, y también vimos algunas especificaciones filtradas de la gama. Ahora es el momento de hablar sobre el chip gráfico de próxima generación.

NVIDIA GeForce RTX 4090 obtiene 24 GB de memoria GDDR6X de 21 Gbps y TDP de 600 W, RTX 4070 obtiene 12 GB de memoria GDDR6 de 18 Gbps y TDP de 300 W

Diagrama de bloques de la GPU para juegos NVIDIA AD102 «Ada Lovelace» «SM» (Créditos de la imagen: Kopite7kimi):

Diagrama de bloques de la GPU para juegos NVIDIA GA102 ‘Ampere’ ‘SM’:

Comenzando con la configuración de la GPU, Kopite7kimi compara la mejor GPU AD102 con otras GPU del equipo verde. Estos incluyen el Ampere GA102 y Turing TU102 enfocados en juegos, mientras que los Hoppers GH100 y Ampere GA100 enfocados en HPC también se han agregado a la lista. Solo compararé el AD102 con sus predecesores de juegos, ya que los diseños centrados en HPC son muy diferentes de las ofertas centradas en el consumidor.

Actualización de precios de GPU de NVIDIA y AMD para mayo de 2022: las tarjetas gráficas GeForce ahora están un 14 % por encima del PVP, Radeon solo un 6 % por encima del PVP

La GPU NVIDIA Ada Lovelace AD102 incluirá hasta 12 GPC (clusters de procesamiento de gráficos). Este es un aumento del 70 % con respecto al GA102, que solo cuenta con 7 GPC. Cada GPU constará de 6 TPC y 2 SM, que es la misma configuración que el chip existente. Cada SM (multiprocesador de transmisión) albergará cuatro subnúcleos, que también es lo mismo que la GPU GA102. Lo que ha cambiado es la configuración del kernel FP32 e INT32. Cada subnúcleo constará de 128 unidades FP32, pero las unidades FP32 + INT32 combinadas aumentarán a 192. Esto se debe a que las unidades FP32 no comparten el mismo subnúcleo que las unidades IN32. Los 128 núcleos FP32 están separados de los 64 núcleos INT32.

Entonces, en total, cada subnúcleo constará de 128 unidades FP32 más 64 unidades INT32 para un total de 192 unidades. Cada SM tendrá un total de 512 unidades FP32 más 256 unidades INT32 para un total de 768 unidades. Y dado que hay un total de 24 unidades SM (2 por GPC), estamos viendo 12,288 unidades FP32 y 6,144 unidades INT32 para un total de 18,432 núcleos. Cada SM también incluirá dos programas de envoltura (32 subprocesos/CLK) para 64 envolturas por SM. Este es un aumento del 50 % en los núcleos (FP32 + INT32) y del 33 % en el ajuste/hilo en comparación con la GPU GA102.

Leer más:  Los precios de las GPU NVIDIA RTX 3080 se desploman de la noche a la mañana en Australia, los precios globales seguirán

Especificaciones «preliminares» de GPU NVIDIA Ada Lovelace:

nombre de la GPUAD102GA102TU102GA100GH100
PCG12 (para GPU)1.7x2x1.5x1.5x
TPC6 (a través de GPC)semillasemilla0.75x0.67x
SM2 (para TPC)semillasemillasemillasemilla
sub-núcleo4 (a través de SMS)semillasemillasemillasemilla
FP32128 (a través de SMS)semilla2x2xsemilla
FP32 + INT32192 (a través de SMS)1.5x1.5x1.5xsemilla
deformado64 (a través de SMS)1.33x2xsemillasemilla
hijo2048 (a través de SMS)1.33x2xsemillasemilla
caché L1192 KB (para SM)1.5x2xsemilla0.75x
caché L296 MB (por GPU)16x16x2.4x1,6x
Redox32 (a través de GPC)2x2x2x2x

Pasando al caché, este es otro segmento en el que NVIDIA ha dado un gran impulso a las GPU Ampere existentes. Las GPU Ada Lovelace contarán con 192 KB de caché L1 por SM, un aumento del 50 % con respecto a Ampere. Esto equivale a un total de 4,5 MB de caché L1 en la mejor GPU AD102. El caché L2 se incrementará a 96 MB como se menciona en las filtraciones. Este es un aumento de 16 veces con respecto a la GPU Ampere, que alberga solo 6 MB de caché L2. El caché se compartirá en la GPU.

Finalmente, tenemos los ROP que también aumentan a 32 por GPC, un aumento de 2x sobre Ampere. Está viendo hasta 384 ROP en el buque insignia de próxima generación en comparación con solo 112 en el GPU Ampere más rápido, el RTX 3090 Ti. También habrá los últimos núcleos Tensor de cuarta generación y RT (trazado de rayos) de tercera generación infundidos en las GPU Ada Lovelace que ayudarán a llevar el rendimiento de DLSS y Raytracing al siguiente nivel. En general, la GPU Ada Lovelace AD102 ofrecerá:

  • 2x GPC (frente a amperios)
  • 50 % más de núcleos (en comparación con los amplificadores)
  • 50% más de caché L1 (en comparación con el amplificador)
  • 16 veces más caché L2 (en comparación con el amplificador)
  • Duplicar las ROP (en comparación con el amplificador)
  • Tensor de cuarta generación y núcleo RT de tercera generación

Tenga en cuenta que las velocidades de reloj, que estarían entre 2 y 3 GHz, no se consideran en la ecuación, por lo que también jugarán un papel importante en la mejora del rendimiento por núcleo en Ampere. Se espera que las tarjetas gráficas de la serie NVIDIA GeForce RTX 40 con GPU para juegos Ada Lovelace de próxima generación se lancen en la segunda mitad de 2022 y utilizarán el mismo nodo de proceso TSMC 4N que la GPU Hopper H100.

Leer más:  El Hopper H100 de Nvidia que se muestra en la imagen tiene 80 GB de memoria HBM3 y un VRM impresionante

Vista previa de la GPU NVIDIA CUDA (RUMOR):

GPUTU102GA102AD102
SKU insigniaRTX-2080TiRTX-3090TiRTX4090?
Arquitecturaturingamperioada lovelace
ProcesosNFF de 12nm de TSMCSamsung 8nm¿TSMC 4N?
La dimensión754 mm2628 mm2~ 600 mm2
Clúster de procesamiento de gráficos (GPC)6712
Clúster de procesamiento de texturas (TPC)364272
Multiprocesadores de transmisión (SM)7284144
Núcleos CUDA46081075218432
caché L26MB6MB96 MB
TFLOP teóricos16 TFLOP40 TFLOP~ 90 TFLOP?
Tipo de memoriaGDDR6GDDR6XGDDR6X
Capacidad de memoria11 GB (2080 Ti)24 GB (3090 Ti)24 GB (¿4090?)
velocidad de la memoria14 Gb/s21 Gb/s24 Gb/s?
Banda de memoria616GB/s1008GB/s1152GB/s
bus de memoria384 bits384 bits384 bits
interfaz PCIePCIe generación 3.0PCIe generación 4.0PCIe generación 4.0
TGP250W350W600W?
Liberarseptiembre 201820 de septiembre2S 2022 (por confirmar)
¿Qué te pareció este artículo?
La computación cuántica podría aumentar el rendimiento del trazado de rayos hasta en un 190 %
La computación cuántica podría aumentar el rendimiento del trazado de rayos hasta en un 190 %

Investigadores de Estados Unidos, Portugal y Reino Unido predijeron que la solución a las altas exigencias del trazado de rayos Leer más

AMD confirma que los juegos con una CPU Ryzen 7000 de 5,5 GHz no han sido overclockeados
AMD confirma que los juegos con una CPU Ryzen 7000 de 5,5 GHz no han sido overclockeados

Algo que esperar: AMD reveló más detalles sobre la demostración de juegos Computex 2022 que mostró que su próximo procesador Leer más

Los nuevos teclados y ratones Master Series de Logitech reducen los clics
Los nuevos teclados y ratones Master Series de Logitech reducen los clics

El panorama: Logitech ha ampliado su popular serie Master con la adición de dos nuevos teclados mecánicos y el nuevo Leer más

SteelSeries lanza la nueva serie de auriculares para juegos Arctis Nova Pro para ofrecer una experiencia premium inigualable por la competencia
SteelSeries lanza la nueva serie de auriculares para juegos Arctis Nova Pro para ofrecer una experiencia premium inigualable por la competencia

SteelSeries presentó sus nuevos auriculares para juegos de la serie Arctis Nova Pro que, según la compañía, llevan "cuatro años Leer más

La pequeña PC de escritorio con Windows 11 Pro de Zotac es solo un poco más grande que su teléfono
La pequeña PC de escritorio con Windows 11 Pro de Zotac es solo un poco más grande que su teléfono

En una palabra: Las computadoras de factor de forma pequeño son asequibles para aquellos que tienen un espacio de trabajo Leer más

El buque insignia X670E AORUS Xtreme será más barato que el X570 AORUS Xtreme en alrededor de $ 500
El buque insignia X670E AORUS Xtreme será más barato que el X570 AORUS Xtreme en alrededor de $ 500

La línea de placas base X670E y X670 de Gigabyte se presentó hoy, y la compañía presentó cuatro de sus Leer más


Seguinos en Google News y mantente informado sobre toda la actualidad y tendencias.

¿Qué te pareció este artículo?