了解了完整的GA102核心,我们再来看一下RTX 4090的核心,其实知道了RTX 4090的参数,我们大概也能了解到后续可能推出的“Ti”系列究竟相差在哪。
相比完整的GA102来说,RTX 4090共有16384个CUDA,其中包含11个GPC、64个TPC以及128个SM单元,第三代RT Cores为128个,第四代Tensor Cores为512个。
其实根据完整的架构图就能看出,此次Ada架构整体结构性的改动并不大,这一点从SM单元便能清晰印证,同样的FP32 CUDA核心,同样的FP32/INT32混合CUDA核心,同样的L1级缓存等等。当然,每个SM单元内部的Tensor Core升级为第四代。
不过变化最为显著的,则是第三代光追核心,我们结合两代架构来看。在第二代光追核心中,包含负责边界交叉测试的Box Intersection Engine引擎,和负责三角形交叉测试的Triangle Intersection Engine引擎。
而在第三代光追核心中,还增加了两个新的引擎:Opacity Micro-Map Engines(OMM)和Displaced Micro-Mesh Engines(DMM),这两个新的硬件单元可以极大地提升光追性能(具体原理后文详细介绍)。