我们分析了Geforce RTX 5090与RTX 4090的规格。
在拉斯维加斯举办的2025年国际消费类电子产品展览会(CES 2025)上,英伟达展示了其RTX 50系列的新旗舰显卡以及其他型号。除了光线追踪性能外,最新DLSS版本的性能也是关注的焦点。
据说,得益于多帧生成技术,DLSS 4的每秒图像生成量是原生性能的8倍。
但RTX 5090在光栅性能方面的表现如何——即不考虑光线追踪和DLSS?
RTX 5090 与 RTX 4090:规格
RTX 5090 | RTX 4090 | |
---|---|---|
图形芯片 | GB202-300 | AD102-300 |
核心 | 21,760 | 16,384 |
时钟速度(基本/加速) | 2,017/2,407 MHz | 2,235/2,520 MHz |
内存 | 32 GB GDDR7 (512-bit) | 24 GB GDDR6X (384-bit) |
内存传输速率 | 28 Gbps | 21 Gbps |
内存带宽 | 1,792 GB/s | 1,008 GB/s |
功耗 | 575 瓦 | 450 瓦 |
RTX 5090 与 RTX 4090:理论计算能力
核心数量
为了了解新旗舰产品比其前代产品更强大的程度,通常比较一下核心数量是一个很好的指标:
RTX 5090 拥有 21,760 个计算单元,比 RTX 4090 增加了约 32.8%。
因此,光栅性能应该会有类似的飞跃。
TFLOPS
如果同时考虑时钟频率,则计算结果会更加精确。这就是所谓的TFLOPS(万亿次浮点运算/每秒),即每秒可执行的浮点运算(加法或乘法)次数。
这是计算公式: Teraflops (TFLOPS) = Shader Compute Units x Clock Frequency (MHz) x Operations per Clock / 1,000,000
以 RTX 5090 为例: 21,760 个核心 x 2,407 MHz x 2 / 1,000,000 = 104.8 TFLOPS
与RTX 4090(82.6 TFLOPS)相比,RTX 5090的计算能力(理论值)高出26.9%。
比较不同系列的两款显卡的每秒万亿次浮点运算性能只能提供有限的游戏性能信息,因为架构可能更高效。
不过,如果两款显卡是直接继承的,并且结构可能部分相同,那么它们仍然是一个有用的指标。
RTX 5090 与 RTX 4090:游戏性能差异会有多大?
根据我们的估算,RTX 5090的栅格性能应该比RTX 4090高出20%到30%左右。
然而,当光线追踪,特别是DLSS 4发挥作用时,情况就不同了。多帧生成能够生成三个中间图像,而不是一个(DLSS 3和简单帧生成的情况),这大大提高了帧速率。
然而,这会导致一定的输入延迟,新帧生成方式最终对游戏体验的影响如何还有待观察。
更快的图形内存会影响性能吗?
不直接。速度或带宽基本上只是为了确保图形芯片始终获得充足的数据(纹理、模型等),从而确保其充分发挥性能潜力。
然而,如果因为内存无法跟上而出现瓶颈,那么更快的内存确实可以带来更高的FPS。
当使用特别高的分辨率纹理和模型以及光线追踪时,这一点在高分辨率级别(如4K甚至8K)下尤为重要。