奇谱科技-Nvidia又炫技，新技术在Beta演示中将VRAM使用量降低96%

作者：原创

近日，YouTube知名频道Compusemble在RTX 4090上以1440p和4K分辨率对Nvidia的新内存压缩技术RTX神经纹理压缩（NTC）进行了基准测试，结果显示，与传统纹理压缩技术相比，NTC将测试应用的纹理内存占用减少了惊人的96%。

RTX神经纹理压缩（Beta）在RTX 4090上的首次展示（来源：Compusemble）

Compusemble在两种模式下测试了NTC：“NTC转码为BCn”和“样本上的NTC推理”。前者在加载时将纹理转码为BCn，后者仅解压缩渲染特定视图所需的个别纹理像素，进一步减少了纹理内存大小。

在启用DLSS（深度学习超采样）的1440p分辨率下，“NTC转码为BCn”模式将测试应用的纹理内存占用减少了64%，从272MB降至98MB。而“样本上的NTC推理”模式将纹理大小显著降低至仅11.37MB。与非神经压缩相比，这代表了95.8%的内存利用率降低，与之前的神经压缩模式相比减少了88%。

Compusemble的基准测试显示，启用RTX神经纹理压缩时性能会略有下降。然而，测试人员在上一代RTX 4090上运行了这款Beta软件，而不是当前一代的RTX 5090，因此随着新架构的推出，这种性能下降可能会缩小。

“NTC转码为BCn”模式与NTC关闭时相比，平均帧率几乎无变化，但1%的低帧率明显优于关闭NTC时的传统纹理压缩。“样本上的NTC推理”模式受到的打击最大，帧率从大约1600 FPS降至大约1500 FPS。1%的低帧率显著下降至840 FPS左右。

在1440p分辨率下使用TAA（时间抗锯齿）而不是DLSS进行超采样时，内存容量的减少是相同的，但GPU的性能表现有所不同。所有3种模式的运行速度都显著快于DLSS，几乎达到2000 FPS。在“样本上的NTC推理”模式下，1%的低帧率在1300 FPS左右，比840 FPS有了很大的提升。

当将分辨率提高到4K时，会显著降低性能。启用DLSS超采样时，“NTC转码为BCn”模式的平均帧率在1100 FPS左右，“样本上的NTC推理”模式的平均帧率略低于1000 FPS。两种模式的1%低帧率都在500 FPS左右。关闭DLSS，改用原生分辨率并启用TAA抗锯齿时，“NTC转码为BCn”模式的平均帧率提升至1700 FPS左右，“样本上的NTC推理”模式的平均帧率在1500左右。前者的1%低帧率略低于1100 FPS，后者的1%低帧率略低于800 FPS。

最后，Compusemble在4K分辨率下使用TAA并启用“样本上的NTC推理”模式测试了协同向量。启用协同向量时，平均帧率在1500左右，关闭后平均帧率急剧下降至略低于650 FPS。1%的低帧率在启用协同向量时略低于750 FPS，关闭时略高于400 FPS。

总结

Compusemble的RTX NTC基准测试显示，Nvidia的神经压缩技术可以大幅减少3D应用的纹理内存占用，但代价是性能下降，尤其是在“样本上的NTC推理”模式下。

DLSS与原生分辨率的性能对比是最有趣的。原生分辨率下显著的帧率提升表明，用于处理RTX NTC的张量核心被严重占用，可能达到了影响DLSS超采样性能的程度，足以潜在地限制着色器核心的性能。如果不是这样，我们应该会看到DLSS模式的运行帧率高于原生4K TAA的基准测试。

RTX神经纹理压缩已经开发了至少几年时间。这项新技术利用现代Nvidia GPU中的张量核心来压缩3D应用和视频游戏纹理，而不是传统的块截断编码。RTX NTC是自1990年代以来纹理压缩技术的首次重大升级，允许运行高达4倍分辨率的纹理，而今天的GPU无法实现。

该技术目前处于Beta阶段，没有发布日期。NTC的最低要求出人意料的低，Nvidia的RTX NTC GitHub页面确认，最低GPU要求是RTX 20系列GPU。然而，该技术也已在GTX 10系列GPU、AMD Radeon RX 6000系列GPU和Arc A系列GPU上进行了验证，表明该技术可能会在非RTX GPU甚至游戏主机上普及。

奇谱科技

Nvidia又炫技，新技术在Beta演示中将VRAM使用量降低96%

最新发布

QQ咨询

关注微信

回顶部