奇谱科技 奇谱科技

CHIP奇谱
关注产品与技术 分享体验与新知
广告

Nvidia又炫技,新技术在Beta演示中将VRAM使用量降低96%

作者:原创

近日,YouTube知名频道Compusemble在RTX 4090上以1440p和4K分辨率对Nvidia的新内存压缩技术RTX神经纹理压缩(NTC)进行了基准测试,结果显示,与传统纹理压缩技术相比,NTC将测试应用的纹理内存占用减少了惊人的96%。

RTX神经纹理压缩(Beta)在RTX 4090上的首次展示(来源:Compusemble)

Compusemble在两种模式下测试了NTC:“NTC转码为BCn”和“样本上的NTC推理”。前者在加载时将纹理转码为BCn,后者仅解压缩渲染特定视图所需的个别纹理像素,进一步减少了纹理内存大小。

在启用DLSS(深度学习超采样)的1440p分辨率下,“NTC转码为BCn”模式将测试应用的纹理内存占用减少了64%,从272MB降至98MB。而“样本上的NTC推理”模式将纹理大小显著降低至仅11.37MB。与非神经压缩相比,这代表了95.8%的内存利用率降低,与之前的神经压缩模式相比减少了88%。

Compusemble的基准测试显示,启用RTX神经纹理压缩时性能会略有下降。然而,测试人员在上一代RTX 4090上运行了这款Beta软件,而不是当前一代的RTX 5090,因此随着新架构的推出,这种性能下降可能会缩小。

“NTC转码为BCn”模式与NTC关闭时相比,平均帧率几乎无变化,但1%的低帧率明显优于关闭NTC时的传统纹理压缩。“样本上的NTC推理”模式受到的打击最大,帧率从大约1600 FPS降至大约1500 FPS。1%的低帧率显著下降至840 FPS左右。

在1440p分辨率下使用TAA(时间抗锯齿)而不是DLSS进行超采样时,内存容量的减少是相同的,但GPU的性能表现有所不同。所有3种模式的运行速度都显著快于DLSS,几乎达到2000 FPS。在“样本上的NTC推理”模式下,1%的低帧率在1300 FPS左右,比840 FPS有了很大的提升。

当将分辨率提高到4K时,会显著降低性能。启用DLSS超采样时,“NTC转码为BCn”模式的平均帧率在1100 FPS左右,“样本上的NTC推理”模式的平均帧率略低于1000 FPS。两种模式的1%低帧率都在500 FPS左右。关闭DLSS,改用原生分辨率并启用TAA抗锯齿时,“NTC转码为BCn”模式的平均帧率提升至1700 FPS左右,“样本上的NTC推理”模式的平均帧率在1500左右。前者的1%低帧率略低于1100 FPS,后者的1%低帧率略低于800 FPS。

最后,Compusemble在4K分辨率下使用TAA并启用“样本上的NTC推理”模式测试了协同向量。启用协同向量时,平均帧率在1500左右,关闭后平均帧率急剧下降至略低于650 FPS。1%的低帧率在启用协同向量时略低于750 FPS,关闭时略高于400 FPS。

总结

Compusemble的RTX NTC基准测试显示,Nvidia的神经压缩技术可以大幅减少3D应用的纹理内存占用,但代价是性能下降,尤其是在“样本上的NTC推理”模式下。

DLSS与原生分辨率的性能对比是最有趣的。原生分辨率下显著的帧率提升表明,用于处理RTX NTC的张量核心被严重占用,可能达到了影响DLSS超采样性能的程度,足以潜在地限制着色器核心的性能。如果不是这样,我们应该会看到DLSS模式的运行帧率高于原生4K TAA的基准测试。

RTX神经纹理压缩已经开发了至少几年时间。这项新技术利用现代Nvidia GPU中的张量核心来压缩3D应用和视频游戏纹理,而不是传统的块截断编码。RTX NTC是自1990年代以来纹理压缩技术的首次重大升级,允许运行高达4倍分辨率的纹理,而今天的GPU无法实现。

该技术目前处于Beta阶段,没有发布日期。NTC的最低要求出人意料的低,Nvidia的RTX NTC GitHub页面确认,最低GPU要求是RTX 20系列GPU。然而,该技术也已在GTX 10系列GPU、AMD Radeon RX 6000系列GPU和Arc A系列GPU上进行了验证,表明该技术可能会在非RTX GPU甚至游戏主机上普及。



赞(0)
未经允许不得转载:奇谱科技 » Nvidia又炫技,新技术在Beta演示中将VRAM使用量降低96%
分享到:
广告