婆罗门
精华
|
战斗力 鹅
|
回帖 0
注册时间 2008-7-8
|
本帖最后由 ft5555 于 2020-3-19 15:47 编辑
根据外网查到的更多信息合并整理:
引自外网
“使用与SSD速率相匹配的解压缩软件会消耗3个Zen 2 CPU内核。如果加上IO CPU开销,那就是另外两个内核因此,当现在仅占用一个CPU内核的十分之一时,由此产生的工作负载将完全消耗五个Zen 2 CPU内核。换句话说,要使Series X的性能达到其全IO速率,您需要构建一台具有13个Zen 2内核的PC。这是游戏专用的七个内核:一个用于Windows和Shell,五个用于IO和解压缩开销。” 在现有PC IO架构不变的情况下实现对等XSX的性能。
也就是说新架构:
DirectStorage – DirectStorage是一个全新的I / O系统,专门为游戏而设计,以释放SSD的全部性能和硬件解压缩。它是构成Xbox Velocity体系结构的组件之一。现代游戏会在后台执行资产流传输,以在您玩游戏时连续加载世界的下一部分,DirectStorage可以将这些I / O操作的CPU开销从多个核心减少到仅占单个核心的一小部分;从而释放出大量的CPU能力,使游戏可以花在更好的物理效果或场景中更多的NPC等领域。Xbox Series X引入了DirectX家族的最新成员,我们也计划将其引入Windows。
---------------节约出2个zen 2 cpu内核的IO开销 ,
下图是NV的gpudirect-storage示意图。避免了通过CPU内存中的缓冲区进行额外的拷贝带来的CPU IO负担(上代主机的统一内存架构,也是避免额外拷贝,但是由cpu拷贝到内存中,gpu直接寻址,还是给cpu增加了负担)
====================================================================
“我们的第二个组件是高速硬件解压缩模块,它可以提供超过6GB / s的速度,” Andrew Goossen透露。“这是一个专用的硅块,可从CPU上卸载解压缩工作,并与SSD匹配,因此解压缩永远不会成为瓶颈。解压缩硬件支持Zlib来存储常规数据,并支持一种新的名为BCPack的压缩[系统]。 GPU纹理通常构成游戏包装尺寸的绝大部分。”
硬件解压缩 –硬件解压缩是Xbox Series X引入的专用硬件组件,它允许游戏在SSD上占用尽可能少的空间,同时消除了通常与运行时解压缩相关的所有CPU开销。当以全固态硬盘性能运行时,它可以将解压缩的软件开销从三个以上的CPU内核减少到零个,从而为游戏释放了相当大的CPU能力,从而可以花在更好的游戏玩法和更高的帧率等领域。硬件解压缩是Xbox Velocity体系结构的组件之一
-------------------- 节约出3个zen 2 cpu内核.
也就是说这代主机数据在SSD上是经过压缩后存储的,跨平台游戏的话,PC上安装占用SSD空间要接近翻倍。ps5使用的是Kraken 压缩算法,xsx使用Zlib,但是ps5没提到专用解压缩模块,因为pci-e总线带宽不变,所以解压肯定不是发生在nvme硬盘一侧。
楼下 天神十三煞 说其实是GPU来完成的,
希望这个功能未来能在PC上实现。
=================================================================================
GPU工作创建 – Xbox Series X为GPU工作创建添加了硬件,固件和着色器编译器支持,从而为GPU提供了强大的功能,无需任何CPU协助即可有效处理新的工作负载。这为开发人员提供了更高的灵活性和性能,以实现他们的图形视觉。
---------------------------已经在VULKAN 1.2中实现 ,
NV官网的介绍:
https://devblogs.nvidia.com/new-vulkan-device-generated-commands/,未来应该也会随着win10更新被包含到dx12里,目前看图灵系列gpu支持这个。
读了一下,应该是把cpu向gpu的指令发送过程中由驱动来优化的队列排序,变成了每条指令自带标记,直接塞到显存中不同缓冲区域中,达到同类型打包的目的。还可以根据标记来排序或者乱序执行。
这个设计提升了指令发送效率,还给cpu减负。
ps:感觉win10 20H1的 Hardware-accelerated GPU scheduling说的就是这个功能啊。。。
========================================================================================
采样器反馈流(SFS) – Xbox Velocity体系结构的一部分,SFS是Xbox Series X硬件的一项功能,该功能允许游戏以精细的粒度仅将GPU场景所需的部分纹理加载到内存中,根据需要。这样可以提高纹理的内存利用率,这非常重要,因为每个4K纹理都占用8MB的内存。因为它避免了将不需要的纹理部分加载到内存中的浪费,所以它是物理内存量和SSD性能的有效2倍或3倍(或更高)乘数
------------------RNDA2架构新特性?占未来的资本?
微软的介绍:
https://devblogs.microsoft.com/directx/coming-to-directx-12-sampler-feedback-some-useful-once-hidden-data-unlocked/
Coming to DirectX 12— Sampler Feedback: some useful once-hidden data, unlocked
win10 20H1已经确认支持。引自”这种提高的效率可以将有效物理内存量提高2到3倍,并将I / O带宽提高2到3倍“ (是种等效关系,减少了不必要的纹理加载=I/O性能提升)
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|