【授权转载】【翻译】30系显卡NV官方问答
本帖最后由 zxw11211 于 2020-9-3 12:14 编辑原帖地址:[https://www.reddit.com/r/nvidia/comments/ilhao8/nvidia_rtx_30series_you_asked_we_answered/]
NV官方Justin Walker(NV 桌面卡 PM)的答复。
翻译原帖 nga用户@AX.Procyon
翻译贴转载已获得翻译作者同意
看完问答,我自己作为10系钉子户觉得可以毫不犹豫的上3080了
30系 你问我答 NV官方对一些问题的回应 NGA玩家社区 P1
https://ngabbs.com/read.php?tid=23213326&_ff=334
==============以下为翻译贴原文==============
免责声明:此贴仅为翻译,我和NV没关系,翻译不准以原帖为准,别问我问题,我也不知道 我就是个翻译的
===============================
挑重要的翻译了 篇幅太长不可能全文对应翻译了
Q:为啥3080才10G显存?和前代的提升不够大
A:3080的目标是4K全最高画质下价格适中。举例:本世代3A大作如SOTTR,奥德赛,地铁离去,德军总部新血脉,战争机器5,无主之地3,荒野大镖客2于3080上运行4K全最高画质(包括使用高清素材包) 在60-100fps下也只使用了4-6GB显存 因此为了压低售价控制成本采用了10GB的G6X。
===========================================
Q:3070比2080Ti更快指的是光追+DLSS性能还是传统光栅化性能?
A;我们指的是两者都是。
===========================================
Q:HDMI2.1是满血48Gbps吗?
A:是,最高可以支持通过DSC的8K 60 HDR
===========================================
Q:可以解释下为何本代的CUDA核心数直接翻倍吗?如何喂饱所有FP32核心?如何保证占用率均衡?
A:30系的SM设计目标即为两倍图灵的FP32性能。因此我们为FP32和INT32设计了新的数据路径(datapath)。一组路径包含了16 FP32核心 每个时钟周期可以执行16条FP32指令;另一条路径包含16个FP32和16个INT32核心。由于此设计,每个安培SM可以选择执行每个时钟周期32条FP32命令,或者16条FP32+16条INT32操作。四组SM相加可以每个时钟周期执行128条FP32指令,相比于图灵的单个SM 每个时钟周期执行64条FP32+INT32指令翻倍。…(此段略)…2x数学操作输出需要2x数据路径的支持 因此安培架构每SM的共享记忆体和L1缓存性能也翻倍(每周期128Bytes,图灵为64B)。3080的总L1带宽为219GB/s(2080S为116GB/s)。…(此段略)…更多关于安培架构的细节将于日后的英伟达安培架构**中发布。
===========================================
Q:新公版散热的设计在倒置风道的机箱内是否会造成问题?第二,3090比Titan安静10倍是什么意思?
A:新的穿透流式散热器在机箱风道能够给GPU带来新鲜空气并且能把热空气移除就能达到效果,和是否倒置无关。静音效果指的是与Titan RTX和2080S FE相比,并非第三方设计。
===========================================
Q:30系卡是否支持10bit 444 120FPS输出?
A:是。30系支持10bit HDR。HDMI2.1最高可支持8K 60 12bit HDR,其中包含了10bit HDR的支持。
===========================================
Q:PCIe 3.0是否会造成性能损失?
A:一般而言从PCIe 4.0x16到PCIe 3.0x16的性能损失不会高于个位数百分比。CPU性能对GPU的表现更加重要。我们希望有更多的新平台能够支持PCIe4让GPU满血发挥。
===========================================
…(略去一个问题)…
===========================================
Q:RTX IO是否是使用SSD作为显存?
A:否。RTX IO允许显卡直接从SSD读取数据,快于传统方法,并且使得数据可以以GPU可读的压缩模式存储,解压和读取。此功能更多是减少CPU的负荷和性能损耗。
===========================================
Q:RTX IO是否对SSD性能有门槛要求?
A:否。事实上RTX IO并不需要SSD。但是显然,SSD尤其是PCIe 4.0 SSD会有优势。日后的游戏视开发者需求可能会有SSD的要求。不论SSD性能如何,RTX IO都会给SSD提速,原理是减少CPU的负荷并且允许GPU解压。一般而言游戏的压缩率约为2:1,因此绕过CPU等效于SSD读取性能x2.
===========================================
Q:新卡的Win7、Win8.1支持?
A:新卡可以于Win7和Win10运行。RTX IO于Win10支持。
===========================================
Q:RTX IO具体是如何工作的?如果我有NVMe SSD,30系新卡和最新的驱动,是否我只需要等待Win10 更新DirectStorage API即可?
A:RTX IO he DirectStorage需要应用本身支持这些API。微软准备于明年开始放出对开发者的包含DirectStorage的Windows预览版。RTX显卡用户将于这些更新就位后即可使用RTX IO。
===========================================
Q:NVIDIA Broadcast是否会取代GFE/shadowplay的本地录屏?
A:否。NVIDIA Broadcast仅是一个插件应用,并不具备录屏功能。不会取代GFE和Shadowplay
===========================================
Q:新一代的解编码器是否会有更新提升?
A:30系的侧重是解码提升,因此我们引入了AV1硬解支援。编码器同20系。同时会有新的SDK。
……(此问题略,和上一问几乎相同)…
===========================================
Q:AV1硬解是否是3090独占?
A:否。30系所有显卡搭载的是同样的第五代硬件解码器。
===========================================
…(Machinema和Studio的两问略)…
===========================================
Q:NVIDIA Reflex是新显示器硬件的一部分还是一个软件?
A:都是。NVIDIA Reflex 延迟分析器是G-Sync处理器新的一部分,可以测量总系统延迟。此外,Reflex SDK可以被整合进游戏中并启用超低延迟模式以减缓系统延迟。此功能支持900系及以上。这些功能都可以单独启用。
https://ngabbs.com/read.php?&tid=23213326
===========================================
编码器没提升…去年买了 1650s 压片的笑开花 有口皆悲 发表于 2020-9-3 12:38
HDMI2.1是90独占吗?
70 80 90都有hdmi2.1 还真是一个SM内64 FP32 + 64 FP32/INT32这种设计,调度资源应该没加所以显得效率下降,下一代可能就是资源增长不大但效率提高了。
感觉有点fermi到kepler再到maxwell的意思。 满血hdmi2.1啊,前几天看hdtvtest说是新一代xbox是40gbps,没满血,老黄这次是可以说各种意义上的配置拉满
-- 来自 能搜索的 Stage1官方 iOS客户端 66666 发表于 2020-9-3 13:06
因为本来图灵SM就是双发射,只不过执行单元就2个,现在增加3个并不需要弄三发射,毕竟int32指令并不多而 ...
不是单发射双周期运行吗?turning才16int 16fp塞双发射有什么用 66666 发表于 2020-9-3 13:16
谁说只有单发射的?图灵都出2年了,**上写的清清楚楚SM里两个发射,单周期可以同时发射16个FP32和16个int ...
whitepaper上写的是每个processing block有16int 16fp,每周期发射一个warp(32thread),哪里有双发射了。
而且单发射双周期运行不就正好保证运算单元满载么,多塞一个发射单元除了闲置还有什么用。 不知道是否会早点出3050
这个要是能有的话 应该足够应付1080P了吧 cybernetics31 发表于 2020-9-3 13:04
满血hdmi2.1啊,前几天看hdtvtest说是新一代xbox是40gbps,没满血,老黄这次是可以说各种意义上的配置拉满
...
LG今年出了几个新电视也不是满血2.1接口,对比去年的产品还倒退了 66666 发表于 2020-9-3 15:46
有专门的int指令发射单元,不然怎么做到int和FP32指令并行运行?一个warp下只是data有区别,指令都是同一 ...
这个周期发warp a给fp32,下个周期发warp b给int32,两组单元各自都要算两个周期,这不就并行了嘛 66666 发表于 2020-9-3 17:21
data又不是能每次正好能填满一个warp,你这种做法流水线长时间都吃不饱,GPU设计师这么玩早就下岗了 ...
解决这个问题不是应该在thread管理那边去做嘛,和每周期发射能力有什么关系 内森德雷克 发表于 2020-9-3 15:54
LG今年出了几个新电视也不是满血2.1接口,对比去年的产品还倒退了
今年就美国那个vizio是满血,估计各家都是商量好的,三星家的也不是满血,再加上xbox,老黄的卡估计真得配个8k电视 应该问问为什么取消了usb-c接口
页:
[1]