找回密码
 立即注册
搜索
查看: 5356|回复: 37

[硬件] 小aa,馒头的逆袭

[复制链接]
     
发表于 2014-1-31 08:44 来自手机 | 显示全部楼层 |阅读模式
win8 x64,1080p 4x msaa。
Test case 3: High-end single-player with multiple GPUs
CPU: Intel Core i7-3970x Extreme, 12 logical cores @ 3.5 GHz
GPU: 2x AMD Radeon R9 290x 4 GB
Settings: 1080p ULTRA 4x MSAA
OS: Windows 8 64-bit
Level: South China Sea “Broken Flight Deck”
This single-player scene is heavy on both the CPU and GPU with lots of action going on. Test was done on the highest end Intel CPU on Windows 8, which is the fastest option before Mantle thanks to DirectX 11.1. Still this CPU is not fast enough to keep the 2 290x GPUs fed at 1080p on Ultra settings so we get a significant CPU performance bottleneck which results in major performance improvement when enabling Mantle.
Result: 13.24 ms/f -> = 8.38 ms/f = 58% faster

http://battlelog.battlefield.com ... 955063418790832415/
http://tieba.baidu.com/p/2841023531?pn=1

对高端显卡和多核cpu是针鸡血


----发送自 asus Nexus 7,Android 4.4.2
回复

使用道具 举报

     
发表于 2014-1-31 10:09 | 显示全部楼层
对中低端没有太大的作用?那总不能都去买290X吧?
回复

使用道具 举报

     
发表于 2014-1-31 14:11 来自手机 | 显示全部楼层
tgfc那的帖子又说低端才有用?高端都的没用

----发送自 BBK vivo Xplay,Android 4.2.2
回复

使用道具 举报

     
 楼主| 发表于 2014-1-31 14:39 来自手机 | 显示全部楼层
a10-7850k提升14%,fx-8350+7970提升25.1%,i7-3970x+290x cf提升58%

----发送自 asus Nexus 7,Android 4.4.2
回复

使用道具 举报

     
发表于 2014-1-31 15:55 来自手机 | 显示全部楼层
tyx776 发表于 2014-1-31 14:11
tgfc那的帖子又说低端才有用?高端都的没用

----发送自 BBK vivo Xplay,Android 4.2.2 ...

最极端大概是组套四路服务器配290cf再场景元素开最大外加画质开最低。
回复

使用道具 举报

     
发表于 2014-2-1 07:07 | 显示全部楼层
为啥下面的评论都是日文的?
回复

使用道具 举报

     
发表于 2014-2-2 03:04 | 显示全部楼层
本帖最后由 卖哥 于 2014-2-2 03:11 编辑

大概是第一个第三方评测
http://www.guru3d.com/articles_pages/amd_mantle_preview.html










基本上,如果配了台cos PS4的CPU单核性能与GPU性能失衡的机子,或者用着旗舰显卡却喜欢开中画质,增益会很可观;
但是,如果你的CPU、GPU性能均衡,并且特效级别和GPU性能相符,增益大概是1X%级别。

回复

使用道具 举报

     
发表于 2014-2-2 03:11 | 显示全部楼层
本帖最后由 infinte 于 2014-2-2 03:14 编辑

我就说 API Latency 肯定不会占主要因素,不过为什么他们要另做 API 而不是推 OpenGL?GL 里面几个 ARB 也可以诶增加 batch 的啊……还有第三张图画的……任何座标系不从 0 开始的统计图都是耍流氓。
回复

使用道具 举报

     
发表于 2014-2-2 03:15 | 显示全部楼层
infinte 发表于 2014-2-2 03:11
我就说 API Latency 肯定不会占主要因素,不过为什么他们要另做 API 而不是推 OpenGL?GL 里面几个 ARB  ...

多重队列只是Mantle一部分特性,只不过是最容易拉出可见差距的一部分。
回复

使用道具 举报

     
发表于 2014-2-2 03:18 | 显示全部楼层
卖哥 发表于 2014-2-2 03:15
多重队列只是Mantle一部分特性,只不过是最容易拉出可见差距的一部分。

MT 直接控制底层等同于将驱动里的那个 JIT 编译器要做的事情转嫁给第三方程序员(对,现在显卡驱动就是个 JIT 编译器),能减少 API 延迟是肯定的,但是我不认为对于 GPU 密集型应用,这部分延迟有多大。高画质测试也证明了这一点。

还有,要是农企真有良心,就请公布指令集和协议。
回复

使用道具 举报

     
发表于 2014-2-2 03:39 | 显示全部楼层
卖哥 发表于 2014-2-2 03:15
多重队列只是Mantle一部分特性,只不过是最容易拉出可见差距的一部分。

另外这玩意消除的是一个固定的延迟值(几个毫秒的样子),所以帧数越高「提升」越大……
回复

使用道具 举报

发表于 2014-2-2 04:38 | 显示全部楼层
infinte 发表于 2014-2-2 03:11
我就说 API Latency 肯定不会占主要因素,不过为什么他们要另做 API 而不是推 OpenGL?GL 里面几个 ARB 也 ...

OpenGL和DX就是定义不同,架构是一样一样的,换了也没什么意义
回复

使用道具 举报

发表于 2014-2-2 04:39 | 显示全部楼层
本帖最后由 鸡蛋灌饼 于 2014-2-2 04:41 编辑
infinte 发表于 2014-2-2 03:18
MT 直接控制底层等同于将驱动里的那个 JIT 编译器要做的事情转嫁给第三方程序员(对,现在显卡驱动就是个 ...

指令集早公布了,CP和SP的都有

现在三家场子里唯一一家把指令集当宝贝看起来的是傻逼NVIDIA
回复

使用道具 举报

     
发表于 2014-2-2 14:31 | 显示全部楼层
再转一篇第三方评测
http://www.computerbase.de/artik ... cke-zu-amds-mantle/

这部分我觉得比较有意思

这是德语,2K、4K的K说得是Kerne,也就是指CPU核心数量。

首先,BF4的DX版多核心利用率也很好,2Ghz四核心比2Ghz双核心性能提升巨大,已经和4.4Ghz四核心开HT基本一致。
其次,对BF4来说,1080P全MAX的画质,2Ghz 4核心起,DX和馒头都不存在CPU瓶颈,而在不存在CPU瓶颈的情况下,馒头相比DX仍旧有1X%级别的性能提升。
最后,馒头不仅仅对PS4那种核心巨多但是单核心性能不足的配置带来显著提升,对单核心性能和核心数都不足的配置提升也非常可观。
回复

使用道具 举报

发表于 2014-2-2 14:40 | 显示全部楼层
农企官方:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2014-2-2 15:29 | 显示全部楼层
希望nv别跟风搞个地平线啥的
否则pc游戏开发环境真的像地平线一样看得见永远走不到了
回复

使用道具 举报

     
发表于 2014-2-2 16:10 | 显示全部楼层
卖哥 发表于 2014-2-2 14:31
再转一篇第三方评测
http://www.computerbase.de/artikel/grafikkarten/2014/erste-eindruecke-zu-amds-man ...

就是降低 API latency,对单核也是有效的。
回复

使用道具 举报

     
发表于 2014-2-2 16:11 | 显示全部楼层
鸡蛋灌饼 发表于 2014-2-2 04:38
OpenGL和DX就是定义不同,架构是一样一样的,换了也没什么意义

GL 的整个 API 都由显卡驱动负责,可以做特化优化,而 DX 则分两层,上层是 M$ 写的,来保证可移植性,也因此开销更大。
回复

使用道具 举报

发表于 2014-2-2 16:37 | 显示全部楼层
infinte 发表于 2014-2-2 16:11
GL 的整个 API 都由显卡驱动负责,可以做特化优化,而 DX 则分两层,上层是 M$ 写的,来保证可移植性,也 ...

所谓的“特化优化”没什么根据,llvm那么多Pass也没见有人嫌它不能做优化

回复

使用道具 举报

发表于 2014-2-2 20:05 | 显示全部楼层
今天就出了14.1 beta,给我的感觉就是用了mantle之后全屏再切出来不用黑屏几秒了

男友4前几天更新说支持自己修改User.cfg指定游戏要用到多少个Thread,结果那个命令还是没用
回复

使用道具 举报

     
发表于 2014-2-2 20:20 | 显示全部楼层
v724 发表于 2014-2-2 20:05
今天就出了14.1 beta,给我的感觉就是用了mantle之后全屏再切出来不用黑屏几秒了

男友4前几天更新说 ...

bf只是把一部分软光栅化扔出来让你随便指定线程数
回复

使用道具 举报

发表于 2014-2-2 20:27 | 显示全部楼层
指定了也没用…Job Thread依然是4(1055T
回复

使用道具 举报

头像被屏蔽
发表于 2014-2-2 22:07 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2014-2-2 22:37 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2014-2-2 22:40 | 显示全部楼层
johnie 发表于 2014-2-2 22:37
总之 真的有人会为了这个技术去换显卡?A卡现在的价格……
何况这东西目前只支持bf4 还没其他厂商宣 ...

上面那张图我就一个惊喜,955超4G居然又活过来了,不愧是农企.........
回复

使用道具 举报

头像被屏蔽
     
发表于 2014-2-2 22:52 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2014-2-2 22:59 | 显示全部楼层
johnie 发表于 2014-2-2 22:37
总之 真的有人会为了这个技术去换显卡?A卡现在的价格……
何况这东西目前只支持bf4 还没其他厂商宣 ...

至少,这看得见摸得着的改善摆在那里,DX12加入类似特性的几率就大很多了。
回复

使用道具 举报

发表于 2014-2-3 00:10 来自手机 | 显示全部楼层
有新玩意折腾总比没有好~

----发送自 STAGE1 App for Android.
回复

使用道具 举报

     
发表于 2014-2-3 00:21 | 显示全部楼层
换个api就有最少10%的提升,你们有什么不满的。
以后amd的显卡都支持馒头,只要各大引擎厂商跟进,还愁没游戏支持?
回复

使用道具 举报

发表于 2014-2-3 00:40 | 显示全部楼层
好像有七八个引擎支持馒头了吧,用这几个引擎做出来的游戏应该都支持馒头?
收冻疮也才800万美元,有个四五千万能拉拢一大批了
到时候就不是小aa求他们而是反过来了,同样枪车球,别人画面更好硬件需求更低,有没有?
回复

使用道具 举报

发表于 2014-2-3 05:11 | 显示全部楼层
本帖最后由 鸡蛋灌饼 于 2014-2-3 05:14 编辑
卖哥 发表于 2014-2-2 22:59
至少,这看得见摸得着的改善摆在那里,DX12加入类似特性的几率就大很多了。 ...

只要还是个API就别抱什么指望
或者你希望DX12跟Linux的DRI驱动一样就给你几个ioctl搞定一切?
回复

使用道具 举报

     
发表于 2014-2-3 10:51 来自手机 | 显示全部楼层
鸡蛋灌饼 发表于 2014-2-3 05:11
只要还是个API就别抱什么指望
或者你希望DX12跟Linux的DRI驱动一样就给你几个ioctl搞定一切?
...

有些特性自然能移过来,移过来自然有好处。
不是终极方案就没意义?小aa不能仅靠这一招翻盘这招就没意义?
至少我不这么觉得。
回复

使用道具 举报

头像被屏蔽
发表于 2014-2-3 12:58 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2014-2-3 14:38 来自手机 | 显示全部楼层
引用第26楼卖哥于2014-02-02 22:59发表的  :
引用:johnie 发表于 2014-2-2 22:37总之 真的有人会为了这个技术去换显卡?A卡现......

DX11最新版也要加新的技术支持 好像纹理效能也有所提升

----发送自 STAGE1 App for Android.
回复

使用道具 举报

     
发表于 2014-2-3 14:48 | 显示全部楼层
临界点 发表于 2014-2-3 14:38
DX11最新版也要加新的技术支持 好像纹理效能也有所提升

----发送自 STAGE1 App for Android. ...

用四叉树管理贴图嘛
基本就是id tech 5的Mega texture
回复

使用道具 举报

头像被屏蔽
     
发表于 2014-2-3 22:32 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2014-2-4 05:08 | 显示全部楼层
sellboy 发表于 2014-2-3 10:51
有些特性自然能移过来,移过来自然有好处。
不是终极方案就没意义?小aa不能仅靠这一招翻盘这招就没意义 ...

这不是特性的问题,而是基础架构都不一样
你试试看把C++的Template Metaprogramming往Java移植下?
回复

使用道具 举报

     
发表于 2014-2-4 11:52 | 显示全部楼层
鸡蛋灌饼 发表于 2014-2-4 05:08
这不是特性的问题,而是基础架构都不一样
你试试看把C++的Template Metaprogramming往Java移植下? ...

我说了,有些特性……
比如多缓冲,opengl里都有类似功能了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-9-7 01:39 , Processed in 0.223884 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表