比企谷雪乃 发表于 2014-1-31 08:44

小aa,馒头的逆袭

win8 x64,1080p 4x msaa。
Test case 3: High-end single-player with multiple GPUs
CPU: Intel Core i7-3970x Extreme, 12 logical cores @ 3.5 GHz
GPU: 2x AMD Radeon R9 290x 4 GB
Settings: 1080p ULTRA 4x MSAA
OS: Windows 8 64-bit
Level: South China Sea “Broken Flight Deck”
This single-player scene is heavy on both the CPU and GPU with lots of action going on. Test was done on the highest end Intel CPU on Windows 8, which is the fastest option before Mantle thanks to DirectX 11.1. Still this CPU is not fast enough to keep the 2 290x GPUs fed at 1080p on Ultra settings so we get a significant CPU performance bottleneck which results in major performance improvement when enabling Mantle.
Result: 13.24 ms/f -> = 8.38 ms/f = 58% faster

http://battlelog.battlefield.com/bf4/en/news/view/2955063418790832415/
http://tieba.baidu.com/p/2841023531?pn=1

对高端显卡和多核cpu是针鸡血


----发送自 asus Nexus 7,Android 4.4.2

马春葛 发表于 2014-1-31 10:09

对中低端没有太大的作用?那总不能都去买290X吧?

tyx776 发表于 2014-1-31 14:11

tgfc那的帖子又说低端才有用?高端都的没用

----发送自 BBK vivo Xplay,Android 4.2.2

比企谷雪乃 发表于 2014-1-31 14:39

a10-7850k提升14%,fx-8350+7970提升25.1%,i7-3970x+290x cf提升58%

----发送自 asus Nexus 7,Android 4.4.2

sellboy 发表于 2014-1-31 15:55

tyx776 发表于 2014-1-31 14:11
tgfc那的帖子又说低端才有用?高端都的没用

----发送自 BBK vivo Xplay,Android 4.2.2 ...

最极端大概是组套四路服务器配290cf再场景元素开最大外加画质开最低。

tency 发表于 2014-2-1 07:07

为啥下面的评论都是日文的?

卖哥 发表于 2014-2-2 03:04

本帖最后由 卖哥 于 2014-2-2 03:11 编辑

大概是第一个第三方评测
http://www.guru3d.com/articles_pages/amd_mantle_preview.html

http://www.guru3d.com/index.php?ct=articles&action=file&id=9012
http://www.guru3d.com/index.php?ct=articles&action=file&id=9016



http://www.guru3d.com/index.php?ct=articles&action=file&id=9014

http://www.guru3d.com/index.php?ct=articles&action=file&id=9015

基本上,如果配了台cos PS4的CPU单核性能与GPU性能失衡的机子,或者用着旗舰显卡却喜欢开中画质,增益会很可观;
但是,如果你的CPU、GPU性能均衡,并且特效级别和GPU性能相符,增益大概是1X%级别。

infinte 发表于 2014-2-2 03:11

本帖最后由 infinte 于 2014-2-2 03:14 编辑

卖哥 发表于 2014-2-2 03:04
大概是第一个第三方评测
http://www.guru3d.com/articles_pages/amd_mantle_preview.html
我就说 API Latency 肯定不会占主要因素,不过为什么他们要另做 API 而不是推 OpenGL?GL 里面几个 ARB 也可以诶增加 batch 的啊……还有第三张图画的……任何座标系不从 0 开始的统计图都是耍流氓。

卖哥 发表于 2014-2-2 03:15

infinte 发表于 2014-2-2 03:11
我就说 API Latency 肯定不会占主要因素,不过为什么他们要另做 API 而不是推 OpenGL?GL 里面几个 ARB...

多重队列只是Mantle一部分特性,只不过是最容易拉出可见差距的一部分。

infinte 发表于 2014-2-2 03:18

卖哥 发表于 2014-2-2 03:15
多重队列只是Mantle一部分特性,只不过是最容易拉出可见差距的一部分。

MT 直接控制底层等同于将驱动里的那个 JIT 编译器要做的事情转嫁给第三方程序员(对,现在显卡驱动就是个 JIT 编译器),能减少 API 延迟是肯定的,但是我不认为对于 GPU 密集型应用,这部分延迟有多大。高画质测试也证明了这一点。

还有,要是农企真有良心,就请公布指令集和协议。

infinte 发表于 2014-2-2 03:39

卖哥 发表于 2014-2-2 03:15
多重队列只是Mantle一部分特性,只不过是最容易拉出可见差距的一部分。

另外这玩意消除的是一个固定的延迟值(几个毫秒的样子),所以帧数越高「提升」越大……

鸡蛋灌饼 发表于 2014-2-2 04:38

infinte 发表于 2014-2-2 03:11
我就说 API Latency 肯定不会占主要因素,不过为什么他们要另做 API 而不是推 OpenGL?GL 里面几个 ARB 也 ...

OpenGL和DX就是定义不同,架构是一样一样的,换了也没什么意义

鸡蛋灌饼 发表于 2014-2-2 04:39

本帖最后由 鸡蛋灌饼 于 2014-2-2 04:41 编辑

infinte 发表于 2014-2-2 03:18
MT 直接控制底层等同于将驱动里的那个 JIT 编译器要做的事情转嫁给第三方程序员(对,现在显卡驱动就是个 ...
指令集早公布了,CP和SP的都有

现在三家场子里唯一一家把指令集当宝贝看起来的是傻逼NVIDIA

卖哥 发表于 2014-2-2 14:31

再转一篇第三方评测
http://www.computerbase.de/artikel/grafikkarten/2014/erste-eindruecke-zu-amds-mantle/

这部分我觉得比较有意思
http://upload.ouliu.net/i/20140202141638f3vnc.png
这是德语,2K、4K的K说得是Kerne,也就是指CPU核心数量。

首先,BF4的DX版多核心利用率也很好,2Ghz四核心比2Ghz双核心性能提升巨大,已经和4.4Ghz四核心开HT基本一致。
其次,对BF4来说,1080P全MAX的画质,2Ghz 4核心起,DX和馒头都不存在CPU瓶颈,而在不存在CPU瓶颈的情况下,馒头相比DX仍旧有1X%级别的性能提升。
最后,馒头不仅仅对PS4那种核心巨多但是单核心性能不足的配置带来显著提升,对单核心性能和核心数都不足的配置提升也非常可观。

cherioo 发表于 2014-2-2 14:40

农企官方:

oz01 发表于 2014-2-2 15:29

希望nv别跟风搞个地平线啥的
否则pc游戏开发环境真的像地平线一样看得见永远走不到了

infinte 发表于 2014-2-2 16:10

卖哥 发表于 2014-2-2 14:31
再转一篇第三方评测
http://www.computerbase.de/artikel/grafikkarten/2014/erste-eindruecke-zu-amds-man ...

就是降低 API latency,对单核也是有效的。

infinte 发表于 2014-2-2 16:11

鸡蛋灌饼 发表于 2014-2-2 04:38
OpenGL和DX就是定义不同,架构是一样一样的,换了也没什么意义

GL 的整个 API 都由显卡驱动负责,可以做特化优化,而 DX 则分两层,上层是 M$ 写的,来保证可移植性,也因此开销更大。

鸡蛋灌饼 发表于 2014-2-2 16:37

infinte 发表于 2014-2-2 16:11
GL 的整个 API 都由显卡驱动负责,可以做特化优化,而 DX 则分两层,上层是 M$ 写的,来保证可移植性,也 ...
所谓的“特化优化”没什么根据,llvm那么多Pass也没见有人嫌它不能做优化

v724 发表于 2014-2-2 20:05

今天就出了14.1 beta,给我的感觉就是用了mantle之后全屏再切出来不用黑屏几秒了

男友4前几天更新说支持自己修改User.cfg指定游戏要用到多少个Thread,结果那个命令还是没用

oz01 发表于 2014-2-2 20:20

v724 发表于 2014-2-2 20:05
今天就出了14.1 beta,给我的感觉就是用了mantle之后全屏再切出来不用黑屏几秒了

男友4前几天更新说 ...

bf只是把一部分软光栅化扔出来让你随便指定线程数

v724 发表于 2014-2-2 20:27

指定了也没用…Job Thread依然是4(1055T

mindfury 发表于 2014-2-2 22:07

johnie 发表于 2014-2-2 22:37

welcom 发表于 2014-2-2 22:40

johnie 发表于 2014-2-2 22:37
总之 真的有人会为了这个技术去换显卡?A卡现在的价格……
何况这东西目前只支持bf4 还没其他厂商宣 ...

上面那张图我就一个惊喜,955超4G居然又活过来了,不愧是农企.........

johnie 发表于 2014-2-2 22:52

卖哥 发表于 2014-2-2 22:59

johnie 发表于 2014-2-2 22:37
总之 真的有人会为了这个技术去换显卡?A卡现在的价格……
何况这东西目前只支持bf4 还没其他厂商宣 ...

至少,这看得见摸得着的改善摆在那里,DX12加入类似特性的几率就大很多了。

albertfu 发表于 2014-2-3 00:10

有新玩意折腾总比没有好~

----发送自 STAGE1 App for Android.

tency 发表于 2014-2-3 00:21

换个api就有最少10%的提升,你们有什么不满的。
以后amd的显卡都支持馒头,只要各大引擎厂商跟进,还愁没游戏支持?

g500 发表于 2014-2-3 00:40

好像有七八个引擎支持馒头了吧,用这几个引擎做出来的游戏应该都支持馒头?
收冻疮也才800万美元,有个四五千万能拉拢一大批了
到时候就不是小aa求他们而是反过来了,同样枪车球,别人画面更好硬件需求更低,有没有?

鸡蛋灌饼 发表于 2014-2-3 05:11

本帖最后由 鸡蛋灌饼 于 2014-2-3 05:14 编辑

卖哥 发表于 2014-2-2 22:59
至少,这看得见摸得着的改善摆在那里,DX12加入类似特性的几率就大很多了。 ...
只要还是个API就别抱什么指望
或者你希望DX12跟Linux的DRI驱动一样就给你几个ioctl搞定一切?

sellboy 发表于 2014-2-3 10:51

鸡蛋灌饼 发表于 2014-2-3 05:11
只要还是个API就别抱什么指望
或者你希望DX12跟Linux的DRI驱动一样就给你几个ioctl搞定一切?
...

有些特性自然能移过来,移过来自然有好处。
不是终极方案就没意义?小aa不能仅靠这一招翻盘这招就没意义?
至少我不这么觉得。

奶绷子 发表于 2014-2-3 12:58

临界点 发表于 2014-2-3 14:38

引用第26楼卖哥于2014-02-02 22:59发表的:
引用:johnie 发表于 2014-2-2 22:37总之 真的有人会为了这个技术去换显卡?A卡现......

DX11最新版也要加新的技术支持 好像纹理效能也有所提升

----发送自 STAGE1 App for Android.

卖哥 发表于 2014-2-3 14:48

临界点 发表于 2014-2-3 14:38
DX11最新版也要加新的技术支持 好像纹理效能也有所提升

----发送自 STAGE1 App for Android. ...

用四叉树管理贴图嘛
基本就是id tech 5的Mega texture

无印凉粉 发表于 2014-2-3 22:32

鸡蛋灌饼 发表于 2014-2-4 05:08

sellboy 发表于 2014-2-3 10:51
有些特性自然能移过来,移过来自然有好处。
不是终极方案就没意义?小aa不能仅靠这一招翻盘这招就没意义 ...

这不是特性的问题,而是基础架构都不一样
你试试看把C++的Template Metaprogramming往Java移植下?

卖哥 发表于 2014-2-4 11:52

鸡蛋灌饼 发表于 2014-2-4 05:08
这不是特性的问题,而是基础架构都不一样
你试试看把C++的Template Metaprogramming往Java移植下? ...

我说了,有些特性……
比如多缓冲,opengl里都有类似功能了。
页: [1]
查看完整版本: 小aa,馒头的逆袭