圣者
精华
|
战斗力 鹅
|
回帖 0
注册时间 2016-2-24
|
作者:刘庆
链接:https://www.zhihu.com/question/49190987/answer/115244471
来源:知乎
著作权归作者所有,转载请联系作者获得授权。
现在ILP Wall+Memory Wall+Power Wall三座大山已经挡在Intel的面前,目前来看也只能加加浮点单元(Haswell/Broadwell:4,Skylake:5),然而利用多浮点单元的局限性跟多线程优化有些地方很类似,望天,一些常用算法还是只能硬吃频率,但是频率有墙……
顺便提一句,仔细算算从80486DX到Pentium III Tualatin,每年的单位频率效能提升也就平均7%,Pentium 4属于走了弯路不算,Conroe的架构跟图拉丁接近,再往后就不说了。其实一如既往的难,只是以前频率没卡着,还有单核性能在提高的假象而已。
有人提到了GPU,你觉得GPU性能一直在提高,只是因为图形算法可以高并发而已,而且Graphics Memory的需求是高带宽,也就是说可高延迟(GDDR5和DDR3是同等技术,但是GDDR5延迟高不少,换来了超高的带宽。GDDR5X延迟更大)因此Memory Wall的影响也不明显。而且GPU核心由于并发度高,单Core的结构简单,整个核心可以做得比较大,卡Power Wall的上限也高了不少(这一点上可以类比服务器的E5,20Cores/2.2GHz的功耗比10Cores/4.4GHz低太多了。i7 6950X超频4.4GHz,一般都要360冷排的分体水才能压住,然而20C/2.2G的E5,一个小扇子搞定的事。)所以还一直在按照摩尔定律提升性能。
如果硬要比所谓的“单线程性能”,应该拿10年前的Tesla架构8800GTX出来,对比单个流处理器的效能。找了下跑分,貌似能找到跑3DMark Vantage Extreme模式分数的最强显卡是GTX980,27366分。8800GTX差不多2900分,看起来是10倍,然而这是2048sp vs 128sp的效能(实际上流处理器频率差不多,1288 vs 1350MHz),这么说来显卡这十年的“单线程”效能进步更惨啊…… |
|