找回密码
 立即注册
搜索
楼主: Stuka

[硬件] Haswell ---> 坑爹

[复制链接]
     
发表于 2013-5-17 10:48 | 显示全部楼层
我倒是觉得一般民用的CPU已经性能过剩了,现在更加需要改善的是发热和功耗的问题
回复

使用道具 举报

头像被屏蔽
发表于 2013-5-17 10:55 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2013-5-17 11:02 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2013-5-17 11:31 | 显示全部楼层
引用第43楼sblnrrk于2013-05-17 11:02发表的  :
K10当时也还凑合,但是说比推土机好。。。那只是极少情况,越是新作推土机差距越小甚至能反超同级i5,但是可惜单线程着实垃圾,网游全系完蛋,在逆向超线程出来前,普通用户毫无疑问当然选择i5
农企现在的片子连三射都没有,逆向HT这东西还是别指望了的好
回复

使用道具 举报

     
发表于 2013-5-17 11:38 | 显示全部楼层
8系列芯片组USB 3.0 bug,我大英特尔无视之继续出货
http://www.expreview.com/25418.html

这爹坑得大了
回复

使用道具 举报

     
发表于 2013-5-17 11:52 | 显示全部楼层
同为32nm的两代APU
3850和5800K
就可以比较两代架构性能的好坏了,更不用说,还有继续强10%的6800K。
回复

使用道具 举报

发表于 2013-5-17 12:03 | 显示全部楼层

Re:回 28楼(ssnx30) 的帖子

引用第30楼welcom于2013-05-17 00:13发表的 回 28楼(ssnx30) 的帖子 :
虽然理论上是没错,我955超4G配合660TI也确实跑地铁新作没问题,不过这玩意用了几个月之后感觉还是看不顺眼就是了

说不定连660TI还没到不行了的时候就都扔了换新.......
传统上,Intel每代处理器的超低压版本都会晚很久才会发布,但是到了Haswell将会第一次同步首发,而且上来就有多达八款型号,i7、i5、i3一应俱全。
今天,我们第一次听说了超低压版Haswell的确切规格,尽管只有两款型号。
Core i7-4650U是最高端的,双核心四线程,三级缓存4MB,主频1.7-3.3GHz,整合图形核心HD 5000,频率200-1100MHz,内存支持DDR3/3L-1600,BGA封装,热设计功耗15W。
Core i5-4350U则比较中端,三级缓存削减到3MB,主频降至1.4-2.9GHz,其它都完全同上,也是15W。
相比现在的Ivy Bridge,新的超低压版最大的变化就是热设计功耗降低了2W,同时图形核心升级为新一代的GT3,但其它基础规格并无多大提升,尤其是频率反而还要稍低一些(i7-3687U基础频率就有2.1GHz),同时各方面的限制使得这里的GT3也是最精简的一个版本,上边还有Iri 5100、Iris Pro 5200。
值得一提的是,已有的超低压版数字编号末尾都是7,非常容易辨别,Haswell的则是00、50结尾,只是同样保留了U字母后缀。


15W!只要15W!
回复

使用道具 举报

发表于 2013-5-17 12:04 | 显示全部楼层
引用第45楼john于2013-05-17 11:38发表的  :
8系列芯片组USB 3.0 bug,我大英特尔无视之继续出货
http://www.expreview.com/25418.html

这爹坑得大了
USB Implementers Forum:我们中出了一个叛徒!
Intel:有本事你咬我啊,八嘎
回复

使用道具 举报

     
发表于 2013-5-17 13:54 | 显示全部楼层
= =看了一整层楼,感觉S1的A黑I厨真心太丧心病狂了。

AMD好歹桌面市场占有率43%,移动市场虽然不济,20%还是有的。

好歹PS4指定。
好歹显核遥遥领先。

‘……生死线上徘徊,扔了传统PC……’

哪有你们说得那么不堪。
嘛……其实也没啥好争的。

我只想说,我很看好AMD。
如果下一代APU真如传闻直接把DDR5内存颗粒直接焊主板上【内存性能直接跨越,显核优势直接满载】,我绝对来一套。
回复

使用道具 举报

     
发表于 2013-5-17 14:07 | 显示全部楼层
引用第49楼cexo于2013-05-17 13:54发表的  :
= =看了一整层楼,感觉S1的A黑I厨真心太丧心病狂了。

AMD好歹桌面市场占有率43%,移动市场虽然不济,20%还是有的。

好歹PS4指定。
.......
什么时候桌面43%了?

AMD最凶残的时候,DIY市场占有率破60%的时候,桌面整体占有率都没破40%
回复

使用道具 举报

头像被屏蔽
     
发表于 2013-5-17 14:13 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2013-5-17 14:13 | 显示全部楼层
引用第49楼cexo于2013-05-17 13:54发表的  :
= =看了一整层楼,感觉S1的A黑I厨真心太丧心病狂了。

AMD好歹桌面市场占有率43%,移动市场虽然不济,20%还是有的。

好歹PS4指定。
.......



哪个位面 的AMD?
回复

使用道具 举报

头像被屏蔽
发表于 2013-5-17 14:19 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
发表于 2013-5-17 14:20 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2013-5-17 14:41 | 显示全部楼层
引用第53楼IOSYS于2013-05-17 14:19发表的  :

流水线宽度和逆向超线程(再次表示我觉得这东西不可能实现)没有半毛钱关系啊

K10就是完整三发射,相对应的outel是不完整四发射
但是我记得K10三发射似乎有个三个乘法器无法同时运作之类的问题(具体记不清楚了),所以才有这种K10的实际表现那么差的现象
.......

逆向超线程无非是硬件识别来拆循环和拆分支而已
就跟已经实现的,硬件识别指令的相关性来实现多发射和乱序执行一样,理论上都是没问题的。


GPU那边已经往这个方向走了。
回复

使用道具 举报

     
发表于 2013-5-17 14:46 | 显示全部楼层
此外,推土机比K10也显示了,2发射不比3发射同频弱。
回复

使用道具 举报

发表于 2013-5-17 14:46 | 显示全部楼层
引用第53楼IOSYS于2013-05-17 14:19发表的  :

流水线宽度和逆向超线程(再次表示我觉得这东西不可能实现)没有半毛钱关系啊

K10就是完整三发射,相对应的outel是不完整四发射
但是我记得K10三发射似乎有个三个乘法器无法同时运作之类的问题(具体记不清楚了),所以才有这种K10的实际表现那么差的现象
.......
逆向超线程不就是HT披马甲么
Intel说我这是一个Core四射能跑两个线程,AMD搞出来说我这是两个Cores能每核心两射跑两个线程,也能用四射跑一个线程
当然不排除其他神奇的技术,但最接近现实的应该就是这样。

考虑到推土机跳票那么久,可以做出这样的猜想:
  AMD当初是准备四射+HT。瞄到Core系的spec后这是唯一能扳平的方案。
  最后回去玩两射完全是因为玩不转四射转投的B计划
引用第54楼IOSYS于2013-05-17 14:20发表的  :

AMD的X86还是不要争扎了,现在他们的水平已经在门槛之外了
超算之壁AMD
搞不赢它的只能在服务器市场玩票
引用第49楼cexo于2013-05-17 13:54发表的  :
= =看了一整层楼,感觉S1的A黑I厨真心太丧心病狂了。

AMD好歹桌面市场占有率43%,移动市场虽然不济,20%还是有的。

好歹PS4指定。
.......
你自己看看现在的农企,一副去移动平台混吃等死的架势。
暂时出不来顶级产品开性能光环罩着自己就算了,好歹摆出个姿势行不?现在好,彻底放弃高性能芯片这个路线了,好像移动市场很好混的似的。
引用第55楼卖哥于2013-05-17 14:41发表的  :


逆向超线程无非是硬件识别来拆循环和拆分支而已
就跟已经实现的,硬件识别指令的相关性来实现多发射和乱序执行一样,理论上都是没问题的。

.......
自动向量化这事编译器都要狠命折腾,做硬件里那真是蛋疼……
引用第49楼cexo于2013-05-17 13:54发表的  :
如果下一代APU真如传闻直接把DDR5内存颗粒直接焊主板上【内存性能直接跨越,显核优势直接满载】,我绝对来一套。
DDR5?
DDR4都没普及呢好吧
你想说GDDR?但你知道不知道VRAM这东西和DRAM在性能方面是有不同的?

APU现在的市场定位不给你去用DDR3L就不错了,还指望DDR4
回复

使用道具 举报

头像被屏蔽
发表于 2013-5-17 14:58 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2013-5-17 15:08 | 显示全部楼层
引用第58楼IOSYS于2013-05-17 14:58发表的  :

那是因为K10的三发射有BUG(也不好说是BUG,很可能是硬伤),插出三个指令,三条完全的流水线也无法同时执行

K10的浮点流水线是非对称的


FADD、FMUL、FMISC各一个
其中FMISC干的活不少是非流水的


但这是标准设计,有什么硬伤的?
回复

使用道具 举报

     
发表于 2013-5-17 15:08 | 显示全部楼层
15瓦和17瓦,反映到win8本的续航上能多坚持多久?我硬件不懂,看起来没减低很多啊。。。
回复

使用道具 举报

头像被屏蔽
发表于 2013-5-17 15:09 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
发表于 2013-5-17 15:11 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2013-5-17 15:16 | 显示全部楼层
引用第57楼鸡蛋灌饼于2013-05-17 14:46发表的  :

DDR5?
DDR4都没普及呢好吧
你想说GDDR?但你知道不知道VRAM这东西和DRAM在性能方面是有不同的?

.......



没心情对喷,关于下一代APU新架构的构想,网上N多,而且PS4就是直接把DDR5焊主板上显存内存共享。自己GOOGLE去吧。
不过,我想你大概也没那心思去搜。


有点不理解I厨的心态。如果不是IU代理商无任何利益关系的话,这么黑amd对自己到底有啥好处?不用不就得了,也没人逼你用。
怒其不争这类话用不着I厨来说,AMD不是你儿子,而且他也听不到。


我对于U倒是没啥明显的偏向性,目前自己开的公司里有I3 I5 A6 A8 都有,我自己用的都还是INTEL的Q6850这古董四核。
对比来说,AU从各个角度都比IU良心太多。
性能够用价格便宜。虽然没有IU战斗力强,但跑个PS,SKETCHUP之类的软件没任何问题。【关键是同样用显核,在SKP下建模,AU比IU流畅太多】
至少以后要添置常规设备的话,新出的A10 6800k肯定是我的首选。


其实我明白,对I厨摆事实讲道理根本就没意义,而且这里厨又多。所以,我想破处区里这类帖子我还是不进为好。


最后,祝你们喷得愉快~
回复

使用道具 举报

     
发表于 2013-5-17 15:19 | 显示全部楼层
引用第63楼cexo于2013-05-17 15:16发表的  :




没心情对喷,关于下一代APU新架构的构想,网上N多,而且PS4就是直接把DDR5焊主板上显存内存共享。自己GOOGLE去吧。
.......
PS4
Memory     8 GB GDDR5 (unified)

最近论坛里这种一本正经批评别人的半瓶子水怎么越来越多了
回复

使用道具 举报

头像被屏蔽
发表于 2013-5-17 15:23 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2013-5-17 15:32 | 显示全部楼层
引用第61楼IOSYS于2013-05-17 15:09发表的  :

线程水平的多线程和指令水平的可不一样
再者,所谓逆向超线程,如果我们理解没有出路的话,应该指的是和HT相反的2n核n线程吧
但是这种将两个核心的资源同时供一个线程使用,在逻辑上就遇到问题了,要不这两个核心本来就只是一个核心,要不就变成指令多线程。
唯一接近逆向超线程的是一种投机多线程(SPMT),就是遇到分支的时候,让不同核心把每一个分支都跑一遍,最后保留一个,通过大幅牺牲多核心性能来提高单核性能。当时有传闻推土机有这种技术,就是因为推土机的奇怪架构确实可以用来这么跑
.......
常规代码的可并行度是有限的,现在流水线的一般情况不是不足,而是喂不饱
想提高并行度,拆分支和拆循环是摆着好久的方向
回复

使用道具 举报

头像被屏蔽
发表于 2013-5-17 15:34 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2013-5-17 15:39 | 显示全部楼层
引用第63楼cexo于2013-05-17 15:16发表的  :
没心情对喷,关于下一代APU新架构的构想,网上N多,而且PS4就是直接把DDR5焊主板上显存内存共享。自己GOOGLE去吧。
.......
连着两帖上来就蹦基础错误
对喷?对不起,你还没那个资格让我跟你对喷。最多是我单方面给你的帖子挑对。
引用第64楼john于2013-05-17 15:19发表的  :

PS4
Memory     8 GB GDDR5 (unified)

最近论坛里这种一本正经批评别人的半瓶子水怎么越来越多了
这位弄不好还以为那个G是人家打错了呢
引用第65楼IOSYS于2013-05-17 15:23发表的  :

而放过来看,推土机的架构完全相反,是一个前端连接2条执行单元,HT什么的往返方向走无法实现不说,如果也采用宽流水线,比如同样4发射,本来就需要2个前端来填4条管线,现在一个前端去填8条管线,肯定是大量气泡的坑爹货了。

其实推土机的架构就是一个前端轮流将指令发送给两个窄而长的流水线。这种机理说真的,我问了N多人,没人说的出优点在哪里.......
不不你理解错了,四射我指的是推土机的一个模块里的两个核心共用四射,不是两个核心每个四射。不共用的话怎么逆向啊。
至于推土机的优点么,可以充分利用内存带宽减少等待应该是优点吧。把模块里的核心多堆一点就接近GPU的架构了。
我估计Xeon Phi的P54C能跑四线程应该也是差不多的机制
引用第66楼卖哥于2013-05-17 15:32发表的  :

常规代码的可并行度是有限的,现在流水线的一般情况不是不足,而是喂不饱
想提高并行度,拆分支和拆循环是摆着好久的方向
这活扔编译器做不更省心
真能向量化的话编译器直接出SIMD不更好么……LLVM IR也有向量指令
引用第67楼IOSYS于2013-05-17 15:34发表的  :

但是你想在硬件上拆分支,很难做到,除非是在预测上做文章。而且这和“逆超线程”也不是一回事啊。
我没理解错的话,逆超线程就是用2个核心跑一个线程对吧/
我的理解就是HT马甲弄个四射模块集火一个核心的执行单元
指令级并行都折腾几十年了还能玩出花不成……
回复

使用道具 举报

发表于 2013-5-17 15:46 | 显示全部楼层
引用第60楼xtl150ok于2013-05-17 15:08发表的  :
15瓦和17瓦,反映到win8本的续航上能多坚持多久?我硬件不懂,看起来没减低很多啊。。。
能凉快一点是一点
续航方面堆大容量锂聚合物电池更靠谱
回复

使用道具 举报

     
发表于 2013-5-17 15:46 | 显示全部楼层
引用第65楼IOSYS于2013-05-17 15:23发表的  :

完全不一样的,推土机的架构某种角度说,和intel的是走的完全相反的道路

首先,宽流水线有个大问题是浪费严重,就是传说中的流水线气泡,毕竟不是每次前端都能拆出4个指令喂饱流水线的,大多数情况4个执行管线总有空余,所以就需要超线程,就是2个前端共享下面的执行单元,比如前端A拆出了2个指令,下面4条管线2条空着的,那就用前端B拆出来的2条质量去填满。所以宽流水线和HT是相辅相成的,另外说句题外话,这方面的技术IBM要更牛一点,他们实现了4路SMT,intel只有2路

.......

HT也只有一个解码器,没有所谓的2前端,并行发生在解完的微码队列中。


推土机也不是窄管线,它1个模块一共有12个执行端。
推土机的理念就是把指令的微码拆得更RISC,把每个执行端的功能更单一化。
回复

使用道具 举报

     
发表于 2013-5-17 15:50 | 显示全部楼层
引用第68楼鸡蛋灌饼于2013-05-17 15:39发表的  :
这活扔编译器做不更省心
真能向量化的话编译器直接出SIMD不更好么……LLVM IR也有向量指令
编译器本来就可以做指令对齐避免冲突

但也不妨碍硬件搞乱序执行呀

更不用说,编译器如何拆分支?
回复

使用道具 举报

头像被屏蔽
发表于 2013-5-17 15:51 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
发表于 2013-5-17 15:53 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2013-5-17 15:58 | 显示全部楼层
引用第71楼卖哥于2013-05-17 15:50发表的  :

编译器本来就可以做指令对齐避免冲突

但也不妨碍硬件搞乱序执行呀

更不用说,编译器如何拆分支?
乱序和超标量互为表里,超标量这活编译器总干不成吧
另外我没看懂你那拆分支是什么意思
引用第72楼IOSYS于2013-05-17 15:51发表的  :

这不就和intel的架构一模一样了嘛。。。。。。。。。。。只不过把“核”改名叫了“模块”
摊手,我说了指令集并行玩了那么多年很难玩出花了
反正推土机补丁打上后Windows也只认4C8T
回复

使用道具 举报

发表于 2013-5-17 15:59 | 显示全部楼层
还有这不对啊,标题在轮Haswell怎么现在又开始轮农企了

太坑爹了,退票!
回复

使用道具 举报

头像被屏蔽
发表于 2013-5-17 16:02 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2013-5-17 16:04 | 显示全部楼层
引用第74楼鸡蛋灌饼于2013-05-17 15:58发表的  :

乱序和超标量互为表里,超标量这活编译器总干不成吧
另外我没看懂你那拆分支是什么意思
正是超标量才让编译器不再是纯当翻译完事,编译器可以做指令对齐来避免冲突提高性能,而乱序执行最初实现同样是这个功能。

拆分支就是投机超线程,分支两边同时做。
回复

使用道具 举报

发表于 2013-5-17 16:04 | 显示全部楼层
引用第60楼xtl150ok于2013-05-17 15:08发表的  :
15瓦和17瓦,反映到win8本的续航上能多坚持多久?我硬件不懂,看起来没减低很多啊。。。

tdp并不是说实际执行时候系统(这里是cpu)的所耗费的功率,而是说是设计符合功率的散热可以压得住。
这里的意思就是 设计目标功耗为15w的散热系统可以用在haswell上,相应来说10w的就不行。

时间很久有点忘记了,如果说错请指正。
回复

使用道具 举报

头像被屏蔽
发表于 2013-5-17 16:06 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2013-5-17 16:10 | 显示全部楼层
引用第77楼卖哥于2013-05-17 16:04发表的  :

正是超标量才让编译器不再是纯当翻译完事,编译器可以做指令对齐来避免冲突提高性能,而乱序执行最初实现同样是这个功能。

拆分支就是投机超线程,分支两边同时做。
乱序的基础在于超标量流水线(至少,最自然的方案是这样),没有超标量流水线怎么乱序执行指令
所以我说两者互为表里。
而指令调度这事只需要流水线CPU(又想起体系结构的作业了,每次都靠蒙

另外投机这事对于90%+的分支预测命中率来说是不是太费了点啊……
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-9-11 19:07 , Processed in 0.351040 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表