wangh 发表于 2015-10-15 10:25

貌似skylake已经是指令5发射了

怪不得之前intel的人把skylake比作扣肉,只看前端的话确实这些年来比较大的改进了
http://ww1.sinaimg.cn/mw690/56f4767bgw1ewzw1mjok6j20m80vkag2.jpg
http://ww4.sinaimg.cn/mw690/56f4767bgw1ewzw1nafd3j20m80jvgp5.jpg

johnie 发表于 2015-10-15 11:22

auraria 发表于 2015-10-15 11:29

前端再次加宽了,只是有没有那么多车跑上去还是要程序员和编译器努力了

liwangli1983 发表于 2015-10-15 11:57

i5 3550用了三年了,没感觉慢……看来这次还能再用好久

66666 发表于 2015-10-15 12:14

卖哥 发表于 2015-10-15 12:37

66666 发表于 2015-10-15 12:14
单线程内无相关可并发标量指令能有多少?这不是3D计算,又不是说你路扩大了,能跑的车子就一定会多。

CP ...

升工艺坐等提频率的时代早结束了,靠分流水线级数提频率的办法同样是提升并行性,和扩路遇到的问题一样。

auraria 发表于 2015-10-15 12:53

66666 发表于 2015-10-15 12:14
单线程内无相关可并发标量指令能有多少?这不是3D计算,又不是说你路扩大了,能跑的车子就一定会多。

CP ...

另一个思路就是一个线程用不完那就多塞点线程进去咯
Core执行端太宽利用率低下于是在Nehalem重新启用HT来喂饱后端,现在前端也加宽了,HT估计会有点帮助呗

IOSYS 发表于 2015-10-15 13:00

eva02eva02 发表于 2015-10-15 13:11

速速提升频率才是正道,受到这个宇宙的限制,多线程意义不大的

卖哥 发表于 2015-10-15 13:18

auraria 发表于 2015-10-15 12:53
另一个思路就是一个线程用不完那就多塞点线程进去咯
Core执行端太宽利用率低下于是在Nehalem重新启 ...

这不就是Power8么,单核多线程性能是单核单线程性能的250%。

osk666 发表于 2015-10-15 13:24

塔奇克马 发表于 2015-10-15 13:30

实际效果不还是那么回事....

66666 发表于 2015-10-15 14:31

johnie 发表于 2015-10-15 14:49

sirlion 发表于 2015-10-15 15:01

超频越来越烂也和cpu不再使用纤焊材料改普通硅脂有关吧

Sheny 发表于 2015-10-15 15:09

johnie 发表于 2015-10-15 14:49
不是没有提高 而是实际降低了 民用来说2600/2700k随便挑一颗都能稳4.8 只要不是太烂的都能5g日常用 散热 ...

换过材料吧

badchris 发表于 2015-10-15 15:12

还“这几年半导体企业发生了什么”,Dark Silicon假说早就提出来了,所以Intel要加大GPU部分搞OpenCL,农企要走HSA,老黄要搞Echelon但估计要夭折,水果要狂堆SRAM。除非明天就所有程序都能异构计算,否则频率极限这点依旧没鸟用

auraria 发表于 2015-10-15 16:37

sirlion 发表于 2015-10-15 15:01
超频越来越烂也和cpu不再使用纤焊材料改普通硅脂有关吧

这个只是DIYer安慰自己的说法而已
就算开了盖也不见现在的U比32nm SnB好超
要冲高频只能找GF/IBM的SOI工艺

anguy 发表于 2015-10-15 17:25

FinFET天生散热问题定然频率上不去。
你们要高频,要GF搞28nm+SOI就是,问题钱谁出。

wangh 发表于 2015-10-15 17:44

卖哥 发表于 2015-10-15 13:18
这不就是Power8么,单核多线程性能是单核单线程性能的250%。

都是一个思路,走大核心的线路
不过IBM的是专为服务器造,优先考虑总体吞吐量,power8已经都8个线程了
而intel的则还是以单线程为重

wangh 发表于 2015-10-15 17:52

66666 发表于 2015-10-15 14:31
所以我三年前就说过了,intel单线程性能挤牙膏并不是它不想提升,而是它已经做不到。

看看32nm到14nm,风 ...

学术界很早就给单线程的IPC判死刑了,还能够每代5-10%的坚持了这么多代,已经是工程上的奇迹了

yuxiao 发表于 2015-10-15 17:58

卖哥 发表于 2015-10-15 13:18
这不就是Power8么,单核多线程性能是单核单线程性能的250%。

我们多个测试已经证明了power 8相对于powerq6/7的性能提升是巨大的,看来这条路还是对的?

mimighost 发表于 2015-10-15 18:38

看不懂

现在CPU Bound的应用基本都想法设法往GPU上面迁了,剩下的都走分布式了,CPU这点儿挤牙膏感觉有点儿杯水车薪。

卖哥 发表于 2015-10-15 19:29

yuxiao 发表于 2015-10-15 17:58
我们多个测试已经证明了power 8相对于powerq6/7的性能提升是巨大的,看来这条路还是对的? ...

问题是,如果主要提升的是多线程性能,那么用多核心实现也是一样的呀。

john 发表于 2015-10-15 19:37

然并卵,我跟你们说,11月30号以前千万别买Skylake,30号后也要看脸,参见IP6S,当然可能没那么大区别,点到为止

卖哥 发表于 2015-10-15 19:51

john 发表于 2015-10-15 19:37
然并卵,我跟你们说,11月30号以前千万别买Skylake,30号后也要看脸,参见IP6S,当然可能没那么大区别,点 ...

步进有bug?

阳炎n1 发表于 2015-10-15 19:58

yuxiao 发表于 2015-10-15 22:58

卖哥 发表于 2015-10-15 19:29
问题是,如果主要提升的是多线程性能,那么用多核心实现也是一样的呀。 ...

核心也多了呀,等于是双管齐下了

卖哥 发表于 2015-10-15 23:04

yuxiao 发表于 2015-10-15 22:58
核心也多了呀,等于是双管齐下了

更小的核心可以塞更多。
Power8有Power7 4倍的晶体管,才1.5倍的核心数和2.5倍的性能。

wangh 发表于 2015-10-16 00:15

卖哥 发表于 2015-10-15 19:29
问题是,如果主要提升的是多线程性能,那么用多核心实现也是一样的呀。 ...

堆小核心的很多啊,SPARC那个啥玩意,还有arm和atom的服务器版。走大核心的肯定是单线程和多线程的性能都要兼顾的

zatsuza 发表于 2015-10-16 00:23

ia64提升最大,然而业界完全跟不上,市场彻底失败

卖哥 发表于 2015-10-16 00:57

wangh 发表于 2015-10-16 00:15
堆小核心的很多啊,SPARC那个啥玩意,还有arm和atom的服务器版。走大核心的肯定是单线程和多线程的性能都 ...

现在那点面积,完全可以堆20个以上一般的强核心了。
而且Power8巨大的核心,也不见得有比更小的强核心拥有更强的单线程性能,主要性能还是靠多线程堆出来的。

Lilya 发表于 2015-10-16 06:43

perfaceNext 发表于 2015-10-16 08:39

当年我记得看过一篇文章说intel要推冷热核的,这么多年过去了,这个玩意还没出来啊

perfaceNext 发表于 2015-10-16 08:40

当年我记得看过一篇文章说intel要推冷热核的,这么多年过去了,这个玩意还没出来啊

perfaceNext 发表于 2015-10-16 08:41

当年我记得看过一篇文章说intel要推冷热核的,这么多年过去了,这个玩意还没出来啊

66666 发表于 2015-10-16 08:51

perfaceNext 发表于 2015-10-16 09:02

66666 发表于 2015-10-16 08:51 实际已经被GPGPU实现了,短流水线级数CPU(热核)+超长流水线GPU(冷核)

原来如此,总觉得没之前设想的强。

卖哥 发表于 2015-10-16 12:10

66666 发表于 2015-10-16 08:51
实际已经被GPGPU实现了,短流水线级数CPU(热核)+超长流水线GPU(冷核)

完全不是一回事,冷热核是纯risc化的核心加兼容核心。
英特尔当年觉得X86总是要抛弃掉的,区别只是怎么过渡。

Lilya 发表于 2015-10-16 15:31

卖哥 发表于 2015-10-16 00:57
现在那点面积,完全可以堆20个以上一般的强核心了。
而且Power8巨大的核心,也不见得有比更小的强核心拥 ...

堆是没啥问题,像Haswell这样把单线程玩到极致的大核Intel也能一个CPU里头塞18个进去
最大的限制是功耗,Xeon E5-2699v3的Haswell一个核心跑2.3G功耗就超过5W,18个一起跑加上SA、IMC等部件已经达到145W的TDP上限了,而Silvermont一个核心跑2.4G也不过1.5W,Xeon Phi可以堆上70个这样的小核,在拼多线程(尤其是Linpack这类高并行的浮点运算)的环境显然堆更多小核更划算。
页: [1] 2
查看完整版本: 貌似skylake已经是指令5发射了