貌似skylake已经是指令5发射了

wangh 发表于 2015-10-15 10:25

怪不得之前intel的人把skylake比作扣肉，只看前端的话确实这些年来比较大的改进了
http://ww1.sinaimg.cn/mw690/56f4767bgw1ewzw1mjok6j20m80vkag2.jpg
http://ww4.sinaimg.cn/mw690/56f4767bgw1ewzw1nafd3j20m80jvgp5.jpg

johnie 发表于 2015-10-15 11:22

auraria 发表于 2015-10-15 11:29

前端再次加宽了，只是有没有那么多车跑上去还是要程序员和编译器努力了

liwangli1983 发表于 2015-10-15 11:57

i5 3550用了三年了，没感觉慢……看来这次还能再用好久

66666 发表于 2015-10-15 12:14

卖哥发表于 2015-10-15 12:37

66666 发表于 2015-10-15 12:14
单线程内无相关可并发标量指令能有多少？这不是3D计算，又不是说你路扩大了，能跑的车子就一定会多。

CP ...

升工艺坐等提频率的时代早结束了，靠分流水线级数提频率的办法同样是提升并行性，和扩路遇到的问题一样。

auraria 发表于 2015-10-15 12:53

66666 发表于 2015-10-15 12:14
单线程内无相关可并发标量指令能有多少？这不是3D计算，又不是说你路扩大了，能跑的车子就一定会多。

CP ...

另一个思路就是一个线程用不完那就多塞点线程进去咯
Core执行端太宽利用率低下于是在Nehalem重新启用HT来喂饱后端，现在前端也加宽了，HT估计会有点帮助呗

IOSYS 发表于 2015-10-15 13:00

eva02eva02 发表于 2015-10-15 13:11

速速提升频率才是正道，受到这个宇宙的限制，多线程意义不大的

卖哥发表于 2015-10-15 13:18

auraria 发表于 2015-10-15 12:53
另一个思路就是一个线程用不完那就多塞点线程进去咯
Core执行端太宽利用率低下于是在Nehalem重新启 ...

这不就是Power8么，单核多线程性能是单核单线程性能的250%。

osk666 发表于 2015-10-15 13:24

塔奇克马 发表于 2015-10-15 13:30

实际效果不还是那么回事....

66666 发表于 2015-10-15 14:31

johnie 发表于 2015-10-15 14:49

sirlion 发表于 2015-10-15 15:01

超频越来越烂也和cpu不再使用纤焊材料改普通硅脂有关吧

Sheny 发表于 2015-10-15 15:09

johnie 发表于 2015-10-15 14:49
不是没有提高而是实际降低了民用来说2600/2700k随便挑一颗都能稳4.8 只要不是太烂的都能5g日常用散热 ...

换过材料吧

badchris 发表于 2015-10-15 15:12

还“这几年半导体企业发生了什么”，Dark Silicon假说早就提出来了，所以Intel要加大GPU部分搞OpenCL，农企要走HSA，老黄要搞Echelon但估计要夭折，水果要狂堆SRAM。除非明天就所有程序都能异构计算，否则频率极限这点依旧没鸟用

auraria 发表于 2015-10-15 16:37

sirlion 发表于 2015-10-15 15:01
超频越来越烂也和cpu不再使用纤焊材料改普通硅脂有关吧

这个只是DIYer安慰自己的说法而已
就算开了盖也不见现在的U比32nm SnB好超
要冲高频只能找GF/IBM的SOI工艺

anguy 发表于 2015-10-15 17:25

FinFET天生散热问题定然频率上不去。
你们要高频，要GF搞28nm+SOI就是，问题钱谁出。

wangh 发表于 2015-10-15 17:44

卖哥发表于 2015-10-15 13:18
这不就是Power8么，单核多线程性能是单核单线程性能的250%。

都是一个思路，走大核心的线路
不过IBM的是专为服务器造，优先考虑总体吞吐量，power8已经都8个线程了
而intel的则还是以单线程为重

wangh 发表于 2015-10-15 17:52

66666 发表于 2015-10-15 14:31
所以我三年前就说过了，intel单线程性能挤牙膏并不是它不想提升，而是它已经做不到。

看看32nm到14nm，风 ...

学术界很早就给单线程的IPC判死刑了，还能够每代5-10%的坚持了这么多代，已经是工程上的奇迹了

yuxiao 发表于 2015-10-15 17:58

卖哥发表于 2015-10-15 13:18
这不就是Power8么，单核多线程性能是单核单线程性能的250%。

我们多个测试已经证明了power 8相对于powerq6/7的性能提升是巨大的，看来这条路还是对的？

mimighost 发表于 2015-10-15 18:38

看不懂

现在CPU Bound的应用基本都想法设法往GPU上面迁了，剩下的都走分布式了，CPU这点儿挤牙膏感觉有点儿杯水车薪。

卖哥发表于 2015-10-15 19:29

yuxiao 发表于 2015-10-15 17:58
我们多个测试已经证明了power 8相对于powerq6/7的性能提升是巨大的，看来这条路还是对的？ ...

问题是，如果主要提升的是多线程性能，那么用多核心实现也是一样的呀。

john 发表于 2015-10-15 19:37

然并卵，我跟你们说，11月30号以前千万别买Skylake，30号后也要看脸，参见IP6S，当然可能没那么大区别，点到为止

卖哥发表于 2015-10-15 19:51

john 发表于 2015-10-15 19:37
然并卵，我跟你们说，11月30号以前千万别买Skylake，30号后也要看脸，参见IP6S，当然可能没那么大区别，点 ...

步进有bug？

阳炎n1 发表于 2015-10-15 19:58

yuxiao 发表于 2015-10-15 22:58

卖哥发表于 2015-10-15 19:29
问题是，如果主要提升的是多线程性能，那么用多核心实现也是一样的呀。 ...

核心也多了呀，等于是双管齐下了

卖哥发表于 2015-10-15 23:04

yuxiao 发表于 2015-10-15 22:58
核心也多了呀，等于是双管齐下了

更小的核心可以塞更多。
Power8有Power7 4倍的晶体管，才1.5倍的核心数和2.5倍的性能。

wangh 发表于 2015-10-16 00:15

卖哥发表于 2015-10-15 19:29
问题是，如果主要提升的是多线程性能，那么用多核心实现也是一样的呀。 ...

堆小核心的很多啊，SPARC那个啥玩意，还有arm和atom的服务器版。走大核心的肯定是单线程和多线程的性能都要兼顾的

zatsuza 发表于 2015-10-16 00:23

ia64提升最大，然而业界完全跟不上，市场彻底失败

卖哥发表于 2015-10-16 00:57

wangh 发表于 2015-10-16 00:15
堆小核心的很多啊，SPARC那个啥玩意，还有arm和atom的服务器版。走大核心的肯定是单线程和多线程的性能都 ...

现在那点面积，完全可以堆20个以上一般的强核心了。
而且Power8巨大的核心，也不见得有比更小的强核心拥有更强的单线程性能，主要性能还是靠多线程堆出来的。

Lilya 发表于 2015-10-16 06:43

perfaceNext 发表于 2015-10-16 08:39

当年我记得看过一篇文章说intel要推冷热核的，这么多年过去了，这个玩意还没出来啊

perfaceNext 发表于 2015-10-16 08:40

当年我记得看过一篇文章说intel要推冷热核的，这么多年过去了，这个玩意还没出来啊

perfaceNext 发表于 2015-10-16 08:41

当年我记得看过一篇文章说intel要推冷热核的，这么多年过去了，这个玩意还没出来啊

66666 发表于 2015-10-16 08:51

perfaceNext 发表于 2015-10-16 09:02

66666 发表于 2015-10-16 08:51 实际已经被GPGPU实现了，短流水线级数CPU（热核）+超长流水线GPU（冷核）

原来如此，总觉得没之前设想的强。

卖哥发表于 2015-10-16 12:10

66666 发表于 2015-10-16 08:51
实际已经被GPGPU实现了，短流水线级数CPU（热核）+超长流水线GPU（冷核）

完全不是一回事，冷热核是纯risc化的核心加兼容核心。
英特尔当年觉得X86总是要抛弃掉的，区别只是怎么过渡。

Lilya 发表于 2015-10-16 15:31

卖哥发表于 2015-10-16 00:57
现在那点面积，完全可以堆20个以上一般的强核心了。
而且Power8巨大的核心，也不见得有比更小的强核心拥 ...

堆是没啥问题，像Haswell这样把单线程玩到极致的大核Intel也能一个CPU里头塞18个进去
最大的限制是功耗，Xeon E5-2699v3的Haswell一个核心跑2.3G功耗就超过5W，18个一起跑加上SA、IMC等部件已经达到145W的TDP上限了，而Silvermont一个核心跑2.4G也不过1.5W，Xeon Phi可以堆上70个这样的小核，在拼多线程（尤其是Linpack这类高并行的浮点运算）的环境显然堆更多小核更划算。

页: [1] 2

Stage1st's Archiver

貌似skylake已经是指令5发射了