wl5993
发表于 2015-4-25 13:38
比产品性能还好说,单纯比架构性能谈多线程是不是无聊了点,无脑堆核心而已,Atom堆到16核心一样多线程性能很可观
johnie
发表于 2015-4-25 13:49
鸡蛋灌饼
发表于 2015-4-25 13:49
wl5993 发表于 2015-4-25 13:38
比产品性能还好说,单纯比架构性能谈多线程是不是无聊了点,无脑堆核心而已,Atom堆到16核心一样多线程性能 ...
话又说回来,如果农企能像Xeon Phi一样用打桩机架构堆出72核那也不是没有竞争力。
outel
发表于 2015-4-25 13:49
wl5993 发表于 2015-4-25 13:38
比产品性能还好说,单纯比架构性能谈多线程是不是无聊了点,无脑堆核心而已,Atom堆到16核心一样多线程性能 ...
16核的悲催多线程也干不过i7
wl5993
发表于 2015-4-25 13:53
outel 发表于 2015-4-25 13:49
16核的悲催多线程也干不过i7
看频率,16蛋3G阿童木打2.0GHaswell一样可以赢
上面说的农企现在多线程不弱无非也就是这么干的,堆蛋和彪频率
Lilya
发表于 2015-4-25 13:59
鸡蛋灌饼 发表于 2015-4-25 13:49
话又说回来,如果农企能像Xeon Phi一样用打桩机架构堆出72核那也不是没有竞争力。 ...
农企堆核心有GCN啊
无印凉粉
发表于 2015-4-25 14:02
wl5993
发表于 2015-4-25 14:05
鸡蛋灌饼 发表于 2015-4-25 13:49
话又说回来,如果农企能像Xeon Phi一样用打桩机架构堆出72核那也不是没有竞争力。 ...
打桩机浮点太弱吧,要是堆成Phi的话要把浮点和整数的配置反过来
Lilya
发表于 2015-4-25 14:15
wl5993 发表于 2015-4-25 14:05
打桩机浮点太弱吧,要是堆成Phi的话要把浮点和整数的配置反过来
农企的农机系列的浮点本来是要靠HSA由GCN堆上去的,所以农机本身的浮点单元少而整数单元多
wl5993
发表于 2015-4-25 14:27
Lilya 发表于 2015-4-25 14:15
农企的农机系列的浮点本来是要靠HSA由GCN堆上去的,所以农机本身的浮点单元少而整数单元多 ...
所以说要是拿打桩机做Phi要把FP和Int配置反一下
kerorokun
发表于 2015-4-25 14:39
那我可以期待skylake-e超过我920 100%了咯
----发送自 Sony C6903,Android 4.4.4
KOGmk2
发表于 2015-4-25 14:47
无印凉粉 发表于 2015-4-25 14:02
你们就跟我明盘一下3770k还能战几年吧
估计能撑到2017吧
白驼山西毒
发表于 2015-4-25 14:59
KOGmk2 发表于 2015-4-25 14:47
估计能撑到2017吧
那么 4570能到2017吗?
vorastrix
发表于 2015-4-25 15:00
KOGmk2
发表于 2015-4-25 15:28
本帖最后由 KOGmk2 于 2015-4-25 15:31 编辑
白驼山西毒 发表于 2015-4-25 14:59
那么 4570能到2017吗?
4570压力不小.......3770K起码能四倍频福利拉到4.1G,稍微超一下4.4G和玩差不多,4570我估计能撑到2016年中,很可能2016年初你就想换了,当然如果你所用的程序要求不高那估计也能撑到2017
6119w
发表于 2015-4-25 15:46
有没有跟2500K@4.5 比较的测试?
鸡蛋灌饼
发表于 2015-4-25 15:56
wl5993 发表于 2015-4-25 14:27
所以说要是拿打桩机做Phi要把FP和Int配置反一下
反一下就不如直接上GCN了
本来直接堆CPU核心就是因为看不上GPU核心那菜的一比的分支乱序能力,你砍Int不是本末倒置了么。
鸡蛋灌饼
发表于 2015-4-25 16:00
Lilya 发表于 2015-4-25 14:15
农企的农机系列的浮点本来是要靠HSA由GCN堆上去的,所以农机本身的浮点单元少而整数单元多 ...
HSA在并购后几年内能搞定还有的玩。现在都九年了amdkfd才刚进内核,编译器和runtime支持都遥遥无期,怎么看都是已经成仁的节奏啊。
燕市徒
发表于 2015-4-25 16:12
Lilya
发表于 2015-4-25 17:09
wl5993 发表于 2015-4-25 14:27
所以说要是拿打桩机做Phi要把FP和Int配置反一下
农企有理论浮点性能第一的GCN,堆浮点又何必折腾农机
Lilya
发表于 2015-4-25 17:10
鸡蛋灌饼 发表于 2015-4-25 16:00
HSA在并购后几年内能搞定还有的玩。现在都九年了amdkfd才刚进内核,编译器和runtime支持都遥遥无期,怎么 ...
Intel、黄老板和IBM都不进场,单靠AMD和ARM显然很难成事
卖哥
发表于 2015-4-25 17:19
鸡蛋灌饼 发表于 2015-4-25 16:00
HSA在并购后几年内能搞定还有的玩。现在都九年了amdkfd才刚进内核,编译器和runtime支持都遥遥无期,怎么 ...
我觉得进展其实很快了,再快就和强推IA64没啥区别。
卖哥
发表于 2015-4-25 17:26
Lilya 发表于 2015-4-25 17:10
Intel、黄老板和IBM都不进场,单靠AMD和ARM显然很难成事
如果HSA的一些设计比如hUMA、hQ真是必经之路,那成事的机会还是很大的。
到时候别人要么加入,要么强行绕过付出巨大代价。
当然,我说的是HSA不是小aa,小aa没准在成事之前就倒闭了,然后核弹黄作为前雇员继承遗愿什么的。
鸡蛋灌饼
发表于 2015-4-25 17:43
卖哥 发表于 2015-4-25 17:19
我觉得进展其实很快了,再快就和强推IA64没啥区别。
r600到GCN之间的时间你都可以认为是白瞎了。
农企在GCN之前都根本没有块针对计算设计过的GPU,这片市场算是拱手让给NVIDIA了。
鸡蛋灌饼
发表于 2015-4-25 17:48
Lilya 发表于 2015-4-25 17:10
Intel、黄老板和IBM都不进场,单靠AMD和ARM显然很难成事
Intel实质上已经在场里了,就软件根基,开发人员数量,以及硬件特性上来看基本不比AMD差多少。
就是GPU性能被自家的Xeon Phi碾压推都不好意思推而已
wl5993
发表于 2015-4-25 17:54
鸡蛋灌饼 发表于 2015-4-25 15:56
反一下就不如直接上GCN了
本来直接堆CPU核心就是因为看不上GPU核心那菜的一比的分支乱序能力,你砍Int不是 ...
本来phi那个东西就是主要用浮点,农企那农具就是int过剩fp不足,要是做成phi一样的东西当然要改int和fp比例,不然不就是个服务器cpu集群的玩意了,至于CGN,这话题的前提不是x86做成计算卡么
wl5993
发表于 2015-4-25 17:57
Lilya 发表于 2015-4-25 17:09
农企有理论浮点性能第一的GCN,堆浮点又何必折腾农机
所以说,本来说的就是如果堆农具怎么做计算卡,老提CGN干啥,我又不是不知道GCN是干啥用的
卖哥
发表于 2015-4-25 18:07
鸡蛋灌饼 发表于 2015-4-25 17:43
r600到GCN之间的时间你都可以认为是白瞎了。
农企在GCN之前都根本没有块针对计算设计过的GPU,这片市场算 ...
实际上VLIW5架构的通用计算改进一直在进行,GCN只是进步比较大的一代而已。
会说出根本没有,说明你根本不关心相关进展。
HD4000的运算簇存储区,HD5000的可写L1。
foxpat
发表于 2015-4-25 18:09
6700K比4790K提升15% CB跑分
中间隔了一代5700K,那就还是一代7%的挤牙膏而已
Lilya
发表于 2015-4-25 18:29
鸡蛋灌饼 发表于 2015-4-25 17:48
Intel实质上已经在场里了,就软件根基,开发人员数量,以及硬件特性上来看基本不比AMD差多少。
就是GPU性 ...
Larrabee搞出来的话Intel可能就是HSA的主推者(当然是自己的HSA)。
现在Intel要进场就要看Xeon Phi何时变回Larrabee。当然现在Intel的想法似乎是直接把Xeon Phi当CPU用。
Lilya
发表于 2015-4-25 18:31
wl5993 发表于 2015-4-25 17:54
本来phi那个东西就是主要用浮点,农企那农具就是int过剩fp不足,要是做成phi一样的东西当然要改int和fp比 ...
x86做计算卡又没有什么优势。Xeon Phi的fp靠的是AVX指令集。
农企堆fp有GCN,农具自然就不用过于堆fp了。
鸡蛋灌饼
发表于 2015-4-25 19:17
本帖最后由 鸡蛋灌饼 于 2015-4-25 19:28 编辑
卖哥 发表于 2015-4-25 18:07
实际上VLIW5架构的通用计算改进一直在进行,GCN只是进步比较大的一代而已。
会说出根本没有,说明你根本 ...
别搞笑了,一没有虚拟内存二没有多ring支持,三还要加上积重难返的、屎一样的指令集设计VLIW,你跟我说这是个针对计算设计的GPU?
拿什么可写L1说事的就别自爆了好么,AMD官方文档称这个东西为LDS,NVIDIA则叫shared memory。
呵呵在下不才还真的折腾过LLVM后端尝试给r600g加LDS支持。
细节就不说了,我就一句话总结:Evergreen级别的LDS相关设计就是硬件做不好屁股交给编译器擦的典型。
哦对了,再补充一点,按G80的表现来看,CUDA这一步棋黄老版可能提前一两年,甚至更远在GPGPU概念提出的时候就开始准备了。
反观ATI,唉,一声叹息。
鸡蛋灌饼
发表于 2015-4-25 19:20
Lilya 发表于 2015-4-25 18:29
Larrabee搞出来的话Intel可能就是HSA的主推者(当然是自己的HSA)。
现在Intel要进场就要看Xeon Phi何时 ...
Intel肯定不会直接复刻HSA。他们有其他计划
一个是CPU,或者封装上塞FPGA
另一个则是传言,Intel打算加光栅化相关的指令。
鸡蛋灌饼
发表于 2015-4-25 19:25
wl5993 发表于 2015-4-25 17:54
本来phi那个东西就是主要用浮点,农企那农具就是int过剩fp不足,要是做成phi一样的东西当然要改int和fp比 ...
错了,真是主要用浮点其余不问的场景你搞个TESLA比什么都管用。
phi的优势是72个Airmont Atom核心。绝对碾压GPU的单线程性能和并发规模才是其优势所在。
卖哥
发表于 2015-4-25 19:29
鸡蛋灌饼 发表于 2015-4-25 19:20
Intel肯定不会直接复刻HSA。他们有其他计划
一个是CPU,或者封装上塞FPGA
另一个则是传言,Intel打算加光 ...
HSA不是CPU+GPU呀。
内存共享不共享?运算任务独立还是统一管理?
这是大问题上的方向。
当然,英特尔这一方确实可以不管,如果是纯CPU解决方案当然不是异构,不需要考虑什么hUMA、hQ的需求。
但是IBM+NV这个组合显然是绕不过的。
卖哥
发表于 2015-4-25 19:33
鸡蛋灌饼 发表于 2015-4-25 19:17
别搞笑了,一没有虚拟内存二没有多ring支持,三还要加上积重难返的、屎一样的指令集设计VLIW,你跟我说这 ...
比之前的要好不是么,所以一直在改进是没错的呀。
卖哥
发表于 2015-4-25 19:40
鸡蛋灌饼 发表于 2015-4-25 19:25
错了,真是主要用浮点其余不问的场景你搞个TESLA比什么都管用。
phi的优势是72个Airmont Atom核心。绝对 ...
单线程性能什么鬼,追求单线程性能的部分就用主CPU写呀。
说什么交互代价巨大宁可在计算卡上实现,这代价巨大还不是内存独立编址的锅,有hUMA的话递交个指针不就行了。
thegodra
发表于 2015-4-25 19:54
所以什么时候上市?
Radeon
发表于 2015-4-25 20:03
囧囧囧
发表于 2015-4-25 20:05
有时候能不能放下浓浓的爱意及信仰去看事情?