Intel天湖处理器严重问题曝光 ZT
。。。。。。Intel第六代Skylake处理器严重问题曝光:CPU冻结2016-1-12 7:06:00来源:IT之家作者:晨风责编:晨风
IT之家讯 近日,一些德国用户首先发现Intel最新第六代Skylake处理器会在某些条件下发生“冻结”—— 挂起现象,这给他们的工作带来了极大不便。目前Intel已经确认了该问题,而且已经有解决方案。http://img.ithome.com/newsuploadfiles/2016/1/20160112_070452_513.jpg具体来说,这一问题由数学建模程序《Prime95》用户首先发现,原因就是该用户在使用这一程序的过程中发生了该问题。这名用户随即将问题反馈到了一家德国知名硬件网站,然后《Prime95》开发商确认了该问题,并告知Intel。Intel在认同了这一问题后,解释称“……该问题是Skylake处理器的潜在问题,但只会发生在某些特定复杂的负荷条件下,比如运行《Prime95》这种数学运算程序,发生的现象就是可能会导致挂起或其他不可预知的系统行为。”对于大多数普通用户而言,这个问题不会有太大影响,毕竟专业数学软件并不是大众化产品,但数学或科学相关研究人员和机构就应该谨慎对待这次的问题,甚至使用各种跑分软件和压力测试的Skylake处理器电脑也要注意此类问题。目前还未发现其他软件获情况会导致类似问题发生。值得庆幸的是,Intel已经解决了该问题,相关用户只需等待主板OEM厂商发布BIOS固件升级即可。(via:Neowin)
主板BIOS工程师--我真是日了狗了 The bug manifests when a certain calculation is performed. Prime95 uses the fast Fourier transform to multiply very large numbers, and at least one particular exponent—14,942,209—causes Skylake CPUs to choke. Over- or underclocking the CPU doesn't have any effect on whether the bug occurs.
好奇怪BUG是什么原理 4790K还能战多久? 做fft的时候能搞错? 刚好升级BIOS修复BUG又能封杀天湖超频,我感觉英特尔这是故意泄露这个BUG的。当初haswell锁睿频没几个月就让英特尔强推haswell-r逼迫主板厂商升级bios顺便封杀锁睿频,这回天湖让超频的好日子大概马上也是要到头了。 其实这说明intel其实已经拿到zen了?发现性能依然是ppt出来的,于是撤了杀手锏了? 每一代CPU的第一个步进勘误表都是几百页,大部分都被各家主板工程师扛下来了,用户感觉不到而已。单路Xeon一般会比对应的桌面版晚几个月出也是为了让桌面用户先去踩坑。 HyperIris 发表于 2016-1-15 07:58
CPU也是一行一行代码写的,真以为跑通了test case就万无一失啊
----发送自 STAGE1 App for Android. ...
难道不用model checking和theorem proving?! ostcollector 发表于 2016-1-15 08:16
难道不用model checking和theorem proving?!
随着规模越来越大,测试变的非常困难。 lixianfyss 发表于 2016-1-16 06:30
随着规模越来越大,测试变的非常困难。
这两个可以保证的正确性可不是测试能比的啊…… 不懂,代码是储存在cpu什么地方 ostcollector 发表于 2016-1-16 09:22
这两个可以保证的正确性可不是测试能比的啊……
问题是您说的这两个对于intel的桌面处理器就不存在,您要是能搞定,也是业界泰斗。 8aa8aa8aa 发表于 2016-1-16 12:09
不懂,代码是储存在cpu什么地方
是HDL代码。 这个BIOS能修正?你逗我?
----发送自 ZTE ZTE Grand S II LTE,Android 5.1.1 又多了一个让我去买5820K的因素
还记得B2步进冻结问题吗亲 引用第17楼HyperIris于2016-01-16 17:47发表的:
引用:引用第15楼lpc2103于2016-01-16 16:26发表的 :这个BIOS能修正?你......
@HyperIris
你有文化,来讲讲处理器硬件级别的快速个傅立叶算法的bug不通过修改ALU设计和VHDL,不通过重新时间域分析怎么仅仅通过BIOS这个接口级别的东西来修改?要解决这种问题的唯一办法只能是重新设计发布新布进。Intel最喜欢你们这些有“文化”的人了。
----发送自 ZTE ZTE Grand S II LTE,Android 5.1.1 引用第4楼windrarara于2016-01-12 15:27发表的:
做fft的时候能搞错?
@windrarara
计算fft出问题了其实是很严重的事情,说明微结构有问题,和当年MMX的指令错误一样,无解的,只能重新做VHDL或者Verilog电路仿真,电路仿真修改了以后必须要重新生成网表,门级验证也要重新做过,所以最后等下一个步进的版本修正。
----发送自 ZTE ZTE Grand S II LTE,Android 5.1.1 lpc2103 发表于 2016-1-16 21:59
@windrarara
计算fft出问题了其实是很严重的事情,说明微结构有问题,和当年MMX的指令错误一样,无解的, ...
你这ID我用过,LPC的东西还是顶好的, 就是管脚布局太乱了.... 引用第21楼HyperIris于2016-01-16 23:29发表的:
引用:lpc2103 发表于 2016-1-16 21:37@HyperIris你有文化,来讲讲处理......
@HyperIris
呵呵,你还真有脸,Intel的处理器类似FPGA?你真有文化,那是可熔断的还是不可熔断的?什么是微代码,像FPGA一样可烧入?intel的JTAG只支持Atom好不好?任何一个学过计算机组成原理的都知道,FFT计算依赖于内部的ALU单元,JTAG是什么?只是一个能访问芯片内部寄存器和挂在芯片总线上的设备和内置模块,最终是对片子内部的eeprom和flash rom的操作。是给片子特点的功能,而不是给它计算能力。任何一个都和你所谓的这种微代码是不相关的,JTAG调试不能影响FFT计算过程,只能修改结果,可是分支预测又要怎么做?处理器不是FPGA,只有开发过程中的功能模型会把它做成类似FPGA的样子,并不是说最终成品像FPGA,它只是个功能模型。去翻翻berkeley的那本X86原理及接口技术,处理器里面的微代码并不是HDL,而是指令译码器,和你说的是两个东西。HDL代码并不在片子里面,经过了VHDL仿真和行为综合,逻辑综合后类似synopsys这样的EDA工具才生成电路谢谢,VHDL是描述我这个片子的逻辑行为的,不是控制我这个片子的微代码谢谢,你写过哪怕一行HDL代码没有?发布的BIOS代码都只是接口行为的访问逻辑控制更新,计算单元的错误你无能为力谢谢,当年MMX的累加器错误是怎么解决的?靠BIOS更新?这次FFT一样的就是A L U的问题。别自己跳出来让别人打脸,虽然你这几句话就已经充分暴露了你的无知,每一句都是一知半解错的也真不容易。
----发送自 ZTE ZTE Grand S II LTE,Android 5.1.1 引用第23楼windrarara于2016-01-17 00:17发表的:
引用:lpc2103 发表于 2016-1-16 21:59@windrarara计算fft出问题了......
@windrarara
论重量买的片子别要求太多,一个ARM7TDMI教学用的东西要啥自行车。
----发送自 ZTE ZTE Grand S II LTE,Android 5.1.1 引用第21楼HyperIris于2016-01-16 23:29发表的:
引用:lpc2103 发表于 2016-1-16 21:37@HyperIris你有文化,来讲讲处理......
@HyperIris
本人向来是没文化的,但是自打有网以来最喜欢打自誉有文化人的脸。
----发送自 ZTE ZTE Grand S II LTE,Android 5.1.1 本帖最后由 lpc2103 于 2016-1-17 00:45 编辑
引用第22楼HyperIris于2016-01-16 23:58发表的:
另外为了避免无意义的撕逼大战,请看完这段再来战https://en.wikipedia.org/wi......
@HyperIris
你自己贴的东西在打你自己的脸。。。。。你对这个东西的了解只能通过WIKI的语焉不详的不专业解释吗?建议你去看David A. Patterson的computer organization and design The Hardware/software Interface,这是我本科时候的教材。
----发送自 ZTE ZTE Grand S II LTE,Android 5.1.1 通过FPGA来进行8位FFT电路的模型与设计是很多学校相关专业的本科作业,VHDL语言来完成蝶形运算器单元的设计和实现,乘法器,加法器,减法器和控制输出模块,这东西只是仿真,仿真,仿真,重要的事情说三遍,在设计的后期HDL已经被EDA转化成了电路单元!做过的都知道。你这样说Intel的处理器我不知道你到底是在黑还是在捧,FPGA原始逻辑功能模型的效率是非常低的,intel脑抽了才会把一个这样的半成品拿到市面上,这你是在嘲笑工程师能力连本科生都不如吗?还是真的不了解设计流程?
----发送自 ZTE ZTE Grand S II LTE,Android 5.1.1 intel企图通过更新BIOS来解决FFT计算Bug的问题就说明了一点,小AA不给力,缺乏竞争的市场下厂商的节操没有下限,BIOS更新只是修正了输入输出结果,通过BIOS的处理器接口利用主板自身的CPLD来控制和限制了CPU计算FFT时的逻辑行为,你们就以为问题解决了?不不不,运算器和指令译码器(也就是某些人说的微代码)问题还是存在的,只是看上去好像被解决了一样。当年intel也出过类似的问题,不过是浮点和整数运算的问题,可那时小AA给力,解决办法是召回,当年Z87南桥问题,解决办法也不是BIOS更新就能做到的,这是物理级别的电路逻辑问题,不是什么代码问题。不要被Intel骗了,在Intel没有出天湖处理器的新步进的情况下,还是考虑X99吧,这是一个曾经的阿尔卡特朗讯ASIC设计部门人员的忠告,你既然花了钱,就不要买有瑕疵和缺陷的产品,对自己好点。
----发送自 ZTE ZTE Grand S II LTE,Android 5.1.1 prime95的FFT计算问题,本来FFT计算是非常经典的问题。多半就是解算奇偶序列和的时候乘法器陷入了死循环,把计算结果输出到寄存器上发生了溢出阻塞了中断的通道然后就死机了,这个解决办法坑定是设定了一个门限值,超过这个值就刷新特定地址段的寄存器,所以问题根本没解决。我和大家可以打个赌,同样的输入参数下用其它平台算出来FFT的结果和intel所谓通过BIOS更新后的结果差别很大,所以问题还是没解决。
----发送自 ZTE ZTE Grand S II LTE,Android 5.1.1 感谢业内解读。那I厂还有可能良心发现为天湖更新步进嘛?
----发送自 Meizu M353,Android 4.4.4 lpc2103 发表于 2016-1-17 02:21
prime95的FFT计算问题,本来FFT计算是非常经典的问题。多半就是解算奇偶序列和的时候乘法器陷入了死循环, ...
看你那么激动,很怀疑你到底有没有仔细看原文。且不说intel会不会在家用级CPU里面设计FFT硬核,就算设计了,你觉得intel会搞出来一个指数位支持到一千万的乘法器?我没用过prime95来烧CPU,不过我猜,作者应该是用了一套自定义的大数格式,这样在超大数计算的时候数据溢出应该是很自然的事——说不定在这个计算过程中根本就没用到intel自己的乘法器。 lpc2103 发表于 2016-1-17 02:21
prime95的FFT计算问题,本来FFT计算是非常经典的问题。多半就是解算奇偶序列和的时候乘法器陷入了死循环, ...
看你那么激动,很怀疑你到底有没有仔细看原文。且不说intel会不会在家用级CPU里面设计FFT硬核,就算设计了,你觉得intel会搞出来一个指数位支持到一千万的乘法器?我没用过prime95来烧CPU,不过我猜,作者应该是用了一套自定义的大数格式,这样在超大数计算的时候数据溢出应该是很自然的事——说不定在这个计算过程中根本就没用到intel自己的乘法器。 引用第33楼1号黑球于2016-01-17 23:48发表的:
引用:lpc2103 发表于 2016-1-17 02:21prime95的FFT计算问题,本来FF......
@1号黑球
FFT在通用处理器中不需要特定的电路,根据FFT算法的原理,只要能够同时调用乘法器,加法器,减法器形成一个逻辑上的蝶形电路就可以了,并不需要专门的FF T电路,因为这是通用处理器,不是ASIC,在这个计算中如果不用处理器自己的乘法器,那么谁来提供这个计算资源?我并没有激动,只是被某些向知乎上那样啥也不懂还喜欢装X的人给搞得哭笑不得。
----发送自 ZTE ZTE Grand S II LTE,Android 5.1.1 lpc2103 发表于 2016-1-17 01:53
intel企图通过更新BIOS来解决FFT计算Bug的问题就说明了一点,小AA不给力,缺乏竞争的市场下厂商的节操没有 ...
巨巨在电子群里么? 本帖最后由 real_zyf 于 2016-1-18 13:48 编辑
那啥,就一句话“从Pentium Pro起,INTEL决定给CPU留出一个补丁接口,当CPU内部有缺陷的时候,通过加载微码(Microcode),可以修复CPU的部分缺陷。”
现在的cpu已经不是教科书上的理论上的那个样子了。
然后我顺便翻了一下这次这个bug的详情,这bug要指定用avx而不是avx2才能触发,那么大概不是什么乘法器的锅
引用第36楼real_zyf于2016-01-18 13:42发表的:
本帖最后由 real_zyf 于 2016-1-18 13:48 编辑 那啥,就一句话“从Penti......
@real_zyf
这个微码我前面已经解释了和你们想象的不是一个东西,是I留下的一个调测口,而而只支持Atom,HDL这样描述电路逻辑功能和运算的代码并不存在于成品的芯片中,生成网表后经过RTL验证已经EDA工具被转换综合成了物理电路。另外Avx只是加强浮点和向量运算的指令集,同时也涉及了寄存器的访问规则,avx2的寄存器访问规则和avx是不一样的,有可能就避开了溢出的地址段,所以给运算器甩不了锅啊,不能把锅背到指令集身上。
----发送自 ZTE ZTE Grand S II LTE,Android 5.1.1 lpc2103 发表于 2016-1-18 14:06
@real_zyf
这个微码我前面已经解释了和你们想象的不是一个东西,是I留下的一个调测口,而而只支持Atom,HD ...
你到底有没有看那个关于微代码的wiki........
现在很多处理的机器指令与相关电路中间是隔了一层类似解析器一样的东西的,而intel的这个解析器是可写的(见Writable_control_store 那一段),允许在这个层面做改动来修正bug,方法就是开机的时候让bios塞一段代码,这事从奔腾pro年代就开始干了。 引用第38楼real_zyf于2016-01-18 14:14发表的:
引用:lpc2103 发表于 2016-1-18 14:06@real_zyf这个微码我前面已经解释......
@real_zyf
我看了啊,说的很笼统,相当于什么都没说啊。所以我说你们没看我前面的发言嘛。这个微码的能力是有限的,功能和运算这一级别的能力是纯粹脑补出来的。
----发送自 ZTE ZTE Grand S II LTE,Android 5.1.1