acalephs 发表于 2024-7-21 01:40

铜、电迁移、氮化钽、氧化与CPU出错

芯片内部晶体管之间需要使用导线互相连接才能工作,最初半导体使用的是铝线作为互连线。铝价格便宜工艺简单,但有一个致命的问题就是电阻率略高。随着半导体的快速发展,互连线越来越细,铝互连线的高电阻逐渐成为了瓶颈,于是就需要一种电阻率更低材料来代替铝。那么哪种材料电阻率最低呢?是银和铜。银价格昂贵,性质又不活泼,导致银的生长工艺非常复杂。于是相对便宜又活泼的铜就成了自然的选择。可是铜作为芯片内互连线依然有个问题,那就是它有那么点太活泼了。当芯片工作的时候,导线上会存在电场,而铜的活泼特性导致它在被电离之后会随着电场飘走,导致导线变细电阻变大,这就是困扰铜互连的电迁移问题。雪上加霜的是铜和绝缘层之间没有办法形成稳定的过度晶格,也就是说铜导线和绝缘层之间并没有稳定的界面。这会导致活蹦乱跳的铜甚至能直接扩散到二氧化硅里去。为了解决这个问题,工程师需要一种材料,它既能和绝缘层形成稳定的共价键,又能和铜形成稳定界面。这样它就能作为铜和绝缘层之间的中间层,方便铜薄膜的生长的同时并有效地“拉住”铜原子让它们不要乱跑,来缓解电迁移。而且这种材料也要作为导线的一部分参与导电,所以它的电阻率不能太高。最后被选中的材料就是氮化钽。现今半导体生长薄膜多采用CVD(化学气相淀积)工艺,就是让气体在晶圆表面发生化学反应,生成出固态产物并淀积在晶圆上,氮化钽也是如此。CVD对于反应过程的控制要求非常高,无论是反应气体的纯度、比例还是反应温度、时间都必须严格控制,否则薄膜的纯净度就会受到影响。最简单的例子,比如反应气体中一旦混入了超标的水蒸气,水蒸气会参与到反应中,并会导致淀积的氮化钽薄膜里出现氧原子。而温度等反应条件不对也可能导致反应气体产生CVD不需要的其他反应,最终错误地产生出氧原子进入薄膜。氧原子这玩意比铜原子还不安分,原本存在于氮化钽中的氧原子很快就会随着热运动渗入铜导线里,破坏掉铜导线的晶格结构。这产生的晶格缺陷不仅会导致铜导线的电阻率上升,还会导致导线对电迁移的抗性下降,电迁移衰减变得更快。这就是科技耶稣所说的“氧化”问题。芯片内信号通过导线传输由于距离很短通常可以忽略传输线效应,近似看作是一个电容充放电的RC延迟,铜导线电阻变大会直接导致信号延迟等比例增加。而芯片内对信号的传输延迟有着时序要求,如果延迟过大超过了时序允许的上限,就会导致电路后级接收到错误的信号,从而导致CPU运算出错。CPU里信号传输距离最长,延迟最大的就是环形总线,所以电迁移和氧化缺陷导致的信号延迟增加之后,很可能第一个遇到瓶颈的就是环形总线。于是我们就会看到疑似环形总线出错导致的CPU报错。最后,回到Intel 13/14代的问题,如果科技耶稣说的问题属实,那就得看具体的问题来源。如果氧化缺陷是反应剂污染导致的,那只有使用了污染原料的CPU批次会受影响,等Intel换掉了污染原料,后续的CPU就不会有问题了。如果是反应流程存在问题,那说明Intel工厂的质量控制存在问题,Intel需要重新改进Intel 7工艺的生产流程来解决这一问题。最糟糕的是生产工艺不存在什么质量问题,只是Intel留下的设计裕度太小了,导致CPU无法容忍哪怕一点点不可避免的工艺缺陷,那只能建议13/14代直接入土了。当然,鉴于12代没出问题,更有可能实际原因是介于二者之间,13/14代较小的设计裕度配上有潜在缺陷的工艺流程,最后再来点灰烬超频,于是就……

Saker_bobo 发表于 2024-7-21 01:47

如果只是批次出问题的话 intel不至于一直捂着这么久吧?换掉那一批就是了;如果是整代出问题 那应该可以认为13、14代的残值要暴跌 买个好CPU用到下一代卖个好价钱给贩子根本实现不了了

蒜灵 发表于 2024-7-21 09:10

我电脑最近莫名其妙老是窗口管理器重启,事件查看器里显示无法分配内存,明明内存还有一大半,和这个会有关系吗?

7776169 发表于 2024-7-21 10:58

如果只是原料污染,那应该早就换了吧,不至于现在还在爆炸吧

—— 来自 OnePlus GM1900, Android 10上的 S1Next-鹅版 v3.0.0.81-alpha

ltycomputer 发表于 2024-7-21 11:29

Intel以前也翻车过
2011年P67芯片组SATA控制器会挂,召回了
2017年Atom C2000系列CPU18个月变砖,也召回了

这次估计付不起这么多钱召回也没办法补救了

hgfdsa 发表于 2024-7-21 11:36

龙骑士尹志平 发表于 2024-7-21 12:09

outel算不算合众国次子,合众国不会让他倒台的,大不了让皮衣黄和苏妈掏点钱,台积电再掏点,给outel平事

斑驳的阴影 发表于 2024-7-23 00:52

半导体真是精细活啊。。。

塔奇克马 发表于 2024-7-23 00:55

ltycomputer 发表于 2024-7-21 11:29
Intel以前也翻车过
2011年P67芯片组SATA控制器会挂,召回了
2017年Atom C2000系列CPU18个月变砖,也召回了

记得j型号 几年后性能大幅下降好像没管?

—— 来自 鹅球 v3.0.87-alpha

游蜓 发表于 2024-7-23 00:55

斑驳的阴影 发表于 2024-7-23 00:52
半导体真是精细活啊。。。

毕竟尺度到纳米级了

—— 来自 Xiaomi 2211133C, Android 14上的 S1Next-鹅版 v3.0.0.81-alpha

novem 发表于 2024-7-23 01:33

下个月黑猴就是中文互联网INTEL营销神话破灭之时了
都是EPIC的错!

重巡羊舰 发表于 2024-7-23 07:30

龙骑士尹志平 发表于 2024-7-21 12:09
outel算不算合众国次子,合众国不会让他倒台的,大不了让皮衣黄和苏妈掏点钱,台积电再掏点,给outel平事 ...

就牙膏那个体量……共和国众孙之一

kawa11 发表于 2024-7-23 08:46

我居然看懂了,多谢科普

论坛助手,iPhone

litel 发表于 2024-7-23 08:49

快进到全球召回/部分退款, 但是除了中国

404page 发表于 2024-7-23 09:18

所有随时间老化出的问题基本都会在设计寿命的前10%时间暴露出来
一般厂商都会出厂前上强度跑burnin,把这10%寿命提前替你消耗掉
intel肯定做了这个,好奇他们得到的结果如何

Jeminy 发表于 2024-7-23 09:40

404page 发表于 2024-7-23 09:18
所有随时间老化出的问题基本都会在设计寿命的前10%时间暴露出来
一般厂商都会出厂前上强度跑burnin,把这10 ...

这个10%的寿命是用几百台机器并行跑累计的时间,能测出来的主要是随机错误。
如果真的是化学变化导致的绝对寿命问题,厂商好像是跑不出来的。

404page 发表于 2024-7-23 10:01

Jeminy 发表于 2024-7-23 09:40
这个10%的寿命是用几百台机器并行跑累计的时间,能测出来的主要是随机错误。
如果真的是化学变化导致的绝 ...

随机错误靠普通的scan和mbist来cover,这个不上强度的
这两个过了再上强度跑burnin来查早夭芯片的问题
burnin跑完了在来一次不上强度的scan和mbist来保证跑完10%寿命后仍然能正常工作

Van夫膜开 发表于 2024-7-23 10:02

以前一直以为intel是挤牙膏,原来是真的没活了啊

hgfdsa 发表于 2024-7-23 10:26

dffgf 发表于 2024-7-23 10:51

七草真由美 发表于 2024-7-23 11:15

Van夫膜开 发表于 2024-7-23 10:02
以前一直以为intel是挤牙膏,原来是真的没活了啊

当你以为美国人有技术储备的时候,其实他没有,完全不知道intel那五年以上时间能原地踏步的。

—— 来自 OnePlus GM1900, Android 10上的 S1Next-鹅版 v2.5.4

downforce 发表于 2024-7-23 11:25

ltycomputer 发表于 2024-7-21 11:29
Intel以前也翻车过
2011年P67芯片组SATA控制器会挂,召回了
2017年Atom C2000系列CPU18个月变砖,也召回了

Pentium FDIV bug
根据工程师指出,大约90亿个长除法中会有一个错误。依照计算,那个MTBF时间,大概是七百年发生一次,所以几乎是不可能发生。但是同样有人声称实际上遭遇到这个错误的频率要高得多。英特尔公司后来召回了有缺陷的产品。
还是当年的英特尔有魄力,因为一个几百年一遇的bug就把产品召回了。

—— 来自 Xiaomi 22061218C, Android 14上的 S1Next-鹅版 v3.0.0-alpha

Van夫膜开 发表于 2024-7-23 11:26

downforce 发表于 2024-7-23 11:25
还是当年的英特尔有魄力,因为一个几百年一遇的bug就把产品召回了。

—— 来自 Xiaomi 22061218C, Andr ...

有实力才会有魄力,现在Intel这个样子,不像是有实力了。

七草真由美 发表于 2024-7-23 12:02

Van夫膜开 发表于 2024-7-23 11:26
有实力才会有魄力,现在Intel这个样子,不像是有实力了。

这次应该不是实力的问题,而是没有替换的产品了,如果按照上面说的,所有13和14代都有问题,他的解决办法就是选择台积电。

—— 来自 OnePlus GM1900, Android 10上的 S1Next-鹅版 v2.5.4

laotoutou 发表于 2024-7-23 14:37

acalephs 发表于 2024-7-24 00:34

404page 发表于 2024-7-22 17:18
所有随时间老化出的问题基本都会在设计寿命的前10%时间暴露出来
一般厂商都会出厂前上强度跑burnin,把这10 ...

可能是因为这次的问题只有在某些高负载场景才会随机出现,scan测试不一定测的出来

kaiki_aiolos 发表于 2024-7-24 01:12

404page 发表于 2024-7-23 09:18
所有随时间老化出的问题基本都会在设计寿命的前10%时间暴露出来
一般厂商都会出厂前上强度跑burnin,把这10 ...

intel有段时间找阿三当首席架构师来着

还有个2020年被解雇的芯片主管也是阿三

septer 发表于 2024-7-24 14:52

如果是这样那intel干什么补救都没用,任何措施都是拖延时间稳住消费者

Rarity5 发表于 2024-7-24 14:59

英特尔承认13代工艺存在氧化问题并在2023年修复,但是2022年首发的那批13代从来就没听说过有召回。
合理推测还是整个B0步进一直有问题。

7776169 发表于 2024-7-24 15:01

现在也没说召回啊

—— 来自 OnePlus GM1900, Android 10上的 S1Next-鹅版 v3.0.0.81-alpha

squarezty 发表于 2024-7-24 15:13

kaiki_aiolos 发表于 2024-7-24 01:12
intel有段时间找阿三当首席架构师来着

还有个2020年被解雇的芯片主管也是阿三

说起阿三我记得当年xbox360三红芯片的设计师也是阿三,难道阿三真的只会做ppt跟党同伐异吗

EP2 发表于 2024-7-24 16:01

kaiki_aiolos 发表于 2024-7-24 01:12
intel有段时间找阿三当首席架构师来着

还有个2020年被解雇的芯片主管也是阿三


Raja吗,他本来是ati的人,应该是有能力的

ltycomputer 发表于 2024-7-24 17:29

downforce 发表于 2024-7-23 11:25
还是当年的英特尔有魄力,因为一个几百年一遇的bug就把产品召回了。

—— 来自 Xiaomi 22061218C, Andr ...

芯片组落后制程而且便宜,而且根据现在寨板H61芯片组魔改X79来看,复用程度很高。

现在CPU可比当年主板贵多了

CPU这个体量的召回,财报会爆炸的

downforce 发表于 2024-7-24 17:33

ltycomputer 发表于 2024-7-24 17:29
芯片组落后制程而且便宜,而且根据现在寨板H61芯片组魔改X79来看,复用程度很高。

现在CPU可比当年主板 ...

这个召回的是初代奔腾CPU,花了4.75亿美元,1994年的4.75亿美元。

HonjoNia 发表于 2024-7-24 17:50

因为是根本上的材料出了问题...最终使用这一批原料的产品都会寄的情况下,装死是没错的

HonjoNia 发表于 2024-7-24 17:51

ltycomputer 发表于 2024-7-21 11:29
Intel以前也翻车过
2011年P67芯片组SATA控制器会挂,召回了
2017年Atom C2000系列CPU18个月变砖,也召回了

C2000的是没有召回的,因为可以通过硬件补丁去修复

andychen 发表于 2024-7-24 17:54

kaiki_aiolos 发表于 2024-7-24 01:12
intel有段时间找阿三当首席架构师来着

还有个2020年被解雇的芯片主管也是阿三

这回氧化是工艺问题,缩肛是商业决策问题
都和芯片设计没关系

龙骑士尹志平 发表于 2024-7-24 19:06

这几代intel的u是不是硅仙人的遗产

madbird023 发表于 2024-7-24 19:37

龙骑士尹志平 发表于 2024-7-21 12:09
outel算不算合众国次子,合众国不会让他倒台的,大不了让皮衣黄和苏妈掏点钱,台积电再掏点,给outel平事 ...

经济上倒不倒台和他造不出能用的东西不冲突啊
页: [1]
查看完整版本: 铜、电迁移、氮化钽、氧化与CPU出错