刷新世界算力新高度 “灵晟”问鼎全球超算TOP500
https://news.cctv.com/2026/06/24/ARTIzgNeSyRyqMhNxuDNorwy260623.shtml2026年6月23日,德国汉堡ISC2026大会(国际超算大会)发布全球超算Top500榜单:全国产自主研制的“灵晟”超级计算机以2.19EFlops(每秒1018次浮点运算)持续双精度浮点性能登顶全球超算TOP500,时隔九年,我国超算再次排名全球第一。
在全球超算顶级盛会ISC2026上,国家超级计算深圳中心发布新一代“灵晟”超算系统实测持续性能达到2.19EFlops,是世界首台持续性能超二百亿亿次(2EFlops)的超算系统,创新超智融合架构,领先美欧E级超算,中国超算重回世界首位。
“灵晟”定位为面向科学工程智能计算的国产全栈融合基础设施:
在芯片层,自研LX2 CPU创新性引入多精度与矩阵加速等能力,实现片上超算算力与智能算力深度融合,并集成了首颗国产HBM(到宽带内存),内存带宽相比传统CPU提升10倍;
在网络层,自主设计的灵启高速互连网络可支持200万个端口、10万节点的超大规模组网;在存储层,采用分层架构,兼顾高性能作业区与容量型数据区,可扩展至E级;
在系统层,构建大规模超智融合框架,自研全栈软件,将底层硬件能力以可用、可编程、可优化的方式释放给应用,提高各领域应用性能;
在节能方面,首创100%全液冷散热计算机柜,以51GFlops/W能效比,在世界第一的持续性能之上,树立绿色计算新标杆。
https://p2.img.cctvpic.com/photoworkspace/contentimg/2026/06/23/2026062321301140077.png
自系统部署以来,“灵晟”已支撑大气海洋、工程仿真、材料科学、药物发现、脑科学、科学AI、大模型推理等多领域应用,支撑混合精度计算、工作流和复杂多任务并行运行,在大规模并行环境下平均扩展效率84.4%,实现超过千万核心的全系统高效可扩展运行。面向科学、工程、产业各领域的大规模应用需求,提供多学科、全流程、多精度融合的科学智能应用生产级平台,并形成了世界级应用成果。
“灵晟”算力登顶和应用成效,是我国超算领域突破国外技术封锁、构建自主可控软硬件体系的跨越,为我国科研突破、行业创新和产业高质量发展提供了坚实的算力根基。
(总台央视记者 张春玲 朱平)
38核一个簇共享28.5MB L2(768KB/核 ),阉了L3,把面积做成304核SVE+SME单元
32G HBM充当L4,通过异步后台搬数据进L2。某种意义上来说是昇腾和鲲鹏的合体
据说是华为的cpu 重新参加top500评选了
然后,大概是第一款纯APU超算?
Tuolumne使用的INSTINCT MI300A虽然也是APU,但是仍旧有EPYC做节点。 sellboy 发表于 2026-6-24 09:09
重新参加top500评选了
然后,大概是第一款纯APU超算?
纯CPU吧
sellboy 发表于 2026-6-24 09:09
重新参加top500评选了
然后,大概是第一款纯APU超算?
纯CPU,看上面的图,每38核簇共享28.5MB L2,没有L3。把面积全部拿来做 SVE+SME单元
单U做到60.3T FP64 /120T FP32 /240T FP16orBF16 /960T INT8性能
没有L3所以数据必须从DDR搬到HBM再搬到L2,需要手撸寄存器(比申威好点) 超算排名怎么排到500啊……全世界第500高峰谁会记得啊 naclken. 发表于 2026-6-24 09:16
超算排名怎么排到500啊……全世界第500高峰谁会记得啊
会不会是有些实力不行但音量较大的国家的超算只能排到三四百名,哪怕弄个top300都进不去所以强行挽尊弄个top500
—— 来自 HUAWEI HBN-AL80, Android 12, 鹅球 v3.5.99-alpha "灵晟"的真正意义,不在于2.198 EFlops的跑分数字,而在于它用纯国产CPU证明了三件事:第一,E级算力可以不依赖GPU;第二,全栈自主可控不是口号而是工程现实;第三,算力自主权的本质是"架构定义权",而不只是"单颗芯片的制程竞赛"。 从2017年"神威·太湖之光"到2026年"灵晟",九年的跨度映射出一条清晰路径:从"引进集成"到"全栈自主",从"跟跑"到"定义新范式"。但真正决定这条纯CPU路线能否从"榜首"走向"产业"的变量,不在榜单上,而在制程获取、软件生态迁移和液冷运营经济性这三个现实约束之中
作者:冰是睡着的水
链接:https://www.zhihu.com/question/2032659692376343993/answer/2053027674281582969
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
—— 来自 鹅球 v4.0-alpha 鲁邦三世1 发表于 2026-6-24 09:24
"灵晟"的真正意义,不在于2.198 EFlops的跑分数字,而在于它用纯国产CPU证明了三件事:第一,E级算力可以不 ...
ber,搬ai泔水何意味 我对之前那几个没拿去参加的还更有兴趣点,虽然多半不会有真正的信息吧
—— 来自 realme RMX3850, Android 16, 鹅球 v3.5.99 新式强袭型抹布 发表于 2026-6-24 09:23
会不会是有些实力不行但音量较大的国家的超算只能排到三四百名,哪怕弄个top300都进不去所以强行挽尊弄个 ...
主要是半年整理500个也没太大工作量
如果说有什么可以因为安排500个入榜,那大概是超算的原型机
因为只有一组机柜,2年后的top3大概这阶段会只有100~200名级别。 神特么每秒1018次浮点运算
—— 来自 Xiaomi 25019PNF3C, Android 16, 鹅球 v3.5.99 不敢想拿这个搞黄色会有多爽 有专业人士说下这玩意相比gpu集群的优势在哪么? 本帖最后由 cxasuka 于 2026-6-24 09:57 编辑
naclken. 发表于 2026-6-24 09:16
超算排名怎么排到500啊……全世界第500高峰谁会记得啊
这个你就要问世界企业500强之类的榜单了
2025年第500名是喜力公司HEINEKEN,做饮料那个 科技新闻搬运工 发表于 2026-6-24 09:33
我对之前那几个没拿去参加的还更有兴趣点,虽然多半不会有真正的信息吧
—— 来自 realme RMX3850, Androi ...
跟着这个出来的论文显示,在一个E级AI混合精度(FP32/BF16混合)训练中,灵晟跑出1.2E持续 性能,总效率24%,无锡的神威跑出1.0E,总效率35%,无锡神威跑FP32 3E性能,对应FP64砍一半。
神威估计以后都不会排名,这玩意纯军方、保密项目。上TOP10要实鸡验证
燕山雪 发表于 2026-6-24 09:39
有专业人士说下这玩意相比gpu集群的优势在哪么?
同构,效率高,在理论峰值计算能力小于AMD的酋长岩情况下,实际持续 性能反超20%
统一总线下,层级传递越少越好 国产hbm也搞定了,明年菊花手机只怕也要上hbm 国产已经能做 HBM 了吗?哪家做的? 昇腾950DT不是带HBM么? 只不过看解释好像不算正经标准的HBM nosmokingsp 发表于 2026-6-24 10:12
国产已经能做 HBM 了吗?哪家做的?
4Gbps来看,跟昇腾950DT使用的一致
也许就是华子的HiZQ 2.0。 国产超算闭关9年,被大侄子阴阳惨了(虽然明眼人都知道是保密和突破封锁的战略需要)。这次再次参与排名,除了证明实力之外,显然还意味着国产超算已经有了不怕封锁的自信 WindDragon 发表于 2026-6-24 10:29
国产超算闭关9年,被大侄子阴阳惨了(虽然明眼人都知道是保密和突破封锁的战略需要)。这次再次参与排名, ...
应该就是全国产可控了,以前国产超算的生产工艺和高速内存应该还是依赖外部的。 hgfdsa 发表于 2026-6-24 10:04
国产hbm也搞定了,明年菊花手机只怕也要上hbm
这个是早就有
现在的关键是看华为昇腾上的HBM是否有3e的水平,有的话,说明设备这一块有突破,而且和头部就能缩小差距到半代-1代的水平 华子牛逼 目前市面能看到的芯片是能找到hbm 2的
坊间传闻是长鑫长存大跃进要上hbm4 只是是和华为合作的投机hbm,
按海思某头牌科学家在知乎之前写了一个神叨叨的帖子,大概是华为找到了一个办法,可以不按hbm的工艺做一个内存来达成hbm的效果 中山大学的,在深圳,一眼国防科大的,然后百度一下,果然是国防科大的学姐。
holmesjerry 发表于 2026-6-24 11:16
目前市面能看到的芯片是能找到hbm 2的
坊间传闻是长鑫长存大跃进要上hbm4 只是是和华为合作的投机hbm,
我记得是不按hbm3的标准来做hbm,跳出框架也就没有限制了 上一次看到国产超算的新闻还是神威太湖之光…… holmesjerry 发表于 2026-6-24 11:16
目前市面能看到的芯片是能找到hbm 2的
坊间传闻是长鑫长存大跃进要上hbm4 只是是和华为合作的投机hbm,
不是,他的意思是HBM是一个完整的规范,对内存的物理尺寸有要求,如果放弃尺寸要求的话做到那个性能指标并不难。由于国内厂商不可能进入NV供应链,死磕标准HBM实际上除了自嗨之外毫无价值
—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha 据说处理器是鲲鹏920f,海思的大佬还发朋友圈了
—— 来自 鹅球 v3.5.99 燕山雪 发表于 2026-6-24 09:39
有专业人士说下这玩意相比gpu集群的优势在哪么?
长浮点支持好,以及分支解数学方程效率高,科学计算用的,算天气飞机气动之类的。这个同样钱相当于雇了10个大学生,虽然也能干小学生的活,但只有现在这种溢价极高还封锁的情况下顶替一部分;但对面一个农场就几百个小学生。
所以,这是两个赛道,以前还有点交集,现在越来越生态分裂了。 燕山雪 发表于 2026-6-24 09:39
有专业人士说下这玩意相比gpu集群的优势在哪么?
同构的效率更高,而且英伟达越来越不待见FP64了,B300甚至牙膏倒吸
—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha ycjiang1337 发表于 2026-6-24 12:31
不是,他的意思是HBM是一个完整的规范,对内存的物理尺寸有要求,如果放弃尺寸要求的话做到那个性能指标 ...
是这个意思
目前网上能看到一张怀疑是950dt的图 就用了这种神必芯片
话说回来这玩意一片十几二三十万 得多大本事的osint才能买来decap holmesjerry 发表于 2026-6-24 14:55
是这个意思
目前网上能看到一张怀疑是950dt的图 就用了这种神必芯片
如果出货量大的话,应该有废品/工厂样品流通,只是可能要几年后才有 不是出不出的起几十万的问题,目前看来短期内950dt根本不会出散卡了,都是打包卖超节点,那可不是几十万打的住的。 holmesjerry 发表于 2026-6-24 11:16
目前市面能看到的芯片是能找到hbm 2的
坊间传闻是长鑫长存大跃进要上hbm4 只是是和华为合作的投机hbm,
不是神神叨叨
是hbm定义里一堆有专利又没用的电路
反正被制裁了把这些无用的东西砍掉又不是做不出来
—— 来自 鹅球 v3.3.96 ycjiang1337 发表于 2026-6-24 14:14
同构的效率更高,而且英伟达越来越不待见FP64了,B300甚至牙膏倒吸
—— 来自 HUAWEI SGT-AL50, Android ...
黄狗恨不得把FP64全部阉光,超算?找AMD、INDEL去,这里ALL IN AI
页:
[1]