找回密码
 立即注册
搜索
查看: 711|回复: 4

[新闻] 【转】补齐 AI 推理拼图:英伟达黄仁勋揭秘 Groq LPU 整合路线图

[复制链接]
发表于 2026-2-27 13:34 | 显示全部楼层 |阅读模式
本帖最后由 撒撒 于 2026-2-28 19:18 编辑

https://www.ithome.com/0/924/124.htm

IT之家 2 月 27 日消息,科技媒体 Wccftech 昨日(2 月 26 日)发布博文,报道称在 2026 财年第 4 财季(截至 2026 年 1 月)财报会议上,英伟达 CEO 黄仁勋透露了收购 Groq 后的核心整合计划。

重要性方面,黄仁勋将此次价值 200 亿美元(IT之家注:现汇率约合 1370.47 亿元人民币)的非授权收购,和当年收购 Mellanox 相提并论,暗示 Groq 将在英伟达的 AI 版图中发挥革命性的基础作用,具体的架构整合细节将于下月召开的 GTC 2026 大会上公布。

战略布局方面,黄仁勋强调 Groq 将补齐 AI 推理阶段的短板,实现超低延迟的解码能力。AI 行业目前正加速迈向多智能体协同(Agentic AI)时代,应用层要求极低的延迟和超快的响应速度。

英伟达凭借 Hopper 和 Blackwell 架构绝对主导了 AI 模型训练市场,并通过 Rubin CPX 架构的注意力加速引擎,覆盖了推理的“预填充”(Prefill)阶段,但在对延迟极度敏感的“解码”(Decode)环节,公司亟需引入 Groq 的技术来确立行业标杆。

技术实现方面,英伟达希望全面释放 Groq 的硬件潜力。Groq 的语言处理单元(LPU)采用片上 SRAM(静态随机存取存储器),能够提供每秒数十 TB 的内部超高带宽。

这种技术路线此前已被 Cerebras(WSE-3)和微软(Maia 300)等巨头采用。通过引入 LPU,AI 智能体能够在短短几秒内完成复杂的逻辑推理步骤,从而有效打破多智能体相互协作时的算力瓶颈。

针对具体的硬件落地形态,广发证券预测英伟达将在 GTC 大会上推出名为“LPX 机架”的混合计算方案。该方案预计会在单个机架内集成 256 个 LPU 单元。

在数据传输方面,LPU 之间将采用原生的准同步芯片间协议进行连接;而 LPU 与 GPU 之间则有望通过 NVLink Fusion 技术互联,从而在预填充阶段高效处理来自 GPU 的海量 KV 缓存卸载。

Wccftech:

https://wccftech.com/nvidia-says ... imilar-to-mellanox/

200亿美元,英伟达收购Groq核心资产:

https://news.qq.com/rain/a/20251225A03VKW00

广发证券前瞻 AI 界“春晚”:英伟达 2026 GTC 下月开幕,系统突破算力瓶颈:

https://www.ithome.com/0/924/047.htm

消息称 OpenAI 将成英伟达 × Groq“联名”AI 推理芯片头部大客户

https://www.ithome.com/0/924/532.htm
回复

使用道具 举报

发表于 2026-2-27 17:06 | 显示全部楼层
200亿买了个估值70亿公司的核心团队,真的是出手阔绰。
回复

使用道具 举报

     
发表于 2026-2-27 17:17 | 显示全部楼层
去年至今错失LITE和MU的机会
回复

使用道具 举报

     
发表于 2026-2-27 17:18 来自手机 | 显示全部楼层
等你体量来到4-5万亿 你也不会在乎的 护城河宽了又不止这么点了
回复

使用道具 举报

     
发表于 2026-2-27 17:22 来自手机 | 显示全部楼层

这点钱对现在老黄来说不算什么
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-3-4 10:01 , Processed in 0.066328 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表