132410 发表于 2026-3-13 19:09

TuzDoDez 发表于 2026-3-13 19:12

今年业界主流就是想推训练/推理硬件分离,现在到处在猜过几天GTC老黄会怎么讲买了LPU之后怎么用。

jonarryn 发表于 2026-3-13 19:21

这个马晓宇是第一作者,怎么能看出来哪些观点和判断是David Patterson做的?

yeo 发表于 2026-3-13 19:24

这标题当其他人傻么?这些问题是个业内就明白,怎么就当头棒喝了...

培根芝士蛋堡XD 发表于 2026-3-13 19:25

这还用他来说吗?老黄比谁都清楚,之前rubin的CPX就是这个思想下的产物,单服务器内实现PD分离,写论文前能不能做点调研

云卷花开 发表于 2026-3-13 19:40

瞄了一眼,还算是有内容的,毕竟从他说的四种方向来说的话以脉动阵列为核心的各种 xpu 也被归类为“gpu”这个范畴了,四个方向都没提。
然后高速内存其实和芯片设计无关我感觉,存内计算则存在模拟的精度问题,3d 堆叠则是芯片制造相关的事,互联则是和芯片本身无关,好吧,收回上面的话,还是没啥内容      Re:Source

超级韭菜人 发表于 2026-3-13 22:30

老黄专门的推理卡都快出来了

weary10 发表于 2026-3-13 22:53

计算卡,推理卡?
反正别和游戏宅抢GPU就好。

不见不散 发表于 2026-3-13 23:02

求你们不要和宅宅抢硬件了,你们这么高大上的前沿科技就非要用和宅宅打游戏一样的硬件吗?

squallx 发表于 2026-3-13 23:10

存算一体本来就是正常的发展方向 问题是现在谁能来工程落地啊

qwased 发表于 2026-3-14 01:46

训练更大参数的模型不一定能获取更高的上限之后,老黄的超高溢价就维持不下去了现在业界都有时间腾出手换自己的硬件躲老黄税,老黄蹦跶不了几年了

燕山雪 发表于 2026-3-14 01:54

比较关心端侧推理怎么优化,llm提供商自己会去卷成本的,但我是真不放心把啥隐私都交给这帮鸟公司,这次是anthropic开盒kimi,下次就说不好是谁跟谁了

璇瑢子R 发表于 2026-3-14 02:20

不见不散 发表于 2026-3-13 23:02
求你们不要和宅宅抢硬件了,你们这么高大上的前沿科技就非要用和宅宅打游戏一样的硬件吗? ...

现在还需要抢硬件吗?那是直接抢晶圆厂了

superwza 发表于 2026-3-14 02:30

泰坦失足 发表于 2026-3-14 03:48

qwased 发表于 2026-3-14 01:46
训练更大参数的模型不一定能获取更高的上限之后,老黄的超高溢价就维持不下去了现在业界都有时间腾出手换自 ...

谷歌行所以我也行大概是许多公司最大的幻觉. .

Sza 发表于 2026-3-14 07:12

本帖最后由 Sza 于 2026-3-14 07:18 编辑

说到存储,我又想起来国内做3D PCM的新存科技了(说是对标傲腾,已公开发布的产品看上去容量或封装die数量还差点)。后来的新闻说它家和其他企业合作了,我不懂产业链和资本运作的方式,但产品能商业化落地总是好事。要是能解决技术难点的话,说不定也能像HBM、HBF那样叠。

鸳鸳相抱 发表于 2026-3-14 07:47

本帖最后由 鸳鸳相抱 于 2026-3-14 07:49 编辑

qwased 发表于 2026-3-14 01:46
训练更大参数的模型不一定能获取更高的上限之后,老黄的超高溢价就维持不下去了现在业界都有时间腾出手换自 ...

你觉得老黄傻吗,大厂会想办法做自己的硬件,老黄也会想办法自己训练只能用CUDA的开放权重大模型啊

大模型的软件护城河搞不好最后还没有硬件生态的护城河深
页: [1]
查看完整版本: RISC之父向AI芯片泼冷水:AI推理不需要更强的GPU,需要另一种硬件