找回密码
 立即注册
搜索
楼主: Fidel

[科技] [zt]金融时报:中国“大基金”牵头投资谈判,DeepSeek 估值接近 450 亿美元

[复制链接]
     
发表于 2026-5-6 16:22 | 显示全部楼层
drodchang 发表于 2026-5-6 15:41
我觉得干脆让deepseek和月之暗面合并算了,反正都没上市,两个公司可是非常互补啊。 ...

这两位还是竞争好,你搞个新技术我搞个新技术,大家相互开源之后良性竞争有利于行业进步
然后 Z➗这只吃不拉只想恰烂钱的滚出去

Re:Source
回复

使用道具 举报

发表于 2026-5-6 16:23 | 显示全部楼层
楼上老哥你编辑掉吧

我还以为你说的是马华腾或者福报马之类的
回复

使用道具 举报

发表于 2026-5-6 16:34 | 显示全部楼层
DeepSeek不融资怕是里面的开发人员要跑光了。。。
回复

使用道具 举报

     
发表于 2026-5-6 16:51 来自手机 | 显示全部楼层
ycjiang1337 发表于 2026-5-6 15:34
其实是反过来的,技术报告里提到训练用的还是H800。真实的过程是DeepSeek搞来了少量B200做了测试,发现MX ...

训练怎么可能用H800,欲盖弥彰而已,DS4是原生FP4精度的,你怎么拿H800这代卡训练。有些东西不要问太细。
回复

使用道具 举报

     
发表于 2026-5-6 17:13 | 显示全部楼层
tillnight 发表于 2026-5-6 16:51
训练怎么可能用H800,欲盖弥彰而已,DS4是原生FP4精度的,你怎么拿H800这代卡训练。有些东西不要问太细。 ...

DSV4 不是原生 FP4 吧,搞的是 QAT

Tech report 3.4:为了在部署阶段实现推理加速和节省显存,我们在后训练阶段引入量化感知训练(Quantization-Aware Training, QAT)(Jacob et al., 2018),使模型能够适应量化带来的精度下降。我们将 FP4(MXFP4)量化(Rouhani et al., 2023)应用于两个部分:第一,MoE 专家权重,这是 GPU 显存占用的主要来源之一(OpenAI, 2025);第二,CSA indexer 中的 Query-Key(QK)路径,在这里 QK activations 会完全以 FP4 格式缓存、加载和相乘,从而在长上下文场景下加速 attention score 的计算。此外,在 QAT 过程中,我们还进一步将 index scores I:,: 从 FP32 量化到 BF16。该优化使 top-k selector 获得 2 倍加速,同时保持 99.7% 的 KV entries 召回率。

对于 MoE 专家权重,我们遵循 QAT 的常见做法:optimizer 维护的 FP32 master weights 会先被量化为 FP4,然后再反量化回 FP8 进行计算。值得注意的是,我们的 FP4 到 FP8 反量化是无损的。这是因为 FP8(E4M3)相比 FP4(E2M1)多出 2 个 exponent bits,因此具有更大的动态范围。因此,只要每个 FP8 量化块(128 × 128 tiles)内部 FP4 子块(1 × 32 tiles)的最大 scale factor 与最小 scale factor 之间的比值不超过某个阈值,细粒度的 scale 信息就可以被 FP8 扩展后的动态范围完全吸收。我们通过实验验证,当前权重满足这一条件。这使得整个 QAT pipeline 可以在不做任何修改的情况下完全复用现有的 FP8 训练框架

在反向传播中,梯度是相对于 forward pass 中相同的 FP8 权重来计算的,并直接传播回 FP32 master weights;这等价于在量化操作上使用 Straight-Through Estimator(STE)。这也避免了重新量化转置权重的需求。

在 RL 训练的推理和 rollout 阶段,由于这些阶段不涉及反向传播,我们直接使用真实的 FP4 量化权重,而不是模拟量化。这样可以确保采样阶段的模型行为与线上部署完全一致,同时减少 kernel 的内存加载,实现实际加速,并显著降低显存消耗。我们对 CSA indexer 中的 QK 路径也采用类似处理。
回复

使用道具 举报

     
发表于 2026-5-6 17:18 | 显示全部楼层
一个芯片从设计到流片到量产 得多久啊,别瞎yy好么
回复

使用道具 举报

     
发表于 2026-5-6 17:21 来自手机 | 显示全部楼层
ycjiang1337 发表于 2026-5-6 15:22
昇腾950明摆着就是按Deepseek的需求做的,不然国内谁用得了这么多MXFP8和FP4算力

—— 来自 HUAWEI SGT- ...

。。哥,按照你这个思路,nv的芯片也是按照ds的需求设计的
虽然也差不多是

—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-5-6 17:23 | 显示全部楼层
梁圣想搞agi,真能支撑他搞出来的绝对不是马化腾或者马云。
回复

使用道具 举报

     
发表于 2026-5-6 17:24 | 显示全部楼层
也没勾结那么深吧,只是提前声明后软件和硬件研发都遵循了同一套业界标准去做了
————————————————————————————————————————————————
国际主流FP8技术路线以IEEE相关标准为基础,形成了以e4m3和e5m2为核心的格式体系,并通过动态缩放策略与硬件优化实现高效AI计算。其中,NVIDIA作为技术推动者,在传统格式基础上发展出微缩块格式(MXFP8)。
DeepSeek官微在置顶留言里表示UE8MO FP8是针对即将发布的下一代国产芯片设计。
2025年,随着UE8M0 FP8精度标准的落地,这一局面迎来根本性转变——该标准通过“无符号指数+零尾数”创新设计,舍弃符号位以扩大动态范围,在降低硬件实现难度的同时,填补了国产芯片在精度与效率上的短板,标志着国产AI从“跟着英伟达屁股后面跑”到“自己制定游戏规则”的战略转型。
回复

使用道具 举报

     
 楼主| 发表于 2026-5-6 18:49 来自手机 | 显示全部楼层
upd
https://x.com/i/status/2051913837708710170


—— 来自 Xiaomi 24117RK2CC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-5-6 19:03 来自手机 | 显示全部楼层
tillnight 发表于 2026-5-6 16:51
训练怎么可能用H800,欲盖弥彰而已,DS4是原生FP4精度的,你怎么拿H800这代卡训练。有些东西不要问太细。 ...

你看错了,技术报告里写得清清楚楚的,FP4是QAT训练,用FP8模拟的,原文里明确说了使用的硬件不支持FP4所以得不到训练算力增益

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha
回复

使用道具 举报

     
发表于 2026-5-6 19:05 来自手机 | 显示全部楼层
StrangerJ 发表于 2026-5-6 17:21
。。哥,按照你这个思路,nv的芯片也是按照ds的需求设计的
虽然也差不多是

虽然MXFP4确实是B卡新引入的特性特性,但是国内除了DS之外根本没有用到FP4的,连FP8训练都没有。如果DS不提需求的话,你是华为你塞那么多用不上的晶体管干啥?

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha
回复

使用道具 举报

     
发表于 2026-5-6 19:07 | 显示全部楼层
鲁邦三世1 发表于 2026-5-6 15:48
你这是想造出一个多大的垄断公司?
就现在这个规模完全跑通芯片制造,通关制裁以后怕不是要各种拆分

如果AI未来真是基础建设,那么国资垄断其实没啥大问题。
回复

使用道具 举报

     
发表于 2026-5-6 19:35 | 显示全部楼层
ds和月之暗面好像是之间的一些思路算法的相互共享和引用,没有形成技术壁垒,并没有合并吧,只是鬼佬吐槽牢美的ai商业公司八百个心眼子互相提防,不像老钟公司的技术共享互惠,所以老钟的ai追的那么快
回复

使用道具 举报

     
发表于 2026-5-6 19:41 来自手机 | 显示全部楼层
龙骑士尹志平 发表于 2026-5-6 19:35
ds和月之暗面好像是之间的一些思路算法的相互共享和引用,没有形成技术壁垒,并没有合并吧,只是鬼佬吐槽牢 ...

现在头部几家模型都开源

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha
回复

使用道具 举报

     
发表于 2026-5-6 19:52 | 显示全部楼层
ycjiang1337 发表于 2026-5-6 19:41
现在头部几家模型都开源

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

不仅是开源,ai模型开源又不开源全代码,ds和kimi是核心算法和思路的相互借鉴,ds用kimi的优化器,kimi用ds的mla。
回复

使用道具 举报

     
发表于 2026-5-6 19:55 | 显示全部楼层
龙骑士尹志平 发表于 2026-5-6 19:52
不仅是开源,ai模型开源又不开源全代码,ds和kimi是核心算法和思路的相互借鉴,ds用kimi的优化器,kimi用 ...

那也谈不上特别亲密,或者说国内开源界整体就挺交换技术的,GLM还用DSA呢
回复

使用道具 举报

     
发表于 2026-5-6 20:00 | 显示全部楼层
本帖最后由 Lorraine_Kinney 于 2026-5-6 20:03 编辑

阿川下场卖api中转站了

https://worldclaw.ai/#world-router
回复

使用道具 举报

发表于 2026-5-6 20:07 | 显示全部楼层

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2026-5-6 20:24 | 显示全部楼层
国家大基金 2024 年从财政部、地方政府及国有银行等处共募集到约 470 亿美元资金,重点投资半导体设备和材料。目前大基金注资的对象均为国内芯片行业的核心选手,包括中芯国际、长江存储等关键制造企业。一旦本轮融资落地,这将是它首次公开注资本土大语言模型厂商。

https://www.ithome.com/0/946/841.htm
回复

使用道具 举报

     
发表于 2026-5-6 20:31 来自手机 | 显示全部楼层
哈利谢顿 发表于 2026-5-6 15:59
眼花了……

那是democratic,不是domestic
回复

使用道具 举报

     
发表于 2026-5-6 21:39 来自手机 | 显示全部楼层
龙骑士尹志平 发表于 2026-5-6 19:52
不仅是开源,ai模型开源又不开源全代码,ds和kimi是核心算法和思路的相互借鉴,ds用kimi的优化器,kimi用 ...

开源模型必须得开源结构代码啊,想什么呢

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha
回复

使用道具 举报

     
发表于 2026-5-6 21:58 | 显示全部楼层
ft关于ds的一切消息都可以视为造谣

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-5-6 22:20 来自手机 | 显示全部楼层
minimax现在港股市值就有2500亿,DeepSeek 3000亿有点太低了,属于国资友情价了

—— 来自 Xiaomi 2509FPN0BC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-5-6 22:58 | 显示全部楼层
别的方向不太清楚,但FT关于中国半导体方面的爆料基本都很准        Re:Source
回复

使用道具 举报

     
发表于 2026-5-7 14:27 | 显示全部楼层
说起来隔壁的 DeepSeekV4 专楼就是因为 FT 的报导而开的
回复

使用道具 举报

     
发表于 2026-5-7 15:04 | 显示全部楼层
不太懂金融,如果ds不缺钱,是不是就不用融资或者上市了?
回复

使用道具 举报

发表于 2026-5-7 15:10 | 显示全部楼层
zouyun147 发表于 2026-5-7 15:04
不太懂金融,如果ds不缺钱,是不是就不用融资或者上市了?

梁以及幻方从钱的角度来说是不需要,要的是别的东西。比如他需要融一笔钱来给Deepseek定价,或者他需要利益分享给其他方面    Re:Source
回复

使用道具 举报

     
发表于 2026-5-7 15:12 来自手机 | 显示全部楼层
zouyun147 发表于 2026-5-7 15:04
不太懂金融,如果ds不缺钱,是不是就不用融资或者上市了?

要给手下利益,要不然隔三差五被挖走一个可受不了
回复

使用道具 举报

     
发表于 2026-5-7 16:04 来自手机 | 显示全部楼层
估值能影响期权价格,如果实行期权激励并且有可以落实的行权方式,倒是留人的好方法。

—— 来自 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-5-7 16:55 来自手机 | 显示全部楼层
zouyun147 发表于 2026-5-7 15:04
不太懂金融,如果ds不缺钱,是不是就不用融资或者上市了?

像ds、宇树上市是国资委任务

—— 来自 HUAWEI ALN-AL80, Android 12, 鹅球 v3.5.99-alpha
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-21 05:57 , Processed in 0.101265 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表