[zt]金融时报：中国“大基金”牵头投资谈判，DeepSeek 估值接近 450 亿美元 - 第2页 - 归墟 - Stage1st

云卷花开 发表于 2026-5-6 16:22

drodchang 发表于 2026-5-6 15:41
我觉得干脆让deepseek和月之暗面合并算了，反正都没上市，两个公司可是非常互补啊。 ...

这两位还是竞争好，你搞个新技术我搞个新技术，大家相互开源之后良性竞争有利于行业进步
然后 Z➗这只吃不拉只想恰烂钱的滚出去

Re:Source

哈利谢顿 发表于 2026-5-6 16:23

楼上老哥你编辑掉吧

我还以为你说的是马华腾或者福报马之类的

yseternalx 发表于 2026-5-6 16:34

DeepSeek不融资怕是里面的开发人员要跑光了。。。

tillnight 发表于 2026-5-6 16:51

ycjiang1337 发表于 2026-5-6 15:34
其实是反过来的，技术报告里提到训练用的还是H800。真实的过程是DeepSeek搞来了少量B200做了测试，发现MX ...

训练怎么可能用H800，欲盖弥彰而已，DS4是原生FP4精度的，你怎么拿H800这代卡训练。有些东西不要问太细。

ayanamilin 发表于 2026-5-6 17:13

tillnight 发表于 2026-5-6 16:51
训练怎么可能用H800，欲盖弥彰而已，DS4是原生FP4精度的，你怎么拿H800这代卡训练。有些东西不要问太细。 ...

DSV4 不是原生 FP4 吧，搞的是 QAT

Tech report 3.4：为了在部署阶段实现推理加速和节省显存，我们在后训练阶段引入量化感知训练（Quantization-Aware Training, QAT）（Jacob et al., 2018），使模型能够适应量化带来的精度下降。我们将 FP4（MXFP4）量化（Rouhani et al., 2023）应用于两个部分：第一，MoE 专家权重，这是 GPU 显存占用的主要来源之一（OpenAI, 2025）；第二，CSA indexer 中的 Query-Key（QK）路径，在这里 QK activations 会完全以 FP4 格式缓存、加载和相乘，从而在长上下文场景下加速 attention score 的计算。此外，在 QAT 过程中，我们还进一步将 index scores I:,: 从 FP32 量化到 BF16。该优化使 top-k selector 获得 2 倍加速，同时保持 99.7% 的 KV entries 召回率。

对于 MoE 专家权重，我们遵循 QAT 的常见做法：optimizer 维护的 FP32 master weights 会先被量化为 FP4，然后再反量化回 FP8 进行计算。值得注意的是，我们的 FP4 到 FP8 反量化是无损的。这是因为 FP8（E4M3）相比 FP4（E2M1）多出 2 个 exponent bits，因此具有更大的动态范围。因此，只要每个 FP8 量化块（128 × 128 tiles）内部 FP4 子块（1 × 32 tiles）的最大 scale factor 与最小 scale factor 之间的比值不超过某个阈值，细粒度的 scale 信息就可以被 FP8 扩展后的动态范围完全吸收。我们通过实验验证，当前权重满足这一条件。这使得整个 QAT pipeline 可以在不做任何修改的情况下完全复用现有的 FP8 训练框架。

在反向传播中，梯度是相对于 forward pass 中相同的 FP8 权重来计算的，并直接传播回 FP32 master weights；这等价于在量化操作上使用 Straight-Through Estimator（STE）。这也避免了重新量化转置权重的需求。

在 RL 训练的推理和 rollout 阶段，由于这些阶段不涉及反向传播，我们直接使用真实的 FP4 量化权重，而不是模拟量化。这样可以确保采样阶段的模型行为与线上部署完全一致，同时减少 kernel 的内存加载，实现实际加速，并显著降低显存消耗。我们对 CSA indexer 中的 QK 路径也采用类似处理。

StarForceTi 发表于 2026-5-6 17:18

一个芯片从设计到流片到量产得多久啊，别瞎yy好么

StrangerJ 发表于 2026-5-6 17:21

ycjiang1337 发表于 2026-5-6 15:22
昇腾950明摆着就是按Deepseek的需求做的，不然国内谁用得了这么多MXFP8和FP4算力

—— 来自 HUAWEI SGT- ...

。。哥，按照你这个思路，nv的芯片也是按照ds的需求设计的
虽然也差不多是

—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99

舞以发表于 2026-5-6 17:23

梁圣想搞agi，真能支撑他搞出来的绝对不是马化腾或者马云。

best32167 发表于 2026-5-6 17:24

也没勾结那么深吧，只是提前声明后软件和硬件研发都遵循了同一套业界标准去做了
————————————————————————————————————————————————
国际主流FP8技术路线以IEEE相关标准为基础，形成了以e4m3和e5m2为核心的格式体系，并通过动态缩放策略与硬件优化实现高效AI计算。其中，NVIDIA作为技术推动者，在传统格式基础上发展出微缩块格式（MXFP8）。
DeepSeek官微在置顶留言里表示UE8MO FP8是针对即将发布的下一代国产芯片设计。
2025年，随着UE8M0 FP8精度标准的落地，这一局面迎来根本性转变——该标准通过“无符号指数+零尾数”创新设计，舍弃符号位以扩大动态范围，在降低硬件实现难度的同时，填补了国产芯片在精度与效率上的短板，标志着国产AI从“跟着英伟达屁股后面跑”到“自己制定游戏规则”的战略转型。

Fidel 发表于 2026-5-6 18:49

upd
https://x.com/i/status/2051913837708710170
https://p.sda1.dev/32/1148f84803f39075a7925c718a5f0219/image.jpg

—— 来自 Xiaomi 24117RK2CC, Android 16, 鹅球 v3.5.99

ycjiang1337 发表于 2026-5-6 19:03

tillnight 发表于 2026-5-6 16:51
训练怎么可能用H800，欲盖弥彰而已，DS4是原生FP4精度的，你怎么拿H800这代卡训练。有些东西不要问太细。 ...

你看错了，技术报告里写得清清楚楚的，FP4是QAT训练，用FP8模拟的，原文里明确说了使用的硬件不支持FP4所以得不到训练算力增益

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

ycjiang1337 发表于 2026-5-6 19:05

StrangerJ 发表于 2026-5-6 17:21
。。哥，按照你这个思路，nv的芯片也是按照ds的需求设计的
虽然也差不多是

虽然MXFP4确实是B卡新引入的特性特性，但是国内除了DS之外根本没有用到FP4的，连FP8训练都没有。如果DS不提需求的话，你是华为你塞那么多用不上的晶体管干啥？

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

sellboy 发表于 2026-5-6 19:07

鲁邦三世1 发表于 2026-5-6 15:48
你这是想造出一个多大的垄断公司？
就现在这个规模完全跑通芯片制造，通关制裁以后怕不是要各种拆分

如果AI未来真是基础建设，那么国资垄断其实没啥大问题。

龙骑士尹志平 发表于 2026-5-6 19:35

ds和月之暗面好像是之间的一些思路算法的相互共享和引用，没有形成技术壁垒，并没有合并吧，只是鬼佬吐槽牢美的ai商业公司八百个心眼子互相提防，不像老钟公司的技术共享互惠，所以老钟的ai追的那么快

ycjiang1337 发表于 2026-5-6 19:41

龙骑士尹志平发表于 2026-5-6 19:35
ds和月之暗面好像是之间的一些思路算法的相互共享和引用，没有形成技术壁垒，并没有合并吧，只是鬼佬吐槽牢 ...

现在头部几家模型都开源

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

龙骑士尹志平 发表于 2026-5-6 19:52

ycjiang1337 发表于 2026-5-6 19:41
现在头部几家模型都开源

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

不仅是开源，ai模型开源又不开源全代码，ds和kimi是核心算法和思路的相互借鉴，ds用kimi的优化器，kimi用ds的mla。

sellboy 发表于 2026-5-6 19:55

龙骑士尹志平发表于 2026-5-6 19:52
不仅是开源，ai模型开源又不开源全代码，ds和kimi是核心算法和思路的相互借鉴，ds用kimi的优化器，kimi用 ...
那也谈不上特别亲密，或者说国内开源界整体就挺交换技术的，GLM还用DSA呢

Lorraine_Kinney 发表于 2026-5-6 20:00

本帖最后由 Lorraine_Kinney 于 2026-5-6 20:03 编辑

阿川下场卖api中转站了

https://worldclaw.ai/#world-router

哈利谢顿 发表于 2026-5-6 20:07

ayanamilin 发表于 2026-5-6 20:24

国家大基金 2024 年从财政部、地方政府及国有银行等处共募集到约 470 亿美元资金，重点投资半导体设备和材料。目前大基金注资的对象均为国内芯片行业的核心选手，包括中芯国际、长江存储等关键制造企业。一旦本轮融资落地，这将是它首次公开注资本土大语言模型厂商。

https://www.ithome.com/0/946/841.htm

Rowen233 发表于 2026-5-6 20:31

哈利谢顿发表于 2026-5-6 15:59
眼花了……

那是democratic，不是domestic

ycjiang1337 发表于 2026-5-6 21:39

龙骑士尹志平发表于 2026-5-6 19:52
不仅是开源，ai模型开源又不开源全代码，ds和kimi是核心算法和思路的相互借鉴，ds用kimi的优化器，kimi用 ...

开源模型必须得开源结构代码啊，想什么呢

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

舞以发表于 2026-5-6 21:58

ft关于ds的一切消息都可以视为造谣

论坛助手,iPhone

itsmyrailgun 发表于 2026-5-6 22:20

minimax现在港股市值就有2500亿，DeepSeek 3000亿有点太低了，属于国资友情价了

—— 来自 Xiaomi 2509FPN0BC, Android 16, 鹅球 v3.5.99

gp1390 发表于 2026-5-6 22:58

别的方向不太清楚，但FT关于中国半导体方面的爆料基本都很准 Re:Source

ayanamilin 发表于 2026-5-7 14:27

说起来隔壁的 DeepSeekV4 专楼就是因为 FT 的报导而开的

zouyun147 发表于 2026-5-7 15:04

不太懂金融,如果ds不缺钱,是不是就不用融资或者上市了?

overflowal 发表于 2026-5-7 15:10

zouyun147 发表于 2026-5-7 15:04
不太懂金融,如果ds不缺钱,是不是就不用融资或者上市了?

梁以及幻方从钱的角度来说是不需要，要的是别的东西。比如他需要融一笔钱来给Deepseek定价，或者他需要利益分享给其他方面 Re:Source

Promeus 发表于 2026-5-7 15:12

zouyun147 发表于 2026-5-7 15:04
不太懂金融,如果ds不缺钱,是不是就不用融资或者上市了?

要给手下利益，要不然隔三差五被挖走一个可受不了

yoki42 发表于 2026-5-7 16:04

估值能影响期权价格，如果实行期权激励并且有可以落实的行权方式，倒是留人的好方法。

—— 来自鹅球 v3.5.99

foolishman 发表于 2026-5-7 16:55

zouyun147 发表于 2026-5-7 15:04
不太懂金融,如果ds不缺钱,是不是就不用融资或者上市了?

像ds、宇树上市是国资委任务

—— 来自 HUAWEI ALN-AL80, Android 12, 鹅球 v3.5.99-alpha

页: 1 [2]

Stage1st's Archiver