谎称 发表于 2026-4-24 12:14

ml1642879 发表于 2026-4-24 12:09
感谢大A,感谢标普,感谢纳指,感谢道指

Re:Source · Xiaomi 15

梁老师,伟大!

cube 发表于 2026-4-24 12:14

闪雷可达鸭 发表于 2026-4-24 11:56
ds是开源ai。那其他地方的也会铺开,分流吧?

问题是拥有大算力的像字节一定部署的是自家的模型,能部署DS的其实还是那几家。

不过好歹是出了,开源这块还是需要有DS这样的能咬住闭源模型的脚步的存在,不然那几家迟早又是要坑人。

蒜苗 发表于 2026-4-24 12:15

木谷高明 发表于 2026-4-24 12:10
现在HBM全球短缺,没显存也造不出卡,而且先进制程的都在三星海力士镁光三家

甚至有人拿国外芯片封装HBM ...

长鑫什么时候开始造显存

Su7 发表于 2026-4-24 12:15

ml1642879 发表于 2026-4-24 12:09
感谢大A,感谢标普,感谢纳指,感谢道指

Re:Source · Xiaomi 15

还好吧,这是开源的,可以自己部署一个,又不是 A 畜。

燕山雪 发表于 2026-4-24 12:15

发现之前还有十几块钱api没用完……话说以前api订阅价多少来着?相比之下flash算涨价了吗

Awanano 发表于 2026-4-24 12:16

敏感 发表于 2026-4-24 12:03
顺道问一下,我现在用的中转API站,claude sonnet限流蛮严重的,让它读代码写文档,输入长一点,都经常报错 ...

闭源套餐体验肯定是oai的plus,折合下来人民币100多,好像还有邪道能支付的更便宜
中转站继续找opus/sonnet按量付费用
oai很难直观从结果水平推测中转站是不是给你注水了,所以我推荐直接买
我之前看到这个价格和pro只要折合600-700人民币就知道现在这些套餐都是赚吆喝的,用得多很难亏

论坛助手,iPhone

chuchoselph 发表于 2026-4-24 12:16

Rowen233 发表于 2026-4-24 11:48
谷顺歌呢 3.1 最近幻觉太深了 总结个科技新闻都不少错误

等下个月IO了,看有没有gemini 4

drodchang 发表于 2026-4-24 12:16

glm 5.1已经是全华为芯片训练了,V4用华为芯片训练也没啥大不了的

谎称 发表于 2026-4-24 12:17

燕山雪 发表于 2026-4-24 12:15
发现之前还有十几块钱api没用完……话说以前api订阅价多少来着?相比之下flash算涨价了吗 ...

flash还降了。。

mitzvah 发表于 2026-4-24 12:17

cube 发表于 2026-4-24 12:14
问题是拥有大算力的像字节一定部署的是自家的模型,能部署DS的其实还是那几家。

不过好歹是出了,开源这 ...
284B这个,部署起来门槛不高吧,量化到q4后才,150g左右,按照ppt的kv缓存占用只要170g内存就能跑1兆上下文,这超爽的

忧郁的杰哥 发表于 2026-4-24 12:18

脸宽 发表于 2026-4-24 12:20

加油华为,加油china,让我赶紧用上便宜pro

有鱼 发表于 2026-4-24 12:21

med 发表于 2026-4-24 12:23

元宝救星终于更新了

Su7 发表于 2026-4-24 12:23

有鱼 发表于 2026-4-24 12:21
论御三家的订阅服务,claude太魔怔反华没用过,但是closeAI的感觉比谷順歌的gemini强不少
gemini现在网页端 ...

gemini本来就是人嫌狗厌了。国产模型都比它好用

gp1390 发表于 2026-4-24 12:23

本帖最后由 gp1390 于 2026-4-24 12:25 编辑

tillnight 发表于 2026-4-24 11:44
中芯南方在表外。当然,国内炒股其实没那么讲究的,谐音也能炒。

南方营收全并表,利润40%并表,当然现在不止南方,东方也上了      Re:Source

Su7 发表于 2026-4-24 12:24

med 发表于 2026-4-24 12:23
元宝救星终于更新了

凌晨腾讯才发布的hy3,时间卡的真好

有鱼 发表于 2026-4-24 12:26

Awanano 发表于 2026-4-24 12:28

也没啥好挑的了,谷歌3.1p吃上下文多了甚至会影响后续调用基本工具,ppt/pdf都读不了,国外非黄色需求只能oai反人类二选一,考虑稳定性只有oai了
国内智谱前几天才把老用户清理一波,嘴脸也没好到哪去,对企业线路也在耍滑头
现在买这些套餐有点像去洗荤脚,就是买个服务态度开心就好,然后别洗一半封号把你送进去就行了

论坛助手,iPhone

villsian 发表于 2026-4-24 12:28

deepseek没让人失望!

吹个全球顶尖不过分吧。国产之光!!!

StrangerJ 发表于 2026-4-24 12:29

cube 发表于 2026-4-24 12:14
问题是拥有大算力的像字节一定部署的是自家的模型,能部署DS的其实还是那几家。

不过好歹是出了,开源这 ...

火山云提供ds的吧

—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99

ycjiang1337 发表于 2026-4-24 12:30

Rowen233 发表于 2026-4-24 11:23
算力限制,等下半年昇腾 950 上来会降价吧

现在应该是普通昇腾950在推,Q1刚刚出货

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

wiwiluo 发表于 2026-4-24 12:32

忘记在哪看的了,950性能相当于h20的水平?

论坛助手,iPhone

ayanamilin 发表于 2026-4-24 12:34

本帖最后由 ayanamilin 于 2026-4-24 12:53 编辑

V4 pro 1.6T,flash 284B,1M 上下文,Pro 价格 ¥12/24,Flash 价格 ¥1/2

新的 attention 架构 + mHC + Muon 优化器

DeepSeek V4 Pro-Max 我猜测已经达到 Opus 4.6 水准

新的 attention 架构 CSA 应该是在 DSA 的基础上加上了压缩,从而拓展上下文长度。CSA 和 HCA 混用。

这次的技术报告内容很多,不仅有模型架构上的设计,还有超级多 AI Infra 和 training 的干货。这次已经开源了 Tilelang 的 kernel,根据报告的丰富度来看,后续可能还会开源别的东西。

库德里尔 发表于 2026-4-24 12:35

什么时候v4promax级别的模型能下到民用级别啊

—— 来自 鹅球 v3.5.99

qaz121 发表于 2026-4-24 12:37

cube 发表于 2026-4-24 12:14
问题是拥有大算力的像字节一定部署的是自家的模型,能部署DS的其实还是那几家。

不过好歹是出了,开源这 ...

字节的火山现在其实也部署GLM 5.1了。

—— 来自 S1Fun

→熙← 发表于 2026-4-24 12:38

没有pro max吧,是pro的模型开了max的推理

med 发表于 2026-4-24 12:38

没有多模态也问题不大,多模态有qwen

阿萨辛艾沃尔 发表于 2026-4-24 12:38

→熙← 发表于 2026-4-24 12:39

qaz121 发表于 2026-4-24 12:37
字节的火山现在其实也部署GLM 5.1了。

—— 来自 S1Fun

内部倍数太高了,消耗太快, 智谱跑到30%的量, 火山就到限额了

忧郁的杰哥 发表于 2026-4-24 12:39

ytrfegd 发表于 2026-4-24 12:40

之前喜欢用一些看到的小段子看看ai的识别能力

西天过去懂现在懂未来懂一切懂佛——猜一人物

Gemini很快就猜出是ykw
3.2和v4只是思考时间不同,一个200秒一个18秒,结果都是如来佛

—— 来自 vivo V2502A, Android 16, 鹅球 v3.5.99

紧那罗 发表于 2026-4-24 12:42

灰色的狐狸 发表于 2026-4-24 11:54
950这个本来就预计是q3吧

主要提了一句等950大批量上市后V4会大幅降价 算是能让人狠狠期待一把

Promeus 发表于 2026-4-24 12:42

ytrfegd 发表于 2026-4-24 12:40
之前喜欢用一些看到的小段子看看ai的识别能力

西天过去懂现在懂未来懂一切懂佛——猜一人物

https://p.sda1.dev/32/9df3e3452a0c549a907a439dfc5c00ab/image.jpg猜出来了啊

冬眠的龙凰 发表于 2026-4-24 12:44

谁能想到 我用v4干的第一件事是我的龙虾在nga上烧了一千多tokrn和喷子对喷

ayanamilin 发表于 2026-4-24 12:45

vLLM day 0 support 了, DeepSeek V4 需要在 Hopper 或者 Blackwell 架构下部署才能享受完全的加速:https://vllm.ai/blog/deepseek-v4。其实从昨天开源的 TileLang 算子支持的架构就能看出来了。

DS 这次应该是基于国产硬件也做了优化方案,将国产硬件的推理加速水准对齐 Hopper/Blackwell 架构水平。

ytrfegd 发表于 2026-4-24 12:47

Promeus 发表于 2026-4-24 12:42
猜出来了啊

什么,我用的DeepSeek自己的app的专家模式,他没猜出来

—— 来自 vivo V2502A, Android 16, 鹅球 v3.5.99

Vneeto 发表于 2026-4-24 12:49

我记得昨天才爆出新闻说腾讯与阿里争着要给deepseek投资来着,原来是为了今天更新预热。

谎称 发表于 2026-4-24 12:49

ytrfegd 发表于 2026-4-24 12:47
什么,我用的DeepSeek自己的app的专家模式,他没猜出来

—— 来自 vivo V2502A, Android 16, 鹅球 v3.5. ...

神鬼二象性。

我就是**

ycjiang1337 发表于 2026-4-24 12:54

Rowen233 发表于 2026-4-24 11:48
谷顺歌呢 3.1 最近幻觉太深了 总结个科技新闻都不少错误

以前2.5Pro是1M上下文的王,现在拉完了

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha
页: 10 11 12 13 14 15 16 17 18 19 [20] 21 22 23 24 25 26 27 28 29
查看完整版本: FT:DeepSeek下周发|已发,转为v4讨论楼