找回密码
 立即注册
搜索
楼主: 绕指流光

[科技] FT:DeepSeek下周发|已发,转为v4讨论楼

  [复制链接]
     
发表于 2026-4-24 12:14 | 显示全部楼层
ml1642879 发表于 2026-4-24 12:09
感谢大A,感谢标普,感谢纳指,感谢道指

Re:Source · Xiaomi 15

梁老师,伟大!

回复

使用道具 举报

     
发表于 2026-4-24 12:14 | 显示全部楼层
闪雷可达鸭 发表于 2026-4-24 11:56
ds是开源ai。那其他地方的也会铺开,分流吧?

问题是拥有大算力的像字节一定部署的是自家的模型,能部署DS的其实还是那几家。

不过好歹是出了,开源这块还是需要有DS这样的能咬住闭源模型的脚步的存在,不然那几家迟早又是要坑人。
回复

使用道具 举报

     
发表于 2026-4-24 12:15 来自手机 | 显示全部楼层
木谷高明 发表于 2026-4-24 12:10
现在HBM全球短缺,没显存也造不出卡,而且先进制程的都在三星海力士镁光三家

甚至有人拿国外芯片封装HBM ...

长鑫什么时候开始造显存
回复

使用道具 举报

头像被屏蔽
发表于 2026-4-24 12:15 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-4-24 12:15 来自手机 | 显示全部楼层
发现之前还有十几块钱api没用完……话说以前api订阅价多少来着?相比之下flash算涨价了吗
回复

使用道具 举报

     
发表于 2026-4-24 12:16 | 显示全部楼层
敏感 发表于 2026-4-24 12:03
顺道问一下,我现在用的中转API站,claude sonnet限流蛮严重的,让它读代码写文档,输入长一点,都经常报错 ...

闭源套餐体验肯定是oai的plus,折合下来人民币100多,好像还有邪道能支付的更便宜
中转站继续找opus/sonnet按量付费用
oai很难直观从结果水平推测中转站是不是给你注水了,所以我推荐直接买
我之前看到这个价格和pro只要折合600-700人民币就知道现在这些套餐都是赚吆喝的,用得多很难亏

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-24 12:16 | 显示全部楼层
Rowen233 发表于 2026-4-24 11:48
谷顺歌呢 3.1 最近幻觉太深了 总结个科技新闻都不少错误

等下个月IO了,看有没有gemini 4
回复

使用道具 举报

     
发表于 2026-4-24 12:16 | 显示全部楼层
glm 5.1已经是全华为芯片训练了,V4用华为芯片训练也没啥大不了的
回复

使用道具 举报

     
发表于 2026-4-24 12:17 | 显示全部楼层
燕山雪 发表于 2026-4-24 12:15
发现之前还有十几块钱api没用完……话说以前api订阅价多少来着?相比之下flash算涨价了吗 ...

flash还降了。。
回复

使用道具 举报

发表于 2026-4-24 12:17 | 显示全部楼层
cube 发表于 2026-4-24 12:14
问题是拥有大算力的像字节一定部署的是自家的模型,能部署DS的其实还是那几家。

不过好歹是出了,开源这 ...

284B这个,部署起来门槛不高吧,量化到q4后才,150g左右,按照ppt的kv缓存占用只要170g内存就能跑1兆上下文,这超爽的
回复

使用道具 举报

头像被屏蔽
     
发表于 2026-4-24 12:18 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-4-24 12:20 | 显示全部楼层
加油华为,加油china,让我赶紧用上便宜pro
回复

使用道具 举报

发表于 2026-4-24 12:21 | 显示全部楼层
论御三家的订阅服务,claude太魔怔反华没用过,但是closeAI的感觉比谷順歌的gemini强不少
gemini现在网页端/app的降智严重,幻觉严重
gpt现在用起来感觉是很多问题只敢照着搜索结果复读,不愿意做推断和判断。
回复

使用道具 举报

     
发表于 2026-4-24 12:23 | 显示全部楼层
元宝救星终于更新了
回复

使用道具 举报

头像被屏蔽
发表于 2026-4-24 12:23 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-4-24 12:23 | 显示全部楼层
本帖最后由 gp1390 于 2026-4-24 12:25 编辑
tillnight 发表于 2026-4-24 11:44
中芯南方在表外。当然,国内炒股其实没那么讲究的,谐音也能炒。

南方营收全并表,利润40%并表,当然现在不止南方,东方也上了        Re:Source
回复

使用道具 举报

头像被屏蔽
发表于 2026-4-24 12:24 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2026-4-24 12:26 | 显示全部楼层
api炸了?用的人太多?
回复

使用道具 举报

     
发表于 2026-4-24 12:28 | 显示全部楼层
也没啥好挑的了,谷歌3.1p吃上下文多了甚至会影响后续调用基本工具,ppt/pdf都读不了,国外非黄色需求只能oai反人类二选一,考虑稳定性只有oai了
国内智谱前几天才把老用户清理一波,嘴脸也没好到哪去,对企业线路也在耍滑头
现在买这些套餐有点像去洗荤脚,就是买个服务态度开心就好,然后别洗一半封号把你送进去就行了

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-24 12:28 来自手机 | 显示全部楼层
deepseek没让人失望!

吹个全球顶尖不过分吧。国产之光!!!
回复

使用道具 举报

     
发表于 2026-4-24 12:29 来自手机 | 显示全部楼层
cube 发表于 2026-4-24 12:14
问题是拥有大算力的像字节一定部署的是自家的模型,能部署DS的其实还是那几家。

不过好歹是出了,开源这 ...

火山云提供ds的吧

—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 12:30 来自手机 | 显示全部楼层
Rowen233 发表于 2026-4-24 11:23
算力限制,等下半年昇腾 950 上来会降价吧

现在应该是普通昇腾950在推,Q1刚刚出货

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha
回复

使用道具 举报

     
发表于 2026-4-24 12:32 | 显示全部楼层
忘记在哪看的了,950性能相当于h20的水平?

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-24 12:34 | 显示全部楼层
本帖最后由 ayanamilin 于 2026-4-24 12:53 编辑

V4 pro 1.6T,flash 284B,1M 上下文,Pro 价格 ¥12/24,Flash 价格 ¥1/2

新的 attention 架构 + mHC + Muon 优化器

DeepSeek V4 Pro-Max 我猜测已经达到 Opus 4.6 水准

新的 attention 架构 CSA 应该是在 DSA 的基础上加上了压缩,从而拓展上下文长度。CSA 和 HCA 混用。

这次的技术报告内容很多,不仅有模型架构上的设计,还有超级多 AI Infra 和 training 的干货。这次已经开源了 Tilelang 的 kernel,根据报告的丰富度来看,后续可能还会开源别的东西。

回复

使用道具 举报

     
发表于 2026-4-24 12:35 来自手机 | 显示全部楼层
什么时候v4promax级别的模型能下到民用级别啊

—— 来自 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 12:37 | 显示全部楼层
cube 发表于 2026-4-24 12:14
问题是拥有大算力的像字节一定部署的是自家的模型,能部署DS的其实还是那几家。

不过好歹是出了,开源这 ...

字节的火山现在其实也部署GLM 5.1了。

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-4-24 12:38 | 显示全部楼层
没有pro max吧,是pro的模型开了max的推理
回复

使用道具 举报

     
发表于 2026-4-24 12:38 | 显示全部楼层
没有多模态也问题不大,多模态有qwen
回复

使用道具 举报

     
发表于 2026-4-24 12:38 | 显示全部楼层

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2026-4-24 12:39 | 显示全部楼层
qaz121 发表于 2026-4-24 12:37
字节的火山现在其实也部署GLM 5.1了。

—— 来自 S1Fun

内部倍数太高了,消耗太快, 智谱跑到30%的量, 火山就到限额了
回复

使用道具 举报

头像被屏蔽
     
发表于 2026-4-24 12:39 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-4-24 12:40 来自手机 | 显示全部楼层
之前喜欢用一些看到的小段子看看ai的识别能力

西天过去懂现在懂未来懂一切懂佛——猜一人物

Gemini很快就猜出是ykw
3.2和v4只是思考时间不同,一个200秒一个18秒,结果都是如来佛

—— 来自 vivo V2502A, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 12:42 | 显示全部楼层
灰色的狐狸 发表于 2026-4-24 11:54
950这个本来就预计是q3吧

主要提了一句等950大批量上市后V4会大幅降价 算是能让人狠狠期待一把
回复

使用道具 举报

     
发表于 2026-4-24 12:42 来自手机 | 显示全部楼层
ytrfegd 发表于 2026-4-24 12:40
之前喜欢用一些看到的小段子看看ai的识别能力

西天过去懂现在懂未来懂一切懂佛——猜一人物

猜出来了啊
回复

使用道具 举报

     
发表于 2026-4-24 12:44 | 显示全部楼层
谁能想到 我用v4干的第一件事是我的龙虾在nga上烧了一千多tokrn和喷子对喷

评分

参与人数 1战斗力 +1 收起 理由
空き地卯木 + 1 欢乐多

查看全部评分

回复

使用道具 举报

     
发表于 2026-4-24 12:45 | 显示全部楼层
vLLM day 0 support 了, DeepSeek V4 需要在 Hopper 或者 Blackwell 架构下部署才能享受完全的加速:https://vllm.ai/blog/deepseek-v4。其实从昨天开源的 TileLang 算子支持的架构就能看出来了。

DS 这次应该是基于国产硬件也做了优化方案,将国产硬件的推理加速水准对齐 Hopper/Blackwell 架构水平。
回复

使用道具 举报

     
发表于 2026-4-24 12:47 来自手机 | 显示全部楼层

什么,我用的DeepSeek自己的app的专家模式,他没猜出来

—— 来自 vivo V2502A, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 12:49 来自手机 | 显示全部楼层
我记得昨天才爆出新闻说腾讯与阿里争着要给deepseek投资来着,原来是为了今天更新预热。
回复

使用道具 举报

     
发表于 2026-4-24 12:49 | 显示全部楼层
ytrfegd 发表于 2026-4-24 12:47
什么,我用的DeepSeek自己的app的专家模式,他没猜出来

—— 来自 vivo V2502A, Android 16, 鹅球 v3.5. ...

神鬼二象性。

我就是**
回复

使用道具 举报

     
发表于 2026-4-24 12:54 来自手机 | 显示全部楼层
Rowen233 发表于 2026-4-24 11:48
谷顺歌呢 3.1 最近幻觉太深了 总结个科技新闻都不少错误

以前2.5Pro是1M上下文的王,现在拉完了

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-18 22:54 , Processed in 0.120949 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表