找回密码
 立即注册
搜索
楼主: 绕指流光

[科技] FT:DeepSeek下周发|已发,转为v4讨论楼

  [复制链接]
发表于 2026-4-24 12:54 来自手机 | 显示全部楼层
Promeus 发表于 2026-4-24 12:42
猜出来了啊

用的是硅基流动还是DS官网自己的API?
我看硅基流动似乎还没更的样子?
回复

使用道具 举报

     
发表于 2026-4-24 12:54 来自手机 | 显示全部楼层
灰色的狐狸 发表于 2026-4-24 11:54
950这个本来就预计是q3吧

950超节点是Q3,Q1已经出了普通的卡

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha
回复

使用道具 举报

     
发表于 2026-4-24 12:55 | 显示全部楼层
ayanamilin 发表于 2026-4-24 12:45
vLLM day 0 support 了, DeepSeek V4 需要在 Hopper 或者 Blackwell 架构下部署才能享受完全的加速:https ...

其实硬障碍是hbm, 推理卡的需要 算力/带宽 均衡,哪个太高都是浪费
950pr就是这个权衡下的产品, HiBL第一代只有1T多带宽,所以950pr算力只有910c的一半
得等hbm/HiBL带宽起来, 单卡算力可以相对简单堆上去
那时候系统成本就真的下来了, 比如HiBL下一代能有4T+带宽,那堆个4倍950pr算力没问题,单卡也有b200一半了
这时候堆机器,成本可能不止降低4倍,可能更多咯.
回复

使用道具 举报

     
发表于 2026-4-24 12:58 来自手机 | 显示全部楼层
wiwiluo 发表于 2026-4-24 12:32
忘记在哪看的了,950性能相当于h20的水平?

论坛助手,iPhone

950 FP8算力是H20的四倍

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha
回复

使用道具 举报

     
发表于 2026-4-24 12:59 来自手机 | 显示全部楼层
飛霞精灵 发表于 2026-4-24 12:54
用的是硅基流动还是DS官网自己的API?
我看硅基流动似乎还没更的样子?

官网api

评分

参与人数 1战斗力 +1 收起 理由
飛霞精灵 + 1

查看全部评分

回复

使用道具 举报

     
发表于 2026-4-24 13:03 来自手机 | 显示全部楼层
飛霞精灵 发表于 2026-4-24 12:54
用的是硅基流动还是DS官网自己的API?
我看硅基流动似乎还没更的样子?

硅基肯定没这么快,官方才发了两个多小时,硅基再怎么也得等明天了(也有可能会更慢点,我记得之前硅基就有过拖了好几天才更新)

评分

参与人数 1战斗力 +1 收起 理由
飛霞精灵 + 1

查看全部评分

回复

使用道具 举报

     
发表于 2026-4-24 13:06 | 显示全部楼层
这个谜语玩的是网络梗,谜底是**。

典故出自2021年网上热传的“西天懂佛”**雕像——因**常自称“没有人比我更懂……”,被戏称为“懂王”。谜面里的“过去懂、现在懂、未来懂、一切懂”正是调侃他无所不“懂”,坐西天成佛,就成了“西天懂佛”。
官方app专家模式,深度思考智能搜索开,19s。但是后面就出不了答案,很随机。不过这个谜语确实有点难。    Re:Source
回复

使用道具 举报

发表于 2026-4-24 13:06 | 显示全部楼层
本帖最后由 绝地潜兵 于 2026-4-24 13:11 编辑

卧槽,两个价格相差那么多?
百万tokens输出        2元        24元

还行还行,试了一下deepseek-v4-flash也可以实现思考模式,比原来还更便宜了

回复

使用道具 举报

发表于 2026-4-24 13:09 | 显示全部楼层
v4-pro应该是还欠后训练,应该再等一下。    Re:Source
回复

使用道具 举报

发表于 2026-4-24 13:11 | 显示全部楼层
绝地潜兵 发表于 2026-4-24 13:06
卧槽,两个价格相差那么多?
百万tokens输出        2元        24元
还行还行,试了一下deepseek-v4-flash ...

贵是因为芯片没有,等下半年上了华为的950超节点就降价。    Re:Source
回复

使用道具 举报

     
发表于 2026-4-24 13:16 来自手机 | 显示全部楼层
个人体验agentic 工程比sonnet略强。看价格的话我只能说完爆了

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-24 13:16 | 显示全部楼层
gemini 已经这么人嫌狗厌了吗,我拿来当外网豆包用的
回复

使用道具 举报

发表于 2026-4-24 13:17 | 显示全部楼层
还不稳定,V4 API还在调试,又崩了
回复

使用道具 举报

发表于 2026-4-24 13:17 | 显示全部楼层
whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗,我拿来当外网豆包用的

算力不行,牢美没电了,不然哈基米骚活一堆
回复

使用道具 举报

     
发表于 2026-4-24 13:17 来自手机 | 显示全部楼层

还吐槽了一下智谱经常系统繁忙 智谱问要不要帮你开个号

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2026-4-24 13:21 来自手机 | 显示全部楼层
有没有试过写小说的,flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-4-24 13:23 来自手机 | 显示全部楼层
本帖最后由 88316756 于 2026-4-24 13:28 编辑
overflowal 发表于 2026-4-24 13:09
v4-pro应该是还欠后训练,应该再等一下。    Re:Source

嗯,是的,看过知乎nao的评价,v4智商是够的,后训练还不够充分,有的时候要抽卡。

我自己的体验就是,v4有能力答对问题,但不能稳定出正确答案,4.6o就能稳定出答案。

还有Engram也还没上,以及多模态也还在搞没弄完,后续可期。


所以这次v4还是挂了预览版的名义,正式版还有后续的4.x应该就会完善后训练,新的基模出了后,希望后续升级迭代快一点,这次等了快5个月,实在伤不起了。
回复

使用道具 举报

发表于 2026-4-24 13:27 来自手机 | 显示全部楼层
ff2077 发表于 2026-4-24 13:21
有没有试过写小说的,flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha ...

写小说最大的问题是写不长,短篇目前啥ai都能写出不错的
回复

使用道具 举报

     
发表于 2026-4-24 13:30 来自手机 | 显示全部楼层
big9999 发表于 2026-4-24 13:27
写小说最大的问题是写不长,短篇目前啥ai都能写出不错的

之前ds上下文太短了 老是记不住 v4终于也是1M了 最近谷歌降智的厉害 晚上试试v4了

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha
回复

使用道具 举报

发表于 2026-4-24 13:30 来自手机 | 显示全部楼层
就等网页版和app能不能更新上了。
回复

使用道具 举报

     
发表于 2026-4-24 13:30 | 显示全部楼层
opencode有办法让思考变中文吗, ds的中文会好一点吧
回复

使用道具 举报

     
发表于 2026-4-24 13:32 | 显示全部楼层
whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗,我拿来当外网豆包用的

算力严重不足,还瞎到处jb送pro,最近api都变弱智了,真想一拳打爆谷歌
回复

使用道具 举报

     
发表于 2026-4-24 13:38 | 显示全部楼层
接 cc 试用了一下 pro,确实还可以。赶紧出 coding plan 吧,我要站起来蹬
回复

使用道具 举报

     
发表于 2026-4-24 13:43 来自手机 | 显示全部楼层
还有这次的1m上下文,可以说是最大的亮点之一,不要拿去年那些老模型的什么1M 2M的上下文来说事,那些只是开放了上下文窗口,实际注意力一坨,根本不能用。


这次V4的mrcr仅次于4.6o和刚发布的GPT 5.5,了,像4.6o 200K以上的上下文还要额外付费,到了4.7注意力还倒退了。而v4这次的新技术成本降低太多太多了,基本上是目前唯三可用的1m上下文模型。

评分

参与人数 1战斗力 +1 收起 理由
秦南心 + 1

查看全部评分

回复

使用道具 举报

     
发表于 2026-4-24 13:43 | 显示全部楼层
ff2077 发表于 2026-4-24 13:21
有没有试过写小说的,flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha ...

长篇写小说无论是哪个模型,都会注意力涣散,就跟韩寒似的,写着写着角色竟然丢一个!?我觉得这个事情短时间内无解
我自己玩都得是自己提供框架,自己记着谁该怎么了,提示给大模型让它们写
回复

使用道具 举报

     
发表于 2026-4-24 13:48 | 显示全部楼层
小说得按照大型工程来吧。先给整体框架约束。提前规划好啊,每一章节精炼后给到上下文。

完全全文扔进去谁都扛不住
回复

使用道具 举报

     
发表于 2026-4-24 13:50 | 显示全部楼层
飛霞精灵 发表于 2026-4-24 13:30
就等网页版和app能不能更新上了。

已经更了
回复

使用道具 举报

头像被屏蔽
     
发表于 2026-4-24 13:50 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-4-24 13:53 来自手机 | 显示全部楼层
回复

使用道具 举报

     
发表于 2026-4-24 13:55 来自手机 | 显示全部楼层

v5还不至于,现在上面的应该换成v4正式版
回复

使用道具 举报

发表于 2026-4-24 13:55 | 显示全部楼层
思考链里面生成的心理活动怎么比输出的正文还生动,字数还多
回复

使用道具 举报

     
发表于 2026-4-24 13:56 来自手机 | 显示全部楼层
ff2077 发表于 2026-4-24 13:21
有没有试过写小说的,flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha ...

当然能。D指导写小说算文笔不错的那一类

—— 来自 HUAWEI WGRR-W19, Android 12, 鹅球 v3.5.99-alpha
回复

使用道具 举报

头像被屏蔽
发表于 2026-4-24 13:56 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-4-24 13:57 来自手机 | 显示全部楼层
whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗,我拿来当外网豆包用的

傻逼GEMINI经常连一个4000字文档都不读完搁哪瞎扯,上下文记忆力更是可以用悲剧来形容,也就官方渠道依托它家自己的谷歌搜索当高级搜索引擎用还凑合

—— 来自 HUAWEI WGRR-W19, Android 12, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-4-24 13:59 | 显示全部楼层
绝地潜兵 发表于 2026-4-24 13:55
思考链里面生成的心理活动怎么比输出的正文还生动,字数还多

我特别喜欢ds这一点,比其他家故意把思考过程藏起来防止蒸馏要好太多了。
而且有时候虽然回答不是我想要的,但是思考过程很有启发性。    Re:Source
回复

使用道具 举报

发表于 2026-4-24 14:02 | 显示全部楼层
勿徊哉 发表于 2026-4-24 13:59
我特别喜欢ds这一点,比其他家故意把思考过程藏起来防止蒸馏要好太多了。
而且有时候虽然回答不是我想要 ...

不是这个问题,我发给哈基米分析,它说这简直是**“满级剧本”和“精简版预告片”**的区别。
妹的,思考链里面不是思考过程,而是铺开了一部小电影……
比3.2的时候夸张多了
回复

使用道具 举报

     
发表于 2026-4-24 14:06 | 显示全部楼层
用手机app试了一下,体感比V3.2好多了,这下可以试着用d师傅当agent的基座了
回复

使用道具 举报

     
发表于 2026-4-24 14:06 | 显示全部楼层
ds要prompt约束

不然很容易干燥

gemini 3pro刚出来那会,巧思和段子不断

拿来airp简直无敌

现在若只的难以附加,所以···

谷出还是去死吧
回复

使用道具 举报

发表于 2026-4-24 14:07 | 显示全部楼层
谷顺歌真没活了不如咬个打火机

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-24 14:07 | 显示全部楼层
我以前和Gemini说鲸鱼的时候,Gemini会吐槽鲸鱼喜欢过度推理炫技。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-18 23:19 , Processed in 0.143556 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表