FT：DeepSeek下周发｜已发，转为v4讨论楼 - 第21页 - 归墟 - Stage1st

飛霞精灵 发表于 2026-4-24 12:54

Promeus 发表于 2026-4-24 12:42
猜出来了啊

用的是硅基流动还是DS官网自己的API？
我看硅基流动似乎还没更的样子？

ycjiang1337 发表于 2026-4-24 12:54

灰色的狐狸发表于 2026-4-24 11:54
950这个本来就预计是q3吧

950超节点是Q3，Q1已经出了普通的卡

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

phorcys02 发表于 2026-4-24 12:55

ayanamilin 发表于 2026-4-24 12:45
vLLM day 0 support 了， DeepSeek V4 需要在 Hopper 或者 Blackwell 架构下部署才能享受完全的加速：https ...

其实硬障碍是hbm, 推理卡的需要算力/带宽均衡,哪个太高都是浪费
950pr就是这个权衡下的产品, HiBL第一代只有1T多带宽,所以950pr算力只有910c的一半
得等hbm/HiBL带宽起来, 单卡算力可以相对简单堆上去
那时候系统成本就真的下来了, 比如HiBL下一代能有4T+带宽,那堆个4倍950pr算力没问题,单卡也有b200一半了
这时候堆机器,成本可能不止降低4倍,可能更多咯.

ycjiang1337 发表于 2026-4-24 12:58

wiwiluo 发表于 2026-4-24 12:32
忘记在哪看的了，950性能相当于h20的水平？

论坛助手,iPhone

950 FP8算力是H20的四倍

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

Promeus 发表于 2026-4-24 12:59

飛霞精灵发表于 2026-4-24 12:54
用的是硅基流动还是DS官网自己的API？
我看硅基流动似乎还没更的样子？

官网api

羊寢发表于 2026-4-24 13:03

飛霞精灵发表于 2026-4-24 12:54
用的是硅基流动还是DS官网自己的API？
我看硅基流动似乎还没更的样子？

硅基肯定没这么快，官方才发了两个多小时，硅基再怎么也得等明天了(也有可能会更慢点，我记得之前硅基就有过拖了好几天才更新)

脸宽发表于 2026-4-24 13:06

这个谜语玩的是网络梗，谜底是**。

典故出自2021年网上热传的“西天懂佛”**雕像——因**常自称“没有人比我更懂……”，被戏称为“懂王”。谜面里的“过去懂、现在懂、未来懂、一切懂”正是调侃他无所不“懂”，坐西天成佛，就成了“西天懂佛”。
官方app专家模式，深度思考智能搜索开，19s。但是后面就出不了答案，很随机。不过这个谜语确实有点难。 Re:Source

绝地潜兵 发表于 2026-4-24 13:06

本帖最后由绝地潜兵于 2026-4-24 13:11 编辑

卧槽，两个价格相差那么多？
百万tokens输出 2元 24元

还行还行，试了一下deepseek-v4-flash也可以实现思考模式，比原来还更便宜了

overflowal 发表于 2026-4-24 13:09

v4-pro应该是还欠后训练，应该再等一下。 Re:Source

overflowal 发表于 2026-4-24 13:11

绝地潜兵发表于 2026-4-24 13:06
卧槽，两个价格相差那么多？
百万tokens输出 2元 24元
还行还行，试了一下deepseek-v4-flash ...

贵是因为芯片没有，等下半年上了华为的950超节点就降价。 Re:Source

holylight2020 发表于 2026-4-24 13:16

个人体验agentic 工程比sonnet略强。看价格的话我只能说完爆了

论坛助手,iPhone

whzfjd 发表于 2026-4-24 13:16

gemini 已经这么人嫌狗厌了吗，我拿来当外网豆包用的

绝地潜兵 发表于 2026-4-24 13:17

还不稳定，V4 API还在调试，又崩了

绝地潜兵 发表于 2026-4-24 13:17

whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗，我拿来当外网豆包用的
算力不行，牢美没电了，不然哈基米骚活一堆

Rowen233 发表于 2026-4-24 13:17

还吐槽了一下智谱经常系统繁忙智谱问要不要帮你开个号

ff2077 发表于 2026-4-24 13:21

有没有试过写小说的，flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha

88316756 发表于 2026-4-24 13:23

本帖最后由 88316756 于 2026-4-24 13:28 编辑

overflowal 发表于 2026-4-24 13:09
v4-pro应该是还欠后训练，应该再等一下。 Re:Source

嗯，是的，看过知乎nao的评价，v4智商是够的，后训练还不够充分，有的时候要抽卡。

我自己的体验就是，v4有能力答对问题，但不能稳定出正确答案，4.6o就能稳定出答案。

还有Engram也还没上，以及多模态也还在搞没弄完，后续可期。

所以这次v4还是挂了预览版的名义，正式版还有后续的4.x应该就会完善后训练，新的基模出了后，希望后续升级迭代快一点，这次等了快5个月，实在伤不起了。

big9999 发表于 2026-4-24 13:27

ff2077 发表于 2026-4-24 13:21
有没有试过写小说的，flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha ...

写小说最大的问题是写不长，短篇目前啥ai都能写出不错的

ff2077 发表于 2026-4-24 13:30

big9999 发表于 2026-4-24 13:27
写小说最大的问题是写不长，短篇目前啥ai都能写出不错的

之前ds上下文太短了老是记不住 v4终于也是1M了最近谷歌降智的厉害晚上试试v4了

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha

飛霞精灵 发表于 2026-4-24 13:30

就等网页版和app能不能更新上了。

→熙← 发表于 2026-4-24 13:30

opencode有办法让思考变中文吗, ds的中文会好一点吧

chuchoselph 发表于 2026-4-24 13:32

whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗，我拿来当外网豆包用的

算力严重不足，还瞎到处jb送pro，最近api都变弱智了，真想一拳打爆谷歌

AEmpire 发表于 2026-4-24 13:38

接 cc 试用了一下 pro，确实还可以。赶紧出 coding plan 吧，我要站起来蹬

88316756 发表于 2026-4-24 13:43

还有这次的1m上下文，可以说是最大的亮点之一，不要拿去年那些老模型的什么1M 2M的上下文来说事，那些只是开放了上下文窗口，实际注意力一坨，根本不能用。

这次V4的mrcr仅次于4.6o和刚发布的GPT 5.5，了，像4.6o 200K以上的上下文还要额外付费，到了4.7注意力还倒退了。而v4这次的新技术成本降低太多太多了，基本上是目前唯三可用的1m上下文模型。

JRPG 发表于 2026-4-24 13:43

ff2077 发表于 2026-4-24 13:21
有没有试过写小说的，flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha ...

长篇写小说无论是哪个模型，都会注意力涣散，就跟韩寒似的，写着写着角色竟然丢一个！？我觉得这个事情短时间内无解
我自己玩都得是自己提供框架，自己记着谁该怎么了，提示给大模型让它们写

cloudinsky 发表于 2026-4-24 13:48

小说得按照大型工程来吧。先给整体框架约束。提前规划好啊，每一章节精炼后给到上下文。

完全全文扔进去谁都扛不住

Rowen233 发表于 2026-4-24 13:50

飛霞精灵发表于 2026-4-24 13:30
就等网页版和app能不能更新上了。

已经更了

忧郁的杰哥 发表于 2026-4-24 13:50

Promeus 发表于 2026-4-24 13:53

https://p.sda1.dev/32/624af6076f78df9b6b1d5017abab2f9f/image.jpg

羊寢发表于 2026-4-24 13:55

Promeus 发表于 2026-4-24 13:53

v5还不至于，现在上面的应该换成v4正式版

绝地潜兵 发表于 2026-4-24 13:55

思考链里面生成的心理活动怎么比输出的正文还生动，字数还多

半江瑟瑟半江红 发表于 2026-4-24 13:56

ff2077 发表于 2026-4-24 13:21
有没有试过写小说的，flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha ...

当然能。D指导写小说算文笔不错的那一类

—— 来自 HUAWEI WGRR-W19, Android 12, 鹅球 v3.5.99-alpha

Su7 发表于 2026-4-24 13:56

chuchoselph 发表于 2026-4-24 13:32
算力严重不足，还瞎到处jb送pro，最近api都变弱智了，真想一拳打爆谷歌

gemini像阿尔兹海默症一样。有时候和他聊，他突然提起了几个月前说过的话。平时聊天不记，他妈的，做事时候回忆起好久之前的话，把我的任务给搞混掉。

半江瑟瑟半江红 发表于 2026-4-24 13:57

whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗，我拿来当外网豆包用的

傻逼GEMINI经常连一个4000字文档都不读完搁哪瞎扯，上下文记忆力更是可以用悲剧来形容，也就官方渠道依托它家自己的谷歌搜索当高级搜索引擎用还凑合

—— 来自 HUAWEI WGRR-W19, Android 12, 鹅球 v3.5.99-alpha

勿徊哉 发表于 2026-4-24 13:59

绝地潜兵发表于 2026-4-24 13:55
思考链里面生成的心理活动怎么比输出的正文还生动，字数还多

我特别喜欢ds这一点，比其他家故意把思考过程藏起来防止蒸馏要好太多了。
而且有时候虽然回答不是我想要的，但是思考过程很有启发性。 Re:Source

绝地潜兵 发表于 2026-4-24 14:02

勿徊哉发表于 2026-4-24 13:59
我特别喜欢ds这一点，比其他家故意把思考过程藏起来防止蒸馏要好太多了。
而且有时候虽然回答不是我想要 ...
不是这个问题，我发给哈基米分析，它说这简直是**“满级剧本”和“精简版预告片”**的区别。
妹的，思考链里面不是思考过程，而是铺开了一部小电影……
比3.2的时候夸张多了

奥柏伦亲王 发表于 2026-4-24 14:06

用手机app试了一下，体感比V3.2好多了，这下可以试着用d师傅当agent的基座了

zris 发表于 2026-4-24 14:06

ds要prompt约束

不然很容易干燥

gemini 3pro刚出来那会，巧思和段子不断

拿来airp简直无敌

现在若只的难以附加，所以···

谷出还是去死吧

有鱼发表于 2026-4-24 14:07

一般市民 发表于 2026-4-24 14:07

我以前和Gemini说鲸鱼的时候，Gemini会吐槽鲸鱼喜欢过度推理炫技。

页: 11 12 13 14 15 16 17 18 19 20 [21] 22 23 24 25 26 27 28 29 30

Stage1st's Archiver