飛霞精灵 发表于 2026-4-24 12:54

Promeus 发表于 2026-4-24 12:42
猜出来了啊

用的是硅基流动还是DS官网自己的API?
我看硅基流动似乎还没更的样子?

ycjiang1337 发表于 2026-4-24 12:54

灰色的狐狸 发表于 2026-4-24 11:54
950这个本来就预计是q3吧

950超节点是Q3,Q1已经出了普通的卡

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

phorcys02 发表于 2026-4-24 12:55

ayanamilin 发表于 2026-4-24 12:45
vLLM day 0 support 了, DeepSeek V4 需要在 Hopper 或者 Blackwell 架构下部署才能享受完全的加速:https ...

其实硬障碍是hbm, 推理卡的需要 算力/带宽 均衡,哪个太高都是浪费
950pr就是这个权衡下的产品, HiBL第一代只有1T多带宽,所以950pr算力只有910c的一半
得等hbm/HiBL带宽起来, 单卡算力可以相对简单堆上去
那时候系统成本就真的下来了, 比如HiBL下一代能有4T+带宽,那堆个4倍950pr算力没问题,单卡也有b200一半了
这时候堆机器,成本可能不止降低4倍,可能更多咯.

ycjiang1337 发表于 2026-4-24 12:58

wiwiluo 发表于 2026-4-24 12:32
忘记在哪看的了,950性能相当于h20的水平?

论坛助手,iPhone

950 FP8算力是H20的四倍

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

Promeus 发表于 2026-4-24 12:59

飛霞精灵 发表于 2026-4-24 12:54
用的是硅基流动还是DS官网自己的API?
我看硅基流动似乎还没更的样子?

官网api

羊寢 发表于 2026-4-24 13:03

飛霞精灵 发表于 2026-4-24 12:54
用的是硅基流动还是DS官网自己的API?
我看硅基流动似乎还没更的样子?

硅基肯定没这么快,官方才发了两个多小时,硅基再怎么也得等明天了(也有可能会更慢点,我记得之前硅基就有过拖了好几天才更新)

脸宽 发表于 2026-4-24 13:06

这个谜语玩的是网络梗,谜底是**。

典故出自2021年网上热传的“西天懂佛”**雕像——因**常自称“没有人比我更懂……”,被戏称为“懂王”。谜面里的“过去懂、现在懂、未来懂、一切懂”正是调侃他无所不“懂”,坐西天成佛,就成了“西天懂佛”。
官方app专家模式,深度思考智能搜索开,19s。但是后面就出不了答案,很随机。不过这个谜语确实有点难。    Re:Source

绝地潜兵 发表于 2026-4-24 13:06

本帖最后由 绝地潜兵 于 2026-4-24 13:11 编辑

卧槽,两个价格相差那么多?
百万tokens输出      2元      24元

还行还行,试了一下deepseek-v4-flash也可以实现思考模式,比原来还更便宜了

overflowal 发表于 2026-4-24 13:09

v4-pro应该是还欠后训练,应该再等一下。    Re:Source

overflowal 发表于 2026-4-24 13:11

绝地潜兵 发表于 2026-4-24 13:06
卧槽,两个价格相差那么多?
百万tokens输出      2元      24元
还行还行,试了一下deepseek-v4-flash ...

贵是因为芯片没有,等下半年上了华为的950超节点就降价。    Re:Source

holylight2020 发表于 2026-4-24 13:16

个人体验agentic 工程比sonnet略强。看价格的话我只能说完爆了

论坛助手,iPhone

whzfjd 发表于 2026-4-24 13:16

gemini 已经这么人嫌狗厌了吗,我拿来当外网豆包用的

绝地潜兵 发表于 2026-4-24 13:17

还不稳定,V4 API还在调试,又崩了

绝地潜兵 发表于 2026-4-24 13:17

whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗,我拿来当外网豆包用的
算力不行,牢美没电了,不然哈基米骚活一堆

Rowen233 发表于 2026-4-24 13:17


还吐槽了一下智谱经常系统繁忙 智谱问要不要帮你开个号

ff2077 发表于 2026-4-24 13:21

有没有试过写小说的,flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha

88316756 发表于 2026-4-24 13:23

本帖最后由 88316756 于 2026-4-24 13:28 编辑

overflowal 发表于 2026-4-24 13:09
v4-pro应该是还欠后训练,应该再等一下。    Re:Source

嗯,是的,看过知乎nao的评价,v4智商是够的,后训练还不够充分,有的时候要抽卡。

我自己的体验就是,v4有能力答对问题,但不能稳定出正确答案,4.6o就能稳定出答案。

还有Engram也还没上,以及多模态也还在搞没弄完,后续可期。


所以这次v4还是挂了预览版的名义,正式版还有后续的4.x应该就会完善后训练,新的基模出了后,希望后续升级迭代快一点,这次等了快5个月,实在伤不起了。

big9999 发表于 2026-4-24 13:27

ff2077 发表于 2026-4-24 13:21
有没有试过写小说的,flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha ...

写小说最大的问题是写不长,短篇目前啥ai都能写出不错的

ff2077 发表于 2026-4-24 13:30

big9999 发表于 2026-4-24 13:27
写小说最大的问题是写不长,短篇目前啥ai都能写出不错的

之前ds上下文太短了 老是记不住 v4终于也是1M了 最近谷歌降智的厉害 晚上试试v4了

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha

飛霞精灵 发表于 2026-4-24 13:30

就等网页版和app能不能更新上了。

→熙← 发表于 2026-4-24 13:30

opencode有办法让思考变中文吗, ds的中文会好一点吧

chuchoselph 发表于 2026-4-24 13:32

whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗,我拿来当外网豆包用的

算力严重不足,还瞎到处jb送pro,最近api都变弱智了,真想一拳打爆谷歌

AEmpire 发表于 2026-4-24 13:38

接 cc 试用了一下 pro,确实还可以。赶紧出 coding plan 吧,我要站起来蹬

88316756 发表于 2026-4-24 13:43

还有这次的1m上下文,可以说是最大的亮点之一,不要拿去年那些老模型的什么1M 2M的上下文来说事,那些只是开放了上下文窗口,实际注意力一坨,根本不能用。


这次V4的mrcr仅次于4.6o和刚发布的GPT 5.5,了,像4.6o 200K以上的上下文还要额外付费,到了4.7注意力还倒退了。而v4这次的新技术成本降低太多太多了,基本上是目前唯三可用的1m上下文模型。

JRPG 发表于 2026-4-24 13:43

ff2077 发表于 2026-4-24 13:21
有没有试过写小说的,flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha ...

长篇写小说无论是哪个模型,都会注意力涣散,就跟韩寒似的,写着写着角色竟然丢一个!?我觉得这个事情短时间内无解
我自己玩都得是自己提供框架,自己记着谁该怎么了,提示给大模型让它们写

cloudinsky 发表于 2026-4-24 13:48

小说得按照大型工程来吧。先给整体框架约束。提前规划好啊,每一章节精炼后给到上下文。

完全全文扔进去谁都扛不住

Rowen233 发表于 2026-4-24 13:50

飛霞精灵 发表于 2026-4-24 13:30
就等网页版和app能不能更新上了。

已经更了

忧郁的杰哥 发表于 2026-4-24 13:50

Promeus 发表于 2026-4-24 13:53

https://p.sda1.dev/32/624af6076f78df9b6b1d5017abab2f9f/image.jpg

羊寢 发表于 2026-4-24 13:55

Promeus 发表于 2026-4-24 13:53


v5还不至于,现在上面的应该换成v4正式版

绝地潜兵 发表于 2026-4-24 13:55

思考链里面生成的心理活动怎么比输出的正文还生动,字数还多

半江瑟瑟半江红 发表于 2026-4-24 13:56

ff2077 发表于 2026-4-24 13:21
有没有试过写小说的,flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha ...

当然能。D指导写小说算文笔不错的那一类

—— 来自 HUAWEI WGRR-W19, Android 12, 鹅球 v3.5.99-alpha

Su7 发表于 2026-4-24 13:56

chuchoselph 发表于 2026-4-24 13:32
算力严重不足,还瞎到处jb送pro,最近api都变弱智了,真想一拳打爆谷歌

gemini像阿尔兹海默症一样。有时候和他聊,他突然提起了几个月前说过的话。平时聊天不记,他妈的,做事时候回忆起好久之前的话,把我的任务给搞混掉。

半江瑟瑟半江红 发表于 2026-4-24 13:57

whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗,我拿来当外网豆包用的

傻逼GEMINI经常连一个4000字文档都不读完搁哪瞎扯,上下文记忆力更是可以用悲剧来形容,也就官方渠道依托它家自己的谷歌搜索当高级搜索引擎用还凑合

—— 来自 HUAWEI WGRR-W19, Android 12, 鹅球 v3.5.99-alpha

勿徊哉 发表于 2026-4-24 13:59

绝地潜兵 发表于 2026-4-24 13:55
思考链里面生成的心理活动怎么比输出的正文还生动,字数还多

我特别喜欢ds这一点,比其他家故意把思考过程藏起来防止蒸馏要好太多了。
而且有时候虽然回答不是我想要的,但是思考过程很有启发性。    Re:Source

绝地潜兵 发表于 2026-4-24 14:02

勿徊哉 发表于 2026-4-24 13:59
我特别喜欢ds这一点,比其他家故意把思考过程藏起来防止蒸馏要好太多了。
而且有时候虽然回答不是我想要 ...
不是这个问题,我发给哈基米分析,它说这简直是**“满级剧本”和“精简版预告片”**的区别。
妹的,思考链里面不是思考过程,而是铺开了一部小电影……
比3.2的时候夸张多了

奥柏伦亲王 发表于 2026-4-24 14:06

用手机app试了一下,体感比V3.2好多了,这下可以试着用d师傅当agent的基座了

zris 发表于 2026-4-24 14:06

ds要prompt约束

不然很容易干燥

gemini 3pro刚出来那会,巧思和段子不断

拿来airp简直无敌

现在若只的难以附加,所以···

谷出还是去死吧

有鱼 发表于 2026-4-24 14:07

一般市民 发表于 2026-4-24 14:07

我以前和Gemini说鲸鱼的时候,Gemini会吐槽鲸鱼喜欢过度推理炫技。
页: 11 12 13 14 15 16 17 18 19 20 [21] 22 23 24 25 26 27 28 29 30
查看完整版本: FT:DeepSeek下周发|已发,转为v4讨论楼