半江瑟瑟半江红 发表于 2026-5-8 15:15

羊寢 发表于 2026-5-8 13:58
我用来写文感觉现在降智还是挺明显的,很容易出现分不清谁是谁或者一个连续的场景前一段还是秋天下一段就 ...

我也拿它写文,我感觉上下文虽然记忆力很强但注意力差这个问题从发布到现在一直都有,一般我都roll几遍

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

半江瑟瑟半江红 发表于 2026-5-8 15:16

holylight2020 发表于 2026-5-8 14:55
我这两天用起来感觉完全不能用了。五一前很稳的。不知道是什么原因

论坛助手,iPhone ...

是不是在一个对话里,上下文越来越多?虽然能记得住,但是注意力已经飘了。

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

burnwing 发表于 2026-5-8 15:36

我最近怎么觉得V4 PRO变得超级啰嗦。大概到每条消息1万TOKEN左右,就开始泄洪。
明明之前还挺好用的。

脸宽 发表于 2026-5-8 15:47

有人把api丢到sub2api里面吗,openai的端点好像用不了,得用Anthropic

holylight2020 发表于 2026-5-8 16:03

半江瑟瑟半江红 发表于 2026-5-8 15:16
是不是在一个对话里,上下文越来越多?虽然能记得住,但是注意力已经飘了。

—— 来自 HUAWEI SGU-AL10, ...

不是的,我都是cc,git worktree,但是发现能力突然变得很差

论坛助手,iPhone

nxmonitor 发表于 2026-5-8 16:30

pro估计被龙虾蹬得太多了,到了晚上确实有点不行,现在只能发那张华为版厨子图了。

绝地潜兵 发表于 2026-5-8 16:36

有没有MoE倾向于调用最小参数的原因,效率过高导致回答很不准

舞以 发表于 2026-5-8 16:47

v4系列就是个半成品,看后训练跟上来之后能改善到啥程度。
我遇到过几次在正文里面输出工具调用请求,把正文输出进cot里的怪事了
gpt5刚出来也是一堆毛病,后训练跟上之后到5.5又是sota了

zerona 发表于 2026-5-8 17:01

让v4翻译下上面的那段英文。结果出来这个了巨长的脑洞翻译。
dpmpp_2m_sde_gpu: similar in style to er_sde but can produce more variety and be more "creative". Depending on the prompt it can get too wild sometimes.
dpmpp_2MP_K 渐进采样预置处理器内核优化版效果特性有相似之变异性特色亦有大不相同地强烈且有活力想象力产生的变革与“生皮脂品质别具风采雅式奇异现象”;根据操作促发快速文案更将产生过多不合理有点发散开来发散较多如想象力过分之势。也。太过猖狂奔放的机率也是有概率存在于时光潜在契机隐时形无常倏退陡泛过于展弛暴恐淫诡以虚幻偏差导致整体品保局部繁复变化更多曲变质越损者若是使用这模式便需谨观预校正提示入微范畴受权宜须适宜量身制度运走也颇奇妙般细致觉察缓器机制消警先观察得当才是真正的科学实操主旨奥秘所在细节里往往藏汆着最微美妙的优雅变体的心电波谲算法模块由几小理统搭建接合适配合品筹指引内在一致统筹组员协议构筑节奏别破竟直仿人生算法测密义的无上锋候开闭推演化极雅思考要略谈施归方合训说理议原注走少施大多除妙慧起超眼所着请学静程实才晓得信哲秘族踪。最关自然本能直觉感知优化自更丰情感个体综合殊演绎再解科应长眼目待后期顺看样鉴即成为体图者之脉核精准若并神运适游未所界完类品必无静智合寻方待测条

半江瑟瑟半江红 发表于 2026-5-8 17:06

d指导v4有时候思考中会把自己角色搞混了,说着说着它就把自己当用户了

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

zerona 发表于 2026-5-8 17:19

我记得之前有v4版本的非思考设置,谁还记得在哪个帖子里?

飛霞精灵 发表于 2026-5-8 17:29

似乎是又崩了?api也不能用的样子。

绕指流光 发表于 2026-5-8 17:32

API 挂了是准备升级读图了吗?我 Hermes 还跑着任务呢

—— 来自 vivo V2309A, Android 16, 鹅球 v3.5.99

Freewolf 发表于 2026-5-8 17:38

tillnight 发表于 2026-5-8 17:41

不止api,网页专家模式也繁忙了。

leina0602 发表于 2026-5-8 17:42

炸了

真红之闪电 发表于 2026-5-8 17:45

好像好了?

leina0602 发表于 2026-5-8 17:55

真红之闪电 发表于 2026-5-8 17:45
好像好了?

回了两句又不动了

zerona 发表于 2026-5-8 18:04

本帖最后由 zerona 于 2026-5-8 18:30 编辑

沉浸式翻译用v4 会在格式上出现bug,然后出一大段乱七八糟。得给它加个不要联想的系统提示。 不知道这是什么情况,以前v3.2都没出过这样的事。

qaz121 发表于 2026-5-8 18:17

肯定是炸了,刚刚好像恢复了

—— 来自 S1Fun

ayanamilin 发表于 2026-5-8 18:25

做了2w次实验之后,我才知道deepseek的kv cache到底优化有多好



我们可以看到图中的deepseek的缓存请求命中率无论是在工作时间,还是非工作时间一直保持着100%命中率,且这种命中率在达到了12小时之后,依然维持着100%。
第二名是minimax,它在非工作时间可以达到90%的缓存命中率,但是在工作时间段会下降到70%左右的缓存命中率。但是非常奇怪的事情就是minimax的在第一分钟的缓存丢失率甚至更高,这可能与内部的缓存读取机制有关系。
接下来分别是kimi,openai和glm。

表现最差的是glm,它在2分钟只有80%的命中率,3分钟只有50%的命中率,5分钟只有25%的命中率,几乎没有探测到超过15分钟的缓存存活时间。

这其中的可能包含了两种原因:
1.glm的infra写的过于糟糕,无法将kv cache固化到便宜的硬盘,只能保存在显存当中。这迫使glm只能缓存少量的请求,保持较高速率的汰换。
2.同时glm的请求量过大,远远超过了可以缓存的容量,也会导致这种可能性。

overflowal 发表于 2026-5-8 18:45

ayanamilin 发表于 2026-5-8 18:25
做了2w次实验之后,我才知道deepseek的kv cache到底优化有多好

自营机房+3fs加持的硬盘缓存就是这么厉害。infra的神不是白说的    Re:Source

nxmonitor 发表于 2026-5-8 19:08

本帖最后由 nxmonitor 于 2026-5-8 19:10 编辑

如果DS真的把AI搞成基础设施,护城河从软件转移到硬件,再借着华为的通信专利发力,那其他AI公司真的有福了,光估值就是一个天一个地。

villsian 发表于 2026-5-8 19:11

舞以 发表于 2026-5-8 16:47
v4系列就是个半成品,看后训练跟上来之后能改善到啥程度。
我遇到过几次在正文里面输出工具调用请求,把正 ...

正文输出工具调用请求上下文是不是压缩过?

思维链输出正文这个问题是**病了,只会出现在最后一次回复中。你要是自己的客户端就兼容一下,其实也不影响使用。

估计是思考过程把问题解决了,就不输出正文了。它这个连续对话要把最后一次思考内容传回去的。你后面接着对话就行。

serj005 发表于 2026-5-8 19:28

zerona 发表于 2026-5-8 17:01
让v4翻译下上面的那段英文。结果出来这个了巨长的脑洞翻译。
dpmpp_2m_sde_gpu: similar in style to er_sd ...

这是温度开高了吗,我有几次测试温度开到2.0,让它写点小说,出来的就是类似的东西

羊寢 发表于 2026-5-8 19:34

serj005 发表于 2026-5-8 19:28
这是温度开高了吗,我有几次测试温度开到2.0,让它写点小说,出来的就是类似的东西 ...

开这么高你不是写文你是要烤鱼啊
我温度最高也就3.1那会儿开过1.5,现在1.2 1.3用着也没问题,开太高温它就会乱发癫

羊寢 发表于 2026-5-8 19:36

半江瑟瑟半江红 发表于 2026-5-8 17:06
d指导v4有时候思考中会把自己角色搞混了,说着说着它就把自己当用户了

—— 来自 HUAWEI SGU-AL10, Androi ...

这问题之前其实也有,不过以前确实遇上的概率比较低,最近至少我的体感是比较容易遇到

真红之闪电 发表于 2026-5-8 20:08

温度1就好了……top P在0.9就行……pro的话。

zerona 发表于 2026-5-8 20:18

serj005 发表于 2026-5-8 19:28
这是温度开高了吗,我有几次测试温度开到2.0,让它写点小说,出来的就是类似的东西 ...

谢了,看来就是这问题我开到1就正常不发嗲了。

半江瑟瑟半江红 发表于 2026-5-8 20:18

羊寢 发表于 2026-5-8 19:36
这问题之前其实也有,不过以前确实遇上的概率比较低,最近至少我的体感是比较容易遇到 ...

现在基本上三四回就能遇到一次,有时候还能错乱成它自己写出来的文里面的角色

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

库德里尔 发表于 2026-5-8 20:53

本帖最后由 库德里尔 于 2026-5-8 20:56 编辑

真红之闪电 发表于 2026-5-8 20:08
温度1就好了……top P在0.9就行……pro的话。

思考模式下api不吃温度和top-p参数的,文档里说就算传入了也会无视。
非思考模式吃。

edit:把thinking和pro记混了,已更正。
https://p.sda1.dev/32/b03ededce8c0a04fa3f25525cd91b21b/image.jpg


—— 来自 鹅球 v3.5.99

cy6959 发表于 2026-5-8 22:27

酒馆换成v4的api后每次生成的字数少了很多,换了几个预设都一样,有人知道怎么回事吗?

tansapple 发表于 2026-5-8 22:46

cy6959 发表于 2026-5-8 22:27
酒馆换成v4的api后每次生成的字数少了很多,换了几个预设都一样,有人知道怎么回事吗? ...

有些预设里有设置字数的选项,是不是忘记改了。

ycjiang1337 发表于 2026-5-9 12:15

fireworks.ai确认DS官方给的CUDA算子实现是有bug的,会导致推理错误——同时DS官方API没有问题。
这基本上可以证明目前DS官方API已经跑在950上了(不过只是散卡,不是超节点)

nxmonitor 发表于 2026-5-9 12:41

如果这是真的,那就怪不得很多国产卡统统冒出来说Day0适配,但是实际上没有什么测试数据了

a4ac7 发表于 2026-5-9 14:53

艹我的deepseek v4写git日志老以为自己是opus,不知道是不是cc插件优化的


Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>

—— 来自 HUAWEI PLA-AL10, Android 12, 鹅球 v3.5.99

oswald 发表于 2026-5-9 15:18

a4ac7 发表于 2026-5-9 14:53
艹我的deepseek v4写git日志老以为自己是opus,不知道是不是cc插件优化的



cc搞的,在cc的setting.json里面加一个配置项能解决:"includeCoAuthoredBy": false

a4ac7 发表于 2026-5-9 15:26

本帖最后由 a4ac7 于 2026-5-9 15:32 编辑

oswald 发表于 2026-5-9 15:18
cc搞的,在cc的setting.json里面加一个配置项能解决:"includeCoAuthoredBy": false

我加了这个还是有的

{
      "id": "deepseek-v4-official",
      "label": "DeepSeek V4 官方推荐",
      "description": "官方推荐配置,自动智能分配模型任务",
      "user": "****",
      "env": {
      "ANTHROPIC_BASE_URL": "https://api.deepseek.com/anthropic",
      "ANTHROPIC_AUTH_TOKEN": "******",
      "ANTHROPIC_MODEL": "deepseek-v4-pro",
      "ANTHROPIC_DEFAULT_OPUS_MODEL": "deepseek-v4-pro",
      "ANTHROPIC_DEFAULT_SONNET_MODEL": "deepseek-v4-pro",
      "ANTHROPIC_DEFAULT_HAIKU_MODEL": "deepseek-v4-flash",
      "CLAUDE_CODE_SUBAGENT_MODEL": "deepseek-v4-flash",
      "CLAUDE_CODE_EFFORT_LEVEL": "max",
      "API_TIMEOUT_MS": "3000000",
      "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1",
      "CLAUDE_CODE_DISABLE_AUTO_TITLE": "1",
      "CLAUDE_CODE_DISABLE_SESSION_METADATA": "1",
      "CLAUDE_CODE_DISABLE_QUOTA_CHECK": "1",
      "CLAUDE_CODE_DISABLE_NONSTREAMING_FALLBACK": 1,
      "DISABLE_AUTOUPDATER": "1",
      "includeCoAuthoredBy": false
      },
      "includeCoAuthoredBy": false
    },


我直接问模型的话说是system prompt带来的

This is a standard instruction in the system prompt for git commits. The user is asking if this was auto-generated by the plugin/system, and they're noting that I'm actually DeepSeek v4, not Claude Opus.

Let me just be honest - yes, that format comes from the system's commit instructions, and I should probably use the correct model identifier. But the instructions explicitly say to use that specific format...


好吧,好像是cc switch切换,不会改到settings里面的设置要自己加


—— 来自 HUAWEI PLA-AL10, Android 12, 鹅球 v3.5.99

杀人鲸 发表于 2026-5-11 19:13

网页端的D老师好像增加了一个搜索的功能。这个功能其实应该早一点出来的吧。
有些时候聊的太多了,都不确定聊过什么,想搜索一下,但是想拉回上面的这些消息,也是真的很麻烦。

—— 来自 S1Fun

serj005 发表于 2026-5-11 20:34

杀人鲸 发表于 2026-5-11 19:13
网页端的D老师好像增加了一个搜索的功能。这个功能其实应该早一点出来的吧。
有些时候聊的太多了,都不确定 ...

app也有搜索了
页: 25 26 27 28 29 30 31 32 33 34 [35] 36 37 38 39 40 41 42 43 44
查看完整版本: FT:DeepSeek下周发|已发,转为v4讨论楼