FT：DeepSeek下周发｜已发，转为v4讨论楼

脸宽 · 发表于 2026-5-2 15:35

音频我觉得豆包真的音频真的很真人，语气啊都太真了

Rowen233 · 发表于 2026-5-3 11:37

对于coding agent出现的框架兼容问题在修了

真红之闪电 · 发表于 2026-5-3 14:55

有鱼发表于 2026-5-2 11:13
cherry studio更新了对v4系列思考强度的适配

这个设定在哪里

Lorraine_Kinney · 发表于 2026-5-3 15:09

真红之闪电发表于 2026-5-3 14:55
这个设定在哪里

就是对话那的灯泡可以调思考强度，之前都是A?没法调

龙骑将 · 发表于 2026-5-7 13:52

最近玩了一下骑马与砍杀2的AI效应mod，一开始玩相当惊艳，虽然玩多会感觉到局限还是很多，不过考虑到这是玩家自制的小mod，又感觉还行了，潜力远大。
另外我用的deepseek接入的游戏，玩了一天，虽然是5月特价，但也干了差不多10块钱的api。也许是我用的成人版ai效应mod的缘故，正常和npc聊天消耗的额度并不是很多，一聊黄色就花花的掉(不过deepseek懂得好多啊)

冤枉呐 · 发表于 2026-5-7 13:57

龙骑将发表于 2026-5-7 13:52
最近玩了一下骑马与砍杀2的AI效应mod，一开始玩相当惊艳，虽然玩多会感觉到局限还是很多，不过考虑到这是玩 ...

我靠，科技已经发展到这个程度了嘛！

—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99

UmarIbnLaAhad · 发表于 2026-5-7 13:57

廉价的1m上下文太爽了，一整本厕纸扔进去梳理剧情+给太监文续吊不是梦

Nanachi · 发表于 2026-5-7 14:02

各种 benchmark 好像就是完成同样的任务，deepseek 需要的token量多很多，可能后训练还有很大提升空间，GPT 5.0 其实 reasoning token 量也比后续的模型多很多

论坛助手,iPhone

holmesjerry · 发表于 2026-5-7 14:09

UmarIbnLaAhad 发表于 2026-5-7 13:57
廉价的1m上下文太爽了，一整本厕纸扔进去梳理剧情+给太监文续吊不是梦

这几天试了能给太监的皇叔续写十几万字不是问题

ayanamilin · 发表于 2026-5-7 14:24

本帖最后由 ayanamilin 于 2026-5-7 14:25 编辑

Token efficiency 这块好像没有比 GPT-5.5 做得更好的了（现在还出了 Instant 模式），贴张我的使用记录，奥特曼说虽然 5.5 虽然定价更贵，但是实际上更便宜不是不无道理的

泰坦失足 · 发表于 2026-5-7 15:24

本帖最后由泰坦失足于 2026-5-7 15:27 编辑

用了两天的Opencode+DS V4 pro(max)/Mimo V2.5 Pro(High). 感觉V4略好于Mimo. 以10分满分, 我一个要求下去它自己完成一个中小型任务(耗时半小时)来看, GPT 5.4 veryhigh 9分, DS V4 7分, Mimo 2.5 pro 6分, Antigravity里的Gemini/Opus直接零分.
最适合的使用方式就是对于不紧急的任务, 打开Opencode+DS让它自己琢磨去. 反正token几乎不要钱.
还有就是让DS/Mimo两兄弟干活, 怎么还能给我旧代码加上新bug. 最后两兄弟来回切换都完成不了任务, 切到GPT一看才发现问题. 下次碰到这问题得反查下opencode聊天记录. 看看到底是哪个模型干的. 目前抓到过一次Mimo正在不紧不慢的给我的旧代码加我根本不需要的新结构.

overflowal · 发表于 2026-5-7 15:40

本帖最后由 overflowal 于 2026-5-7 15:51 编辑

ayanamilin 发表于 2026-5-7 14:24
Token efficiency 这块好像没有比 GPT-5.5 做得更好的了（现在还出了 Instant 模式），贴张我的使用记录， ...

gpt5.5可能比deepseek v4大一个数量级，据说10T。小的模型要更强的任务完成能力，那就要多加思考token Re:Source

龙骑将 · 发表于 2026-5-7 17:42

冤枉呐发表于 2026-5-7 13:57
我靠，科技已经发展到这个程度了嘛！

—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99 ...

实际效果接近于在骑马与砍杀里，进行跑团，和npc对话，直接用文字聊天，npc应该是随机生成的任务，也是以文字的方式进行，不过不同npc之间并没有关联。比如向一个贵妇求婚，她会说自己有老公了，而且这事得由她族长同意，接着去找他的族长，帮族长一个大忙后，许可贵妇离婚再嫁，但是要贵妇的丈夫同意，去找她丈夫，谈崩了绝对，文字对话的方式战胜对方(xxx闻言勃然大怒，拔剑便刺，我输入，侧身闪避，同时打落对方长剑等等)。之后去找贵妇告诉她这个消息，贵妇同意求婚，族长也祝福我们天长地久，百年好合之类的。
但是，这一切中的每一个环节都是没啥信息传递的，我感觉一开始就直接跟贵妇说你的老公被我打败了，你的族长同意了，也应该能行，不用跑那么一大圈。
但是第一次遇到代入感还是很足的。
至于涩涩的部分，因为游戏里原本就有人物家族关系，所以更有趣一些(胁迫女战俘，勾引女皇，霍霍一个家族全部女性等等)，我主要时间和token都花这上了。。。

另外看网友说，这个mod还可以做到，诈骗npc，挑拨两国交战或长久和平之类的功能，只能说未来可期啊未来可期

冤枉呐 · 发表于 2026-5-7 17:58

龙骑将发表于 2026-5-7 17:42
实际效果接近于在骑马与砍杀里，进行跑团，和npc对话，直接用文字聊天，npc应该是随机生成的任务，也是以 ...

不得了了！
要是拿这玩意配合辐射，老滚这些本来就有实验室的……
或者更开放一点的世界，配合生图
还得了？

—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99

冤枉呐 · 发表于 2026-5-7 18:00

这两天跟DeepSeek鉴证吵架吵爽了

—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99

龙骑将 · 发表于 2026-5-7 18:06

冤枉呐发表于 2026-5-7 17:58
不得了了！
要是拿这玩意配合辐射，老滚这些本来就有实验室的……
或者更开放一点的世界，配合生图

我也这么想的，甚至这mod本身就有ai语音输出功能，如果再加上ai语音输入，以后就可能用言语和npc交流，影响故事走向，命令它们行动了

莱茵哈鲁特 · 发表于 2026-5-7 23:57

冤枉呐 · 发表于 2026-5-8 00:38

龙骑将发表于 2026-5-7 18:06
我也这么想的，甚至这mod本身就有ai语音输出功能，如果再加上ai语音输入，以后就可能用言语和npc交流，影 ...

其实等于是大型酒馆
无非就是对话用个接口发过去

—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99

杀人鲸 · 发表于 2026-5-8 05:59

识图功能是不是已经全面铺开了？我之前没有灰度到，但现在无论是手机还是电脑上都已经刷出来了。

—— 来自 S1Fun

orca · 发表于 2026-5-8 07:35

杀人鲸发表于 2026-5-8 05:59
识图功能是不是已经全面铺开了？我之前没有灰度到，但现在无论是手机还是电脑上都已经刷出来了。

—— 来 ...

不是

Litccc · 发表于 2026-5-8 08:36

还真推了

羊寢 · 发表于 2026-5-8 08:43

并没有

杀人鲸 · 发表于 2026-5-8 09:04

orca 发表于 2026-5-8 07:35
不是

那看来最多只能算是新的灰度测试、二度推广。但二度测试都开始的话，一而再再而三，下一**概就该全面推广了吧？

—— 来自 S1Fun

verniy · 发表于 2026-5-8 09:25

为什么还灰度到我

—— 来自 Xiaomi 2312DRA50C, Android 15, 鹅球 v3.5.99-alpha

overflowal · 发表于 2026-5-8 09:38

怎么还没灰度到我啊 Re:Source

厍无春 · 发表于 2026-5-8 09:42

overflowal 发表于 2026-5-8 09:38
怎么还没灰度到我啊 Re:Source

没事，这个识图目前没有联网搜索，识别率可用性堪忧，还不如豆包好使

sodasoul · 发表于 2026-5-8 09:45

试了下没有豆包好用，豆包傻归傻，多模态这块没得说

zerona · 发表于 2026-5-8 10:49

测试了下，感觉看的还行，但是有时候是它理解不到 “逻辑服务于美观” 的这种“故意画错”的风格。

serj005 · 发表于 2026-5-8 11:08

识图当做个更高级的ocr还可以，以前直接把网上别人随手发的推特、红迪之类截图的甩给ds，对文字排版换行啥的容易理解错。
现在这个识图能理解各个文本区域了，让他翻译解释效果好很多。

秦南心 · 发表于 2026-5-8 11:37

这个识图是基于之前年初升级版的ocr逻辑来做的，模仿注意力机制用推理逻辑去看图

cyberalogo · 发表于 2026-5-8 11:46

DS这个识图功能能分辨喂的图是不是AI图吗？

overflowal · 发表于 2026-5-8 12:04

cyberalogo 发表于 2026-5-8 11:46
DS这个识图功能能分辨喂的图是不是AI图吗？

不能，号称能分辨的其实也不靠谱。 Re:Source

holylight2020 · 发表于 2026-5-8 12:06

有没有人觉得五一后的v4pro降智了

论坛助手,iPhone

bbvcv · 发表于 2026-5-8 13:42

DeepSeek为什么这么不重视多模态，光靠逻辑推理不行吧

半江瑟瑟半江红 · 发表于 2026-5-8 13:43

holylight2020 发表于 2026-5-8 12:06
有没有人觉得五一后的v4pro降智了

论坛助手,iPhone

没感觉降智，但我觉得它一直生成质量很不稳定

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

羊寢 · 发表于 2026-5-8 13:58

本帖最后由羊寢于 2026-5-8 14:01 编辑

半江瑟瑟半江红发表于 2026-5-8 13:43
没感觉降智，但我觉得它一直生成质量很不稳定

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99 ...

我用来写文感觉现在降智还是挺明显的，很容易出现分不清谁是谁或者一个连续的场景前一段还是秋天下一段就变成冬天的情况
今天早上也是刚跑出来一段前一句写角色a买东西找钱被人碰了一下皱了皱眉头，下一句变成角色a在心中想着角色b原来不喜欢被人触碰。类似的细节逻辑问题基本每次都会遇上点，总不可能我每次都刚好roll到质量差的那档吧

overflowal · 发表于 2026-5-8 14:01

羊寢发表于 2026-5-8 13:58
我用来写文感觉现在降智还是挺明显的，很容易出现分不清谁是谁或者一个连续的场景前一段还是秋天下一段就 ...

就是单纯随机性的原因，后训练没做够任务不稳定导致一会神一会鬼。降智判断起来是要用一些任务来测的。不要老是叫降智。
降智就是提供商给你把模型换了，这是很严重的事 Re:Source

overflowal · 发表于 2026-5-8 14:08

bbvcv 发表于 2026-5-8 13:42
DeepSeek为什么这么不重视多模态，光靠逻辑推理不行吧

没资源只能排个先后顺序，这叫啥不重视。之前天天在那折腾2000个h800组的集群。要是他们能有大厂级别的训练资源你看他们是不是早就搞多模态了 Re:Source

holylight2020 · 发表于 2026-5-8 14:55

overflowal 发表于 2026-5-8 14:01
就是单纯随机性的原因，后训练没做够任务不稳定导致一会神一会鬼。降智判断起来是要用一些任务来测的。不 ...

我这两天用起来感觉完全不能用了。五一前很稳的。不知道是什么原因

论坛助手,iPhone

julia黑 · 发表于 2026-5-8 15:14

holylight2020 发表于 2026-5-8 14:55
我这两天用起来感觉完全不能用了。五一前很稳的。不知道是什么原因

论坛助手,iPhone ...

如果你是连续写文的话，写得越多，幻觉越严重。

		自动登录	找回密码
密码			立即注册

[科技] FT：DeepSeek下周发｜已发，转为v4讨论楼

本帖子中包含更多资源

评分

本帖子中包含更多资源