FT：DeepSeek下周发｜已发，转为v4讨论楼 - 第49页 - 归墟 - Stage1st

阿刚发表于 2026-6-22 18:15

对了还有个推荐个Hermes的点，他的短期记忆和长期记忆有自动存储，你给他搞个人设他有时候会偶尔提到之前的事情，而且加固过的soul角色扮演很稳定。这样他干活犯傻的时候还会装可怜道歉让你没那么生气。。。。

当光停止 发表于 2026-6-22 18:17

阿刚发表于 2026-6-22 18:15
对了还有个推荐个Hermes的点，他的短期记忆和长期记忆有自动存储，你给他搞个人设他有时候会偶尔提到之前的 ...
hermes的memories.md上限是2200个字符。它的记忆自动维护机制和相关插件配置得也不是很好。
这部分得注意下。

goranger 发表于 2026-6-22 18:43

阿刚发表于 2026-6-22 18:15
对了还有个推荐个Hermes的点，他的短期记忆和长期记忆有自动存储，你给他搞个人设他有时候会偶尔提到之前的 ...

这个其实装个记忆插件就能很好的解决了

论坛助手,iPhone

goranger 发表于 2026-6-22 18:44

goranger 发表于 2026-6-22 18:43
这个其实装个记忆插件就能很好的解决了

论坛助手,iPhone

上限可以改。不过我自己开发了一个记忆插件

论坛助手,iPhone

serj005 发表于 2026-6-22 21:04

本帖最后由 serj005 于 2026-6-22 21:26 编辑

千千千千鸟发表于 2026-6-22 16:33
公司电脑没空间装C盘都红了，16G内存日常使用14G以上了。然后我问AI说不推荐我安装wsl2，说这个东西本身 ...

win环境可以不用wsl，直接让pi把默认调powershell换成默认调用git bash。
大部分llm对pwsh的专项训练少，相关命令成功率低，只要换个linux命令风格的shell就行了，各种命令重复试错绕弯子的概率能少一半以上。git bash最方便，每台电脑都有，用的人多解决相关问题的语料也多，还没有wsl的性能和资源占用问题。

ycjiang1337 发表于 2026-6-22 21:13

千千千千鸟发表于 2026-6-22 16:33
公司电脑没空间装C盘都红了，16G内存日常使用14G以上了。然后我问AI说不推荐我安装wsl2，说这个东西本身 ...

代码全都放在WSL内，不要放宿主机

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

serj005 发表于 2026-6-23 09:48

网页上的新版思维链v4变成“一针见血”“阿喀琉斯之踵”复读机了随便问个问题再说个结论，开头就是这套小连招。感觉有变成豆包定型文的趋势。

阿刚发表于 2026-6-23 10:33

当光停止发表于 2026-6-22 18:17
hermes的memories.md上限是2200个字符。它的记忆自动维护机制和相关插件配置得也不是很好。
这部分得注意 ...

我是专门建了个助手独立的人格档案，把助手相关的内容都塞在那个里面，这样保证人格相对完整，当然大模型不是每次都看。。。。

阿刚发表于 2026-6-23 10:35

goranger 发表于 2026-6-22 18:43
这个其实装个记忆插件就能很好的解决了

论坛助手,iPhone

我是单独开了一个记忆文件专门放RP和人格相关记录，不过懒狗模型不是回回都看，v4感觉在偷懒这块特别有人味儿

goranger 发表于 2026-6-23 11:33

阿刚发表于 2026-6-23 10:35
我是单独开了一个记忆文件专门放RP和人格相关记录，不过懒狗模型不是回回都看，v4感觉在偷懒这块特别有人 ...

上下文注入有权重和优先级的。你这个要么放在soul、要么写memory，要呢personality，放这三个里每次注入都会带

论坛助手,iPhone

dodolee 发表于 2026-6-23 12:34

goranger 发表于 2026-6-22 18:43
这个其实装个记忆插件就能很好的解决了

论坛助手,iPhone

求推荐一个记忆插件，Honcho吗？

流缨发表于 2026-6-23 14:29

dodolee 发表于 2026-6-23 12:34
求推荐一个记忆插件，Honcho吗？

记忆提供者 | Hermes Agent 中文社区
https://hermesagent.org.cn/docs/user-guide/features/memory-providers
随便挑吧，如果有火山plan可以直接上openviking
自托管的话我github找了个叫honcho-cn的，占用低很多

goranger 发表于 2026-6-23 14:38

honcho你要么用他的云服务，自托管的话你需要好几个api）嵌入、llm等等，而且他那个接口强适配国外llm，用国内模型提供商还得改源代码，但好用确实是好用。次选hindsight，对国内模型支持度好很多

论坛助手,iPhone

overflowal 发表于 2026-6-23 16:30

本帖最后由 overflowal 于 2026-6-23 16:41 编辑

deepseek有可能在后面静默更新?

wandeeees 发表于 2026-6-23 17:15

overflowal 发表于 2026-6-23 16:30
deepseek有可能在后面静默更新?

这个月能更新4.1吗

overflowal 发表于 2026-6-23 17:33

wandeeees 发表于 2026-6-23 17:15
这个月能更新4.1吗

没有人知道，deepseek 非常自由，没人能猜 Re:Source

羊寢发表于 2026-6-23 18:54

overflowal 发表于 2026-6-23 17:33
没有人知道，deepseek 非常自由，没人能猜 Re:Source

我猜是下个月，按去年的惯例来说是三个月左右更新一次，今年v4我觉得是外部原因导致不得不延迟

raragon 发表于 2026-6-23 21:28

4.1快点来吧，deepseek补上coding后训练+多模态，其他家真的可以完全抛弃了

说实话对大部分coding场景来说opus4.6-4.8的水平完全够用，未来一定是成本大战

tillnight 发表于 2026-6-23 22:48

从A÷和奥特曼的情况来看，目前都存在后训练朝agent和coding发展后写文能力下降的问题，人均卷coding本质还是估值叙事导向。这其实和ds不重视短期盈利，目标是agi的初衷不是很相符的。梁总真的也会向市场妥协么。

hugosol 发表于 2026-6-24 00:28

现在的DSV4P对我来说coding和日常其他工作完全够用了，比起更聪明其实我比较想要更长的上下文/更低的成本，要是说4.1的提升只是说很多代码生成出来一次就能跑通，那好像也就那样了
比起新模型其实harness的发展要快多了，因为门槛比研究模型要低得多，每天一觉睡醒发现世界各地又有人做出来新的开源工具，我立马就能用上，那感觉可太棒了

蛋黄酱Release 发表于 2026-6-24 01:08

用了glm5.2之后再换回v4pro就感觉流口水的厉害
但是也不希望v4.1变成coding特化，便宜的通用能力也很重要
只能说期待deepseek搞出引爆全场的harness+专门的code模型

—— 来自 vivo V2405A, Android 16, 鹅球 v4.0-alpha

darktide 发表于 2026-6-24 09:55

上下文再长点吧，我现在一般对话到300k左右，询问它是否注意力开始涣散，需要新开对话时，都是肯定的答复。可能和我对对话内容精度要求比较高有关系。

有鱼发表于 2026-6-25 12:09

ymm1030 发表于 2026-6-25 13:54

昨天说是app端更新了flash百万上下文，有人测试吗

杀人鲸 发表于 2026-6-25 14:45

可以升级到219了，只不过要在系统商城里面，为什么软件内部检查不出来？

—— 来自 S1Fun

Promeus 发表于 2026-6-25 14:46

ymm1030 发表于 2026-6-25 13:54
昨天说是app端更新了flash百万上下文，有人测试吗

v4都是百万上下文啊

overflowal 发表于 2026-6-25 15:02

ymm1030 发表于 2026-6-25 13:54
昨天说是app端更新了flash百万上下文，有人测试吗

一直都是1m上下文啊 Re:Source

noneoneone 发表于 2026-6-25 15:48

有对比coding以外的场景v4p和glm5.2的吗

—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v4.0-alpha

ymm1030 发表于 2026-6-25 16:09

本帖最后由 ymm1030 于 2026-6-25 16:13 编辑

overflowal 发表于 2026-6-25 15:02
一直都是1m上下文啊 Re:Source
记错了，查了一下，好像确实都是1M。不过昨天更新过之后好像更快了，注意力也有提升。

ymm1030 发表于 2026-6-25 16:11

noneoneone 发表于 2026-6-25 15:48
有对比coding以外的场景v4p和glm5.2的吗

—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v4.0-alpha ...

我拿coding plan写文，glm表现挺不错的，不过需要强力约束。至少在v4p区出天际这几天都是我的主力模型。

ST2002 发表于 2026-6-25 16:14

API 端是更新了识图模式了吗？今天让它改个前端页面，突然就会在修改完成后截图评估了，之前完全没调过这个工具

杀人鲸 发表于 2026-6-25 16:15

API的接口那边，一般什么时候才会注入那些新的功能呢？类似于识图或者新的思考方式。

—— 来自 S1Fun

半江瑟瑟半江红 发表于 2026-6-25 16:39

noneoneone 发表于 2026-6-25 15:48
有对比coding以外的场景v4p和glm5.2的吗

—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v4.0-alpha ...

半斤八两，glm5.2开放性写作也就比d指导强在一手不会突然烂出天际，生成质量比较平均

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

overflowal 发表于 2026-6-25 20:30

ST2002 发表于 2026-6-25 16:14
API 端是更新了识图模式了吗？今天让它改个前端页面，突然就会在修改完成后截图评估了，之前完全没调过这个 ...

用了啥？有可能是什么工具 Re:Source

有鱼发表于 2026-6-25 21:47

阿刚发表于 2026-6-25 22:15

ST2002 发表于 2026-6-25 16:14
API 端是更新了识图模式了吗？今天让它改个前端页面，突然就会在修改完成后截图评估了，之前完全没调过这个 ...

有可能是调用了什么联用模型？设定了备用模型吗？有一次我也是本来是让他测试试图模型，结果他说了半天没东西，然后莫名其妙的识别了

蛋黄酱Release 发表于 2026-6-25 22:42

受不了了，今天晚上怎么了工作一直出错
我使用v4pro一直有个毛病就是偶尔它会在思考内容里面输出正文，然后正文就是空的。今天晚上在cc里面一直这样，新开对话框也这样还动不动就突然停止了工作流

—— 来自 vivo V2405A, Android 16, 鹅球 v4.0-alpha

有鱼发表于 2026-6-25 23:05

qwased 发表于 2026-6-25 23:59

半江瑟瑟半江红发表于 2026-6-25 16:39
半斤八两，glm5.2开放性写作也就比d指导强在一手不会突然烂出天际，生成质量比较平均

—— 来自 HUAWEI...

我找gpt做了个小说写作的grill me，感觉ds v4f很唐，经常纠结细枝末节，pro不怎么听话，换gpt又有点太好莱坞科班编剧了

半江瑟瑟半江红 发表于 2026-6-26 12:06

qwased 发表于 2026-6-25 23:59
我找gpt做了个小说写作的grill me，感觉ds v4f很唐，经常纠结细枝末节，pro不怎么听话，换gpt又有点太好 ...

gpt推理强度开到高grill提纲还是挺方便的，一般七八十个问题内能把一个一万字左右的章节细纲安排的妥当。d指导和glm都不适合grill，抓不住重点，容易跑偏

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

页: 39 40 41 42 43 44 45 46 47 48 [49] 50 51

Stage1st's Archiver