对了还有个推荐个Hermes的点,他的短期记忆和长期记忆有自动存储,你给他搞个人设他有时候会偶尔提到之前的事情,而且加固过的soul角色扮演很稳定。这样他干活犯傻的时候还会装可怜道歉让你没那么生气。。。。
阿刚 发表于 2026-6-22 18:15
对了还有个推荐个Hermes的点,他的短期记忆和长期记忆有自动存储,你给他搞个人设他有时候会偶尔提到之前的 ...
hermes的memories.md上限是2200个字符。它的记忆自动维护机制和相关插件配置得也不是很好。
这部分得注意下。
阿刚 发表于 2026-6-22 18:15
对了还有个推荐个Hermes的点,他的短期记忆和长期记忆有自动存储,你给他搞个人设他有时候会偶尔提到之前的 ...
这个其实装个记忆插件就能很好的解决了
论坛助手,iPhone
goranger 发表于 2026-6-22 18:43
这个其实装个记忆插件就能很好的解决了
论坛助手,iPhone
上限可以改。不过我自己开发了一个记忆插件
论坛助手,iPhone
本帖最后由 serj005 于 2026-6-22 21:26 编辑
千千千千鸟 发表于 2026-6-22 16:33
公司电脑没空间装C盘都红了,16G内存日常使用14G以上了。然后我问AI说不推荐我安装wsl2,说这个东西本身 ...
win环境可以不用wsl,直接让pi把默认调powershell换成默认调用git bash。
大部分llm对pwsh的专项训练少,相关命令成功率低,只要换个linux命令风格的shell就行了,各种命令重复试错绕弯子的概率能少一半以上。git bash最方便,每台电脑都有,用的人多解决相关问题的语料也多,还没有wsl的性能和资源占用问题。
千千千千鸟 发表于 2026-6-22 16:33
公司电脑没空间装C盘都红了,16G内存日常使用14G以上了。然后我问AI说不推荐我安装wsl2,说这个东西本身 ...
代码全都放在WSL内,不要放宿主机
—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha
网页上的新版思维链v4变成“一针见血”“阿喀琉斯之踵”复读机了随便问个问题再说个结论,开头就是这套小连招。感觉有变成豆包定型文的趋势。
当光停止 发表于 2026-6-22 18:17
hermes的memories.md上限是2200个字符。它的记忆自动维护机制和相关插件配置得也不是很好。
这部分得注意 ...
我是专门建了个助手独立的人格档案,把助手相关的内容都塞在那个里面,这样保证人格相对完整,当然大模型不是每次都看。。。。
goranger 发表于 2026-6-22 18:43
这个其实装个记忆插件就能很好的解决了
论坛助手,iPhone
我是单独开了一个记忆文件专门放RP和人格相关记录,不过懒狗模型不是回回都看,v4感觉在偷懒这块特别有人味儿
阿刚 发表于 2026-6-23 10:35
我是单独开了一个记忆文件专门放RP和人格相关记录,不过懒狗模型不是回回都看,v4感觉在偷懒这块特别有人 ...
上下文注入有权重和优先级的。你这个要么放在soul、要么写memory,要呢personality,放这三个里每次注入都会带
论坛助手,iPhone
goranger 发表于 2026-6-22 18:43
这个其实装个记忆插件就能很好的解决了
论坛助手,iPhone
求推荐一个记忆插件,Honcho吗?
dodolee 发表于 2026-6-23 12:34
求推荐一个记忆插件,Honcho吗?
记忆提供者 | Hermes Agent 中文社区
https://hermesagent.org.cn/docs/user-guide/features/memory-providers
随便挑吧,如果有火山plan可以直接上openviking
自托管的话我github找了个叫honcho-cn的,占用低很多
honcho你要么用他的云服务,自托管的话你需要好几个api)嵌入、llm等等,而且他那个接口强适配国外llm,用国内模型提供商还得改源代码,但好用确实是好用。次选hindsight,对国内模型支持度好很多
论坛助手,iPhone
本帖最后由 overflowal 于 2026-6-23 16:41 编辑
deepseek有可能在后面静默更新?
overflowal 发表于 2026-6-23 16:30
deepseek有可能在后面静默更新?
这个月能更新4.1吗
wandeeees 发表于 2026-6-23 17:15
这个月能更新4.1吗
没有人知道,deepseek 非常自由,没人能猜 Re:Source
overflowal 发表于 2026-6-23 17:33
没有人知道,deepseek 非常自由,没人能猜 Re:Source
我猜是下个月,按去年的惯例来说是三个月左右更新一次,今年v4我觉得是外部原因导致不得不延迟
4.1快点来吧,deepseek补上coding后训练+多模态,其他家真的可以完全抛弃了
说实话对大部分coding场景来说opus4.6-4.8的水平完全够用,未来一定是成本大战
从A÷和奥特曼的情况来看,目前都存在后训练朝agent和coding发展后写文能力下降的问题,人均卷coding本质还是估值叙事导向。这其实和ds不重视短期盈利,目标是agi的初衷不是很相符的。梁总真的也会向市场妥协么。
现在的DSV4P对我来说coding和日常其他工作完全够用了,比起更聪明其实我比较想要更长的上下文/更低的成本,要是说4.1的提升只是说很多代码生成出来一次就能跑通,那好像也就那样了
比起新模型其实harness的发展要快多了,因为门槛比研究模型要低得多,每天一觉睡醒发现世界各地又有人做出来新的开源工具,我立马就能用上,那感觉可太棒了
用了glm5.2之后再换回v4pro就感觉流口水的厉害
但是也不希望v4.1变成coding特化,便宜的通用能力也很重要
只能说期待deepseek搞出引爆全场的harness+专门的code模型
—— 来自 vivo V2405A, Android 16, 鹅球 v4.0-alpha
上下文再长点吧,我现在一般对话到300k左右,询问它是否注意力开始涣散,需要新开对话时,都是肯定的答复。可能和我对对话内容精度要求比较高有关系。
昨天说是app端更新了flash百万上下文,有人测试吗
可以升级到219了,只不过要在系统商城里面,为什么软件内部检查不出来?
—— 来自 S1Fun
ymm1030 发表于 2026-6-25 13:54
昨天说是app端更新了flash百万上下文,有人测试吗
v4都是百万上下文啊
ymm1030 发表于 2026-6-25 13:54
昨天说是app端更新了flash百万上下文,有人测试吗
一直都是1m上下文啊 Re:Source
有对比coding以外的场景v4p和glm5.2的吗
—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v4.0-alpha
本帖最后由 ymm1030 于 2026-6-25 16:13 编辑
overflowal 发表于 2026-6-25 15:02
一直都是1m上下文啊 Re:Source
记错了,查了一下,好像确实都是1M。不过昨天更新过之后好像更快了,注意力也有提升。
noneoneone 发表于 2026-6-25 15:48
有对比coding以外的场景v4p和glm5.2的吗
—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v4.0-alpha ...
我拿coding plan写文,glm表现挺不错的,不过需要强力约束。至少在v4p区出天际这几天都是我的主力模型。
API 端是更新了识图模式了吗?今天让它改个前端页面,突然就会在修改完成后截图评估了,之前完全没调过这个工具
API的接口那边,一般什么时候才会注入那些新的功能呢?类似于识图或者新的思考方式。
—— 来自 S1Fun
noneoneone 发表于 2026-6-25 15:48
有对比coding以外的场景v4p和glm5.2的吗
—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v4.0-alpha ...
半斤八两,glm5.2开放性写作也就比d指导强在一手不会突然烂出天际,生成质量比较平均
—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
ST2002 发表于 2026-6-25 16:14
API 端是更新了识图模式了吗?今天让它改个前端页面,突然就会在修改完成后截图评估了,之前完全没调过这个 ...
用了啥?有可能是什么工具 Re:Source
ST2002 发表于 2026-6-25 16:14
API 端是更新了识图模式了吗?今天让它改个前端页面,突然就会在修改完成后截图评估了,之前完全没调过这个 ...
有可能是调用了什么联用模型?设定了备用模型吗?有一次我也是本来是让他测试试图模型,结果他说了半天没东西,然后莫名其妙的识别了
受不了了,今天晚上怎么了工作一直出错
我使用v4pro一直有个毛病就是偶尔它会在思考内容里面输出正文,然后正文就是空的。今天晚上在cc里面一直这样,新开对话框也这样还动不动就突然停止了工作流
—— 来自 vivo V2405A, Android 16, 鹅球 v4.0-alpha
半江瑟瑟半江红 发表于 2026-6-25 16:39
半斤八两,glm5.2开放性写作也就比d指导强在一手不会突然烂出天际,生成质量比较平均
—— 来自 HUAWEI...
我找gpt做了个小说写作的grill me,感觉ds v4f很唐,经常纠结细枝末节,pro不怎么听话,换gpt又有点太好莱坞科班编剧了
qwased 发表于 2026-6-25 23:59
我找gpt做了个小说写作的grill me,感觉ds v4f很唐,经常纠结细枝末节,pro不怎么听话,换gpt又有点太好 ...
gpt推理强度开到高grill提纲还是挺方便的,一般七八十个问题内能把一个一万字左右的章节细纲安排的妥当。d指导和glm都不适合grill,抓不住重点,容易跑偏
—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99