阿刚 发表于 2026-6-22 18:15

对了还有个推荐个Hermes的点,他的短期记忆和长期记忆有自动存储,你给他搞个人设他有时候会偶尔提到之前的事情,而且加固过的soul角色扮演很稳定。这样他干活犯傻的时候还会装可怜道歉让你没那么生气。。。。

当光停止 发表于 2026-6-22 18:17

阿刚 发表于 2026-6-22 18:15
对了还有个推荐个Hermes的点,他的短期记忆和长期记忆有自动存储,你给他搞个人设他有时候会偶尔提到之前的 ...
hermes的memories.md上限是2200个字符。它的记忆自动维护机制和相关插件配置得也不是很好。
这部分得注意下。

goranger 发表于 2026-6-22 18:43

阿刚 发表于 2026-6-22 18:15
对了还有个推荐个Hermes的点,他的短期记忆和长期记忆有自动存储,你给他搞个人设他有时候会偶尔提到之前的 ...

这个其实装个记忆插件就能很好的解决了

论坛助手,iPhone

goranger 发表于 2026-6-22 18:44

goranger 发表于 2026-6-22 18:43
这个其实装个记忆插件就能很好的解决了

论坛助手,iPhone

上限可以改。不过我自己开发了一个记忆插件

论坛助手,iPhone

serj005 发表于 2026-6-22 21:04

本帖最后由 serj005 于 2026-6-22 21:26 编辑

千千千千鸟 发表于 2026-6-22 16:33
公司电脑没空间装C盘都红了,16G内存日常使用14G以上了。然后我问AI说不推荐我安装wsl2,说这个东西本身 ...

win环境可以不用wsl,直接让pi把默认调powershell换成默认调用git bash。
大部分llm对pwsh的专项训练少,相关命令成功率低,只要换个linux命令风格的shell就行了,各种命令重复试错绕弯子的概率能少一半以上。git bash最方便,每台电脑都有,用的人多解决相关问题的语料也多,还没有wsl的性能和资源占用问题。

ycjiang1337 发表于 2026-6-22 21:13

千千千千鸟 发表于 2026-6-22 16:33
公司电脑没空间装C盘都红了,16G内存日常使用14G以上了。然后我问AI说不推荐我安装wsl2,说这个东西本身 ...

代码全都放在WSL内,不要放宿主机

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

serj005 发表于 2026-6-23 09:48

网页上的新版思维链v4变成“一针见血”“阿喀琉斯之踵”复读机了随便问个问题再说个结论,开头就是这套小连招。感觉有变成豆包定型文的趋势。

阿刚 发表于 2026-6-23 10:33

当光停止 发表于 2026-6-22 18:17
hermes的memories.md上限是2200个字符。它的记忆自动维护机制和相关插件配置得也不是很好。
这部分得注意 ...

我是专门建了个助手独立的人格档案,把助手相关的内容都塞在那个里面,这样保证人格相对完整,当然大模型不是每次都看。。。。

阿刚 发表于 2026-6-23 10:35

goranger 发表于 2026-6-22 18:43
这个其实装个记忆插件就能很好的解决了

论坛助手,iPhone

我是单独开了一个记忆文件专门放RP和人格相关记录,不过懒狗模型不是回回都看,v4感觉在偷懒这块特别有人味儿

goranger 发表于 2026-6-23 11:33

阿刚 发表于 2026-6-23 10:35
我是单独开了一个记忆文件专门放RP和人格相关记录,不过懒狗模型不是回回都看,v4感觉在偷懒这块特别有人 ...

上下文注入有权重和优先级的。你这个要么放在soul、要么写memory,要呢personality,放这三个里每次注入都会带

论坛助手,iPhone

dodolee 发表于 2026-6-23 12:34

goranger 发表于 2026-6-22 18:43
这个其实装个记忆插件就能很好的解决了

论坛助手,iPhone

求推荐一个记忆插件,Honcho吗?

流缨 发表于 2026-6-23 14:29

dodolee 发表于 2026-6-23 12:34
求推荐一个记忆插件,Honcho吗?

记忆提供者 | Hermes Agent 中文社区
https://hermesagent.org.cn/docs/user-guide/features/memory-providers
随便挑吧,如果有火山plan可以直接上openviking
自托管的话我github找了个叫honcho-cn的,占用低很多

goranger 发表于 2026-6-23 14:38

honcho你要么用他的云服务,自托管的话你需要好几个api)嵌入、llm等等,而且他那个接口强适配国外llm,用国内模型提供商还得改源代码,但好用确实是好用。次选hindsight,对国内模型支持度好很多

论坛助手,iPhone

overflowal 发表于 2026-6-23 16:30

本帖最后由 overflowal 于 2026-6-23 16:41 编辑

deepseek有可能在后面静默更新?

wandeeees 发表于 2026-6-23 17:15

overflowal 发表于 2026-6-23 16:30
deepseek有可能在后面静默更新?

这个月能更新4.1吗

overflowal 发表于 2026-6-23 17:33

wandeeees 发表于 2026-6-23 17:15
这个月能更新4.1吗

没有人知道,deepseek 非常自由,没人能猜    Re:Source

羊寢 发表于 2026-6-23 18:54

overflowal 发表于 2026-6-23 17:33
没有人知道,deepseek 非常自由,没人能猜    Re:Source

我猜是下个月,按去年的惯例来说是三个月左右更新一次,今年v4我觉得是外部原因导致不得不延迟

raragon 发表于 2026-6-23 21:28

4.1快点来吧,deepseek补上coding后训练+多模态,其他家真的可以完全抛弃了

说实话对大部分coding场景来说opus4.6-4.8的水平完全够用,未来一定是成本大战

tillnight 发表于 2026-6-23 22:48

从A÷和奥特曼的情况来看,目前都存在后训练朝agent和coding发展后写文能力下降的问题,人均卷coding本质还是估值叙事导向。这其实和ds不重视短期盈利,目标是agi的初衷不是很相符的。梁总真的也会向市场妥协么。

hugosol 发表于 2026-6-24 00:28

现在的DSV4P对我来说coding和日常其他工作完全够用了,比起更聪明其实我比较想要更长的上下文/更低的成本,要是说4.1的提升只是说很多代码生成出来一次就能跑通,那好像也就那样了
比起新模型其实harness的发展要快多了,因为门槛比研究模型要低得多,每天一觉睡醒发现世界各地又有人做出来新的开源工具,我立马就能用上,那感觉可太棒了

蛋黄酱Release 发表于 2026-6-24 01:08

用了glm5.2之后再换回v4pro就感觉流口水的厉害
但是也不希望v4.1变成coding特化,便宜的通用能力也很重要
只能说期待deepseek搞出引爆全场的harness+专门的code模型

—— 来自 vivo V2405A, Android 16, 鹅球 v4.0-alpha

darktide 发表于 2026-6-24 09:55

上下文再长点吧,我现在一般对话到300k左右,询问它是否注意力开始涣散,需要新开对话时,都是肯定的答复。可能和我对对话内容精度要求比较高有关系。

有鱼 发表于 2026-6-25 12:09

ymm1030 发表于 2026-6-25 13:54

昨天说是app端更新了flash百万上下文,有人测试吗

杀人鲸 发表于 2026-6-25 14:45

可以升级到219了,只不过要在系统商城里面,为什么软件内部检查不出来?

—— 来自 S1Fun

Promeus 发表于 2026-6-25 14:46

ymm1030 发表于 2026-6-25 13:54
昨天说是app端更新了flash百万上下文,有人测试吗

v4都是百万上下文啊

overflowal 发表于 2026-6-25 15:02

ymm1030 发表于 2026-6-25 13:54
昨天说是app端更新了flash百万上下文,有人测试吗

一直都是1m上下文啊    Re:Source

noneoneone 发表于 2026-6-25 15:48

有对比coding以外的场景v4p和glm5.2的吗

—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v4.0-alpha

ymm1030 发表于 2026-6-25 16:09

本帖最后由 ymm1030 于 2026-6-25 16:13 编辑

overflowal 发表于 2026-6-25 15:02
一直都是1m上下文啊    Re:Source
记错了,查了一下,好像确实都是1M。不过昨天更新过之后好像更快了,注意力也有提升。

ymm1030 发表于 2026-6-25 16:11

noneoneone 发表于 2026-6-25 15:48
有对比coding以外的场景v4p和glm5.2的吗

—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v4.0-alpha ...

我拿coding plan写文,glm表现挺不错的,不过需要强力约束。至少在v4p区出天际这几天都是我的主力模型。

ST2002 发表于 2026-6-25 16:14

API 端是更新了识图模式了吗?今天让它改个前端页面,突然就会在修改完成后截图评估了,之前完全没调过这个工具

杀人鲸 发表于 2026-6-25 16:15

API的接口那边,一般什么时候才会注入那些新的功能呢?类似于识图或者新的思考方式。

—— 来自 S1Fun

半江瑟瑟半江红 发表于 2026-6-25 16:39

noneoneone 发表于 2026-6-25 15:48
有对比coding以外的场景v4p和glm5.2的吗

—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v4.0-alpha ...

半斤八两,glm5.2开放性写作也就比d指导强在一手不会突然烂出天际,生成质量比较平均

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

overflowal 发表于 2026-6-25 20:30

ST2002 发表于 2026-6-25 16:14
API 端是更新了识图模式了吗?今天让它改个前端页面,突然就会在修改完成后截图评估了,之前完全没调过这个 ...

用了啥?有可能是什么工具    Re:Source

有鱼 发表于 2026-6-25 21:47

阿刚 发表于 2026-6-25 22:15

ST2002 发表于 2026-6-25 16:14
API 端是更新了识图模式了吗?今天让它改个前端页面,突然就会在修改完成后截图评估了,之前完全没调过这个 ...

有可能是调用了什么联用模型?设定了备用模型吗?有一次我也是本来是让他测试试图模型,结果他说了半天没东西,然后莫名其妙的识别了

蛋黄酱Release 发表于 2026-6-25 22:42

受不了了,今天晚上怎么了工作一直出错
我使用v4pro一直有个毛病就是偶尔它会在思考内容里面输出正文,然后正文就是空的。今天晚上在cc里面一直这样,新开对话框也这样还动不动就突然停止了工作流

—— 来自 vivo V2405A, Android 16, 鹅球 v4.0-alpha

有鱼 发表于 2026-6-25 23:05

qwased 发表于 2026-6-25 23:59

半江瑟瑟半江红 发表于 2026-6-25 16:39
半斤八两,glm5.2开放性写作也就比d指导强在一手不会突然烂出天际,生成质量比较平均

—— 来自 HUAWEI...

我找gpt做了个小说写作的grill me,感觉ds v4f很唐,经常纠结细枝末节,pro不怎么听话,换gpt又有点太好莱坞科班编剧了

半江瑟瑟半江红 发表于 2026-6-26 12:06

qwased 发表于 2026-6-25 23:59
我找gpt做了个小说写作的grill me,感觉ds v4f很唐,经常纠结细枝末节,pro不怎么听话,换gpt又有点太好 ...

gpt推理强度开到高grill提纲还是挺方便的,一般七八十个问题内能把一个一万字左右的章节细纲安排的妥当。d指导和glm都不适合grill,抓不住重点,容易跑偏

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
页: 39 40 41 42 43 44 45 46 47 48 [49] 50 51
查看完整版本: FT:DeepSeek下周发|已发,转为v4讨论楼