绝地潜兵 发表于 2026-6-16 18:20

Promeus 发表于 2026-6-16 17:47
新版思维链是这样的?

和GLM的思维链一样啊,输出前会自检
这种模式添加一个指令马上能get到,不会自己瞎扮演跑偏

有鱼 发表于 2026-6-16 18:28

有鱼 发表于 2026-6-16 18:30

ml1642879 发表于 2026-6-16 18:32

据知情人士透露,除国家人工智能产业投资基金外,所有外部投资方的资金需注入由创始人梁文锋管理的有限合伙企业,而非直接投向DeepSeek主体。外部投资方不享有公司投票权,仅可获取优先财务信息并拥有后续融资的优先投资权。所有投资方股权设有五年锁定期,锁定期内不得转让。


fgnb,还说啥呢,只收钱不办事

Re:Source · Xiaomi 15

有鱼 发表于 2026-6-16 18:33

tillnight 发表于 2026-6-16 18:38

有鱼 发表于 2026-6-16 18:33
来一人说一句,fgnb
这不是爱投不投的意思?只给姥爷一点面子

倒不是面子不面子的问题,国资投资必须有投票权的。

tillnight 发表于 2026-6-16 18:40

有鱼 发表于 2026-6-16 18:30
这是幻觉了还是?

确认知识库最直接的方式是关联网问近期的常识性新闻。当然2026.5也可以直接认定为幻觉了。就算4.1更新了知识库也不可能新到上个月的。

Promeus 发表于 2026-6-16 18:44

有鱼 发表于 2026-6-16 18:30
这是幻觉了还是?

不开思考好像就是这样,但是数据库显然还没更新,问他美伊战争结果答不出

serj005 发表于 2026-6-16 18:44

有鱼 发表于 2026-6-16 18:30
这是幻觉了还是?

幻觉,知识库我试出来从去年到今年5月中间的任意时间都可能出现

phorcys02 发表于 2026-6-16 18:44

半江瑟瑟半江红 发表于 2026-6-16 17:35
那不如买个gpt plus订阅了,20美元一个月
opencode go也挺合算的


150块ds api,如果缓存率95%+ 那估计有1-3个B token了
gpt plus 周限额大概100-200M token.分分钟限额了.

半江瑟瑟半江红 发表于 2026-6-16 18:50

phorcys02 发表于 2026-6-16 18:44
150块ds api,如果缓存率95%+ 那估计有1-3个B token了
gpt plus 周限额大概100-200M token.分分钟限额了. ...

可以让gpt出方案deepseek执行,或者重活交给gpt

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

有鱼 发表于 2026-6-16 18:53

tillnight 发表于 2026-6-16 18:53

千千千千鸟 发表于 2026-6-16 17:59
GPT的20刀版本是吧,我研究下适不适合我

你先搞清楚你的需求,这里有些人看都不看上下文就自说自话的,如果你是做coding,推荐gptplus自然可以上位替换,但你说是在用agent,如果是openclaw这种用途的,OAI的订阅服务不提供api额度的。要薅干他家token限额基本主要是用自家codex的。

有鱼 发表于 2026-6-16 18:56

drodchang 发表于 2026-6-16 18:57

gptplus用来编程是不够用的,但是用来干别的基本用不完

很久就在那边l 发表于 2026-6-16 19:09

想省钱的话白嫖的渠道挺多的,bat的ai IDE都有白嫖用量用各种国产模型,opencode可以白嫖v4f,英伟达nim有部署所有开源模型给免费用不过很慢,华为最近也开始给白嫖glm,如果不考虑安全用公益站还能白嫖gpt和claude

千千千千鸟 发表于 2026-6-16 19:09

tillnight 发表于 2026-6-16 18:53
你先搞清楚你的需求,这里有些人看都不看上下文就自说自话的,如果你是做coding,推荐gptplus自然可以上 ...

是用agent,也不怎么写代码吧,主要是用来读表格,读文档,写方案啥的,另外可能帮我查资料,帮我看视频之类的?自己写了个读取b站字幕的skill,现在懒到视频都懒得看。
我问了下GPT网页版,貌似pi agent和hermes貌似都可以接入使用codex的这个额度来着。
另外我看了下DS开放平台,显示我13日用掉70多块钱,严重怀疑是因为那天我装了个powershell美化,每次打开powershell会显示一张壁纸所以每次调用工具都会有超级多的图片代码被加载进上下文

drodchang 发表于 2026-6-16 19:10

有鱼 发表于 2026-6-16 18:56
我私心还是挺希望ds能在产品化(后训练,harness,搜索之类的工具包)上做好的,gpt订阅我觉得买token也就 ...

codex做得非常好,我觉得是最好的编程工具,可惜因为兼容问题,gpt以外的模型不好用

有鱼 发表于 2026-6-16 19:21

LeoDT 发表于 2026-6-16 19:23

千千千千鸟 发表于 2026-6-16 19:09
是用agent,也不怎么写代码吧,主要是用来读表格,读文档,写方案啥的,另外可能帮我查资料,帮我看视频之 ...

想用的又好又省需要自己研究一些agent工作的原理,可以尝试的省钱方法比如多开新session,session之间可以通过文档和handoff传递信息,skill改为主动调用而不是传给模型告诉他用什么skill,贵模型做分析便宜模型做实施,实施尽量用subagent方式之类的。

如果想知道什么东西是token黑洞,又不想写代码,可以试试agentsview(https://github.com/kenn-io/agentsview)这类可视化工具,看看哪天的哪个agent哪个session哪个tool消耗大。

IIIIIlllllIIIII 发表于 2026-6-16 19:36

主要ds的用下来实际智力不高 不知道是因为触发小了还是怎么回事 感觉只要prompt里有一点污染立马就往那个方向滑 A\和scam altman的确实好一点

— from motorola XT2603-1, Android 16, S1 Next Goose v3.5.99

舞以 发表于 2026-6-16 19:51

指令循序和过度召回不知道是不是一体两面
gpt偶尔也会抓着你说的几个词来回讲,不过ds更明显

论坛助手,iPhone

hugosol 发表于 2026-6-16 19:58

千千千千鸟 发表于 2026-6-16 19:09
是用agent,也不怎么写代码吧,主要是用来读表格,读文档,写方案啥的,另外可能帮我查资料,帮我看视频之 ...

你都用pi了,当然是自己写个扩展统计一下I/O花费比和缓存命中这些信息自己分析,DeepSeek的API都有返回具体token值,自己算一下就很清晰了
这是我自己在omp上做的效果



杀人鲸 发表于 2026-6-16 20:01

电脑上一般可以高频率的体验到比较新的那种思考模式,但是手机上的客户端却好像不怎么能够激活那种东西。
然而看视频的时候,在评论区发现有人提出,在手机的快速交流模式里面,只要增加上SVG的指示,那么就可以激活那种思考模式,有兴趣的朋友可以体验一下。

在命令的最前面或者最后面加上SVG就好了。

—— 来自 S1Fun

千千千千鸟 发表于 2026-6-16 20:02

hugosol 发表于 2026-6-16 19:58
你都用pi了,当然是自己写个扩展统计一下I/O花费比和缓存命中这些信息自己分析,DeepSeek的API都有返回具 ...

确实,我也写一个试试

舞以 发表于 2026-6-16 20:03

能在omp里面实现对gpt订阅用量的监控么

论坛助手,iPhone

misuzu0723 发表于 2026-6-16 20:05

知识库应该没更新。让他列举25年重大事件只能列举到4月份

—— 来自 鹅球 v3.3.96-alpha

hugosol 发表于 2026-6-16 20:08

舞以 发表于 2026-6-16 20:03
能在omp里面实现对gpt订阅用量的监控么

论坛助手,iPhone

统计token数么,我觉得问题应该不大,你把omp源码下载下来,再把gpt的API文档页面给它,问它怎么做就行了

daohao 发表于 2026-6-16 20:17

被灰度到4.1了

杀人鲸 发表于 2026-6-16 21:50

微妙,还以为仅仅只是在网页上有这种测试,但是在手机上的客户端多问几句的话,就很容易也出现类似的思考模式。

—— 来自 S1Fun

羊寢 发表于 2026-6-16 22:37

现在v4f api已经更新了,不过感觉写文比较微妙,有点被蹬多了的v4p那个味道,反倒是v4p现在貌似还行

杀人鲸 发表于 2026-6-16 23:19

羊寢 发表于 2026-6-16 22:37
现在v4f api已经更新了,不过感觉写文比较微妙,有点被蹬多了的v4p那个味道,反倒是v4p现在貌似还行 ...

什么?在API那边居然都已经更新了吗?测试都已经测试完了吗?

—— 来自 S1Fun

startraveller 发表于 2026-6-17 01:22

千千千千鸟 发表于 2026-6-16 19:09
是用agent,也不怎么写代码吧,主要是用来读表格,读文档,写方案啥的,另外可能帮我查资料,帮我看视频之 ...

GPT plus如果coding或者处理/输出大量资料还是不太够用的,个人体感是肯定没有175块的deepseek v4 pro耐用

—— 来自 HUAWEI HOP-AL10, Android 12, 鹅球 v3.5.99-alpha

御坂MKII 发表于 2026-6-17 01:57

舞以 发表于 2026-6-16 20:03
能在omp里面实现对gpt订阅用量的监控么

论坛助手,iPhone

ccusage 支持统计 pi,按理来说也支持 omp

而且现在 codex app 里的统计是全局的,你直接看那个可能也行(只要是自己账号不是走中转站的话

千千千千鸟 发表于 2026-6-17 08:05

startraveller 发表于 2026-6-17 01:22
GPT plus如果coding或者处理/输出大量资料还是不太够用的,个人体感是肯定没有175块的deepseek v4 pro耐 ...

我看到个方法正在尝试:硅基流动在搞活动,邀请一个人给16元赠金卡,咸鱼买一个人邀请6.5元。先薅到硅基流动结束dsv4p的打折再考虑别的方式

zephyrus99 发表于 2026-6-17 08:21

感觉上,厂商们又需要找方向了
现在每个月都出版本,然后号称能力如何如何。但是对于我这种普通用户来说,没有体感变化,好多都是程序员在那“嗯,这个版本是更厉害了”
A畜那个F开头的模型,我听好几个程序员同事吹,说他试了一下的确很厉害啥的。我想说,一共能让你试的时间窗口就两天,你上手三四个小时,怎么就厉害了,你又不是自己有测试集上来就跑测试的。
因为这几家发布新版本号太快,如果没有除了编程之外大规模落地的场景的话,热度快接续不上了(搞笑的是,目前理论上的主力用户程序员又是被冲击最大的,你上午敢吹,下午老板就拿他替代你)

80后卢瑟 发表于 2026-6-17 08:53

有鱼 发表于 2026-6-16 18:30
这是幻觉了还是?

幻觉了,实际上大概是 2025 年 5月左右

德尔惠净水器 发表于 2026-6-17 09:58

flash 和 pro 写小说的差别大不大

→熙← 发表于 2026-6-17 11:58

4.1快来,glm5.2要杀疯了

astkaasa 发表于 2026-6-17 11:59

舞以 发表于 2026-6-16 20:03
能在omp里面实现对gpt订阅用量的监控么

论坛助手,iPhone

tokscale就行
页: 36 37 38 39 40 41 42 43 44 45 [46] 47 48 49 50 51
查看完整版本: FT:DeepSeek下周发|已发,转为v4讨论楼