缓存可没说限时啊
除了打折还有别的东西吧,我前两天抽空用用就花了四十多块,今天高强度用了一天就五块钱。
Chenlh 发表于 2026-4-26 21:08
除了打折还有别的东西吧,我前两天抽空用用就花了四十多块,今天高强度用了一天就五块钱。 ...
前天首发的时候命中有bug,昨天好像热修了
笑死我了,DS有秋之回忆2的剧情,我用框架提取并构建角色卡和RAG场景
用户扮演白河萤抓奸
草,锋哥我哭死。充钱去了。
老哥们,新模型api是直接用就行了吗,原来对应3.2模型的api需不需要再替换成一个新创建的key
L-JoeW 发表于 2026-4-26 22:27
老哥们,新模型api是直接用就行了吗,原来对应3.2模型的api需不需要再替换成一个新创建的key ...
换API网址吧 KEY 不用换
月白天青 发表于 2026-4-26 19:32
酒馆我今天折腾了1个多小时,有点复杂,别人发布的角色卡试了个输出的文本质量很烂,可能是我不会玩。我就 ...
先装选一个预设,然后安装酒馆助手,再安装一个表格总结,有很多,会根据楼层自动总结。
如果需要帮忙可以私我
已严肃充钱
此誓的守望 发表于 2026-4-26 19:54
我没看错吧?一个27B的模型价钱这么贵?一张4090都可以部署的东西15块?
4090可跑不了262144上下文窗口 27b的话 35a3b才可以 这还是q4的情况下
按照lmstudio的计算跑满262144 q5的情况下需要50gb的显存
那非量化的真满血版本体大约是q5的3倍大小 那简单计算也要150gb的显存
消耗并不低
当然你这个比dspro还贵就有点离谱了
—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99
又降价了吗?
闪雷可达鸭 发表于 2026-4-26 23:49
又降价了吗?
我永远追随ds🥹
这性价比太离谱了吧
确实又降价了
🔥DeepSeek Input Cache Price Drop!
Effective immediately, the price for input cache hits across the ENTIRE DeepSeek API series is reduced to just 1/10th of the original price! Build more efficiently for less.
📌Reminder: The DeepSeek-V4-Pro 75% OFF promotion is still active until May 5th, 2026, 15:59 (UTC Time).
🔥 DeepSeek 输入缓存价格下调!
即日起,DeepSeek 全系列 API 的输入缓存命中价格降至原价的十分之一!以更低成本实现更高效构建。
📌 温馨提示:DeepSeek-V4-Pro 七五折优惠活动仍在进行中,截止时间为 2026 年 5 月 5 日 15:59(UTC 时间)。
本帖最后由 御坂MKII 于 2026-4-27 03:23 编辑
跑自己的 bench 测了一下,感觉后训练还要着重提升一下 token efficiency。思维链拉屎太多已经影响自己思考了。大方向的思考上并不比 k2.6 差,但是在细节上确出现了不该出现的思维链思考浅了 感觉智力在,但是自己误导自己了
而且第一个 case 对于 5.5来说,已经是不到 5 分钟就可以查出来的问题了。4pro+max 目前第一轮就啰嗦了 25 分钟。彻底纠正完又是两轮一共 15 分钟
api崩了?
—— 来自 HONOR PTP-AN10, Android 16, 鹅球 v3.5.99-alpha
论坛助手,iPhone
爽写了一个周末。状态还是时上时下的,有时候能roll出一段特别有感觉的东西,但是有可能中断,然后重roll好几次都再也写不出来。上限真的很不错,未来可期。
羊寢 发表于 2026-4-25 21:19
api
这下是真的梁圣了
另外傍晚时看到某脑有人说自己在发的世界书被v4炼进去了,看来他们是真的有人潜伏 ...
某脑是哪
—— 来自 鹅球 v3.3.96
昨天晚上用着用着,发现不扣钱了。 Re:Source
御坂MKII 发表于 2026-4-27 03:18
跑自己的 bench 测了一下,感觉后训练还要着重提升一下 token efficiency。思维链拉屎太多已经影响自己思考 ...
你这是不是多轮拼接的有问题啊。我有一次调用API的时候压缩上下文,破坏了思维连,结果它自己出现反复思考横跳的问题。
所以说v4的agent,代码,还有逻辑推理能力到底是什么水平,能跟opus4.5或者4.6比吗,真不想给A➗送钱了
论坛助手,iPhone
sdefrfg1 发表于 2026-4-27 10:58
所以说v4的agent,代码,还有逻辑推理能力到底是什么水平,能跟opus4.5或者4.6比吗,真不想给A➗送钱了
论 ...
肯定有差距,但是还是要你自己试试,推荐用opencode,跟deepseek官方联调适配过的。一定开max。
有可能在你的工作流里差距不大 Re:Source
终于发布了,试了下,个人感觉 v4 pro 比 GLM 5.1 和 K 2.6 都强,而且强很多,感觉很不错。
—— 来自 鹅球 v3.5.99-alpha
请教个问题,用cherry studio调用的API,模型只留了4pro,结果用量信息里基本都是flash的,是不是哪里配置错了?
acgcon 发表于 2026-4-27 12:06
请教个问题,用cherry studio调用的API,模型只留了4pro,结果用量信息里基本都是flash的,是不是哪里配置 ...
那你把flash 配上然后看看是不是用的pro。
本帖最后由 绝地潜兵 于 2026-4-27 14:03 编辑
我草flash,能把脸颊发红能说成是颧骨发热,这284B的参数真的不够用
本帖最后由 御坂MKII 于 2026-4-27 14:22 编辑
villsian 发表于 2026-4-27 10:38
你这是不是多轮拼接的有问题啊。我有一次调用API的时候压缩上下文,破坏了思维连,结果它自己出现反复思 ...
应该没问题,它现在就是被思维链里的屎污染思路了我们这些 infra 的巨型项目是这样的
有什么app或者桌面小挂件可以实时监视各种apikey消耗量吗,每天几个网站来回刷太蠢了
leina0602 发表于 2026-4-27 14:44
有什么app或者桌面小挂件可以实时监视各种apikey消耗量吗,每天几个网站来回刷太蠢了 ...
让AI写一个不就得了
leina0602 发表于 2026-4-27 14:44
有什么app或者桌面小挂件可以实时监视各种apikey消耗量吗,每天几个网站来回刷太蠢了 ...
看你的调 API key 的框架吧,要是主用 CC、codex之类的 coding agent 的话可以用:https://github.com/mm7894215/TokenTracker
有大佬指点下么,cline的vscode插件怎么设置思考等级?问了AI都说不清楚
还是要ds,glm在高峰期体验完全没有
用了几天v4f在superpowers下也挺好用,还很快
v4pro输出质量咋这么不稳定?同样提示词,有时候直出8000字巨棒巨优美,roll一下写4000字车轱辘话摆烂了,温度0.95,top p0.9
—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
UncleDracula 发表于 2026-4-27 15:22
有大佬指点下么,cline的vscode插件怎么设置思考等级?问了AI都说不清楚
现在支持还不好。最好先用opencode或者claude code Re:Source
有鱼 发表于 2026-4-27 09:44
pro哥智商感觉明显强于flash小妹,现在折上折也是能爽用,但是速度还是不如flash,flash高速真的爽。
跟v4p ...
GPT能力上没有问题,但是口癖真的很烦,这时候DS的口癖至少没那么明显
绝地潜兵 发表于 2026-4-27 13:39
我草flash,能把脸颊发红能说成是颧骨发热,这284B的参数真的不够用
我感觉还是得喂范文。写个两人拥抱的场景跟TM老中医正骨似的,摸的哪根骨头哪块肌肉给我写的明明白白,十分倒胃口
喂了范文之后感觉好多了
本帖最后由 绝地潜兵 于 2026-4-27 17:38 编辑
雪夜霧語 发表于 2026-4-27 17:07
我感觉还是得喂范文。写个两人拥抱的场景跟TM老中医正骨似的,摸的哪根骨头哪块肌肉给我写的明明白白,十 ...
它认为描述身体部位用骨块定位更加精准……
应该还有性别意识形态屎的权重问题,用骨块描述人体不会触发风险
1. 原文:大腿
2. 译文:thigh
3. 逐词比对:大腿(thigh)
4. 负面映射提示:【大腿】(身体部位)可能关联“性暗示/物化/色情”等负面隐喻,尤其在广告、影视或日常调侃中易被客体化。
需要就标注的负面映射深入讨论吗?
举一个例子……反正很emmm
结论:在需要描述身体部位且希望避免客体化时,优先使用解剖学/医学专用术语(如股骨、肱骨、盆骨)是推荐的策略,但必须配合恰当的语境和补充说明(如“大腿区域”对应“股骨及周围软组织”),以防止语义偏差或生硬感。