→熙← 发表于 2026-4-26 21:06

缓存可没说限时啊

Chenlh 发表于 2026-4-26 21:08

除了打折还有别的东西吧,我前两天抽空用用就花了四十多块,今天高强度用了一天就五块钱。

爱护动物抓根宝 发表于 2026-4-26 21:20

Chenlh 发表于 2026-4-26 21:08
除了打折还有别的东西吧,我前两天抽空用用就花了四十多块,今天高强度用了一天就五块钱。 ...

前天首发的时候命中有bug,昨天好像热修了

绝地潜兵 发表于 2026-4-26 21:44

笑死我了,DS有秋之回忆2的剧情,我用框架提取并构建角色卡和RAG场景
用户扮演白河萤抓奸

vdo 发表于 2026-4-26 21:59

草,锋哥我哭死。充钱去了。

L-JoeW 发表于 2026-4-26 22:27

老哥们,新模型api是直接用就行了吗,原来对应3.2模型的api需不需要再替换成一个新创建的key

断恶之剑 发表于 2026-4-26 22:29

L-JoeW 发表于 2026-4-26 22:27
老哥们,新模型api是直接用就行了吗,原来对应3.2模型的api需不需要再替换成一个新创建的key ...

换API网址吧 KEY 不用换

脸宽 发表于 2026-4-26 22:42

月白天青 发表于 2026-4-26 19:32
酒馆我今天折腾了1个多小时,有点复杂,别人发布的角色卡试了个输出的文本质量很烂,可能是我不会玩。我就 ...
先装选一个预设,然后安装酒馆助手,再安装一个表格总结,有很多,会根据楼层自动总结。

如果需要帮忙可以私我

脸宽 发表于 2026-4-26 22:50

已严肃充钱

neptunehs 发表于 2026-4-26 23:33

此誓的守望 发表于 2026-4-26 19:54
我没看错吧?一个27B的模型价钱这么贵?一张4090都可以部署的东西15块?

4090可跑不了262144上下文窗口 27b的话 35a3b才可以 这还是q4的情况下
按照lmstudio的计算跑满262144 q5的情况下需要50gb的显存
那非量化的真满血版本体大约是q5的3倍大小 那简单计算也要150gb的显存
消耗并不低
当然你这个比dspro还贵就有点离谱了

—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99

闪雷可达鸭 发表于 2026-4-26 23:49

又降价了吗?

vdo 发表于 2026-4-27 00:21

闪雷可达鸭 发表于 2026-4-26 23:49
又降价了吗?

我永远追随ds🥹

chaoswing 发表于 2026-4-27 01:30

这性价比太离谱了吧

宅🍐eriri 发表于 2026-4-27 03:02

确实又降价了

🔥DeepSeek Input Cache Price Drop!

Effective immediately, the price for input cache hits across the ENTIRE DeepSeek API series is reduced to just 1/10th of the original price! Build more efficiently for less.

📌Reminder: The DeepSeek-V4-Pro 75% OFF promotion is still active until May 5th, 2026, 15:59 (UTC Time).
🔥 DeepSeek 输入缓存价格下调!

即日起,DeepSeek 全系列 API 的输入缓存命中价格降至原价的十分之一!以更低成本实现更高效构建。

📌 温馨提示:DeepSeek-V4-Pro 七五折优惠活动仍在进行中,截止时间为 2026 年 5 月 5 日 15:59(UTC 时间)。

御坂MKII 发表于 2026-4-27 03:18

本帖最后由 御坂MKII 于 2026-4-27 03:23 编辑

跑自己的 bench 测了一下,感觉后训练还要着重提升一下 token efficiency。思维链拉屎太多已经影响自己思考了。大方向的思考上并不比 k2.6 差,但是在细节上确出现了不该出现的思维链思考浅了 感觉智力在,但是自己误导自己了
而且第一个 case 对于 5.5来说,已经是不到 5 分钟就可以查出来的问题了。4pro+max 目前第一轮就啰嗦了 25 分钟。彻底纠正完又是两轮一共 15 分钟

hencechen 发表于 2026-4-27 07:20

api崩了?

—— 来自 HONOR PTP-AN10, Android 16, 鹅球 v3.5.99-alpha

Litccc 发表于 2026-4-27 08:53





论坛助手,iPhone

有鱼 发表于 2026-4-27 09:44

ymm1030 发表于 2026-4-27 10:11

爽写了一个周末。状态还是时上时下的,有时候能roll出一段特别有感觉的东西,但是有可能中断,然后重roll好几次都再也写不出来。上限真的很不错,未来可期。

之世郎 发表于 2026-4-27 10:20

羊寢 发表于 2026-4-25 21:19
api
这下是真的梁圣了
另外傍晚时看到某脑有人说自己在发的世界书被v4炼进去了,看来他们是真的有人潜伏 ...

某脑是哪

—— 来自 鹅球 v3.3.96

yuren 发表于 2026-4-27 10:23

昨天晚上用着用着,发现不扣钱了。    Re:Source

wokazuleaa 发表于 2026-4-27 10:30

villsian 发表于 2026-4-27 10:38

御坂MKII 发表于 2026-4-27 03:18
跑自己的 bench 测了一下,感觉后训练还要着重提升一下 token efficiency。思维链拉屎太多已经影响自己思考 ...

你这是不是多轮拼接的有问题啊。我有一次调用API的时候压缩上下文,破坏了思维连,结果它自己出现反复思考横跳的问题。

sdefrfg1 发表于 2026-4-27 10:58

所以说v4的agent,代码,还有逻辑推理能力到底是什么水平,能跟opus4.5或者4.6比吗,真不想给A➗送钱了

论坛助手,iPhone

overflowal 发表于 2026-4-27 11:14

sdefrfg1 发表于 2026-4-27 10:58
所以说v4的agent,代码,还有逻辑推理能力到底是什么水平,能跟opus4.5或者4.6比吗,真不想给A➗送钱了

论 ...

肯定有差距,但是还是要你自己试试,推荐用opencode,跟deepseek官方联调适配过的。一定开max。
有可能在你的工作流里差距不大    Re:Source

风烨晨曦 发表于 2026-4-27 11:18

终于发布了,试了下,个人感觉 v4 pro 比 GLM 5.1 和 K 2.6 都强,而且强很多,感觉很不错。

—— 来自 鹅球 v3.5.99-alpha

acgcon 发表于 2026-4-27 12:06

请教个问题,用cherry studio调用的API,模型只留了4pro,结果用量信息里基本都是flash的,是不是哪里配置错了?

zerona 发表于 2026-4-27 12:22

acgcon 发表于 2026-4-27 12:06
请教个问题,用cherry studio调用的API,模型只留了4pro,结果用量信息里基本都是flash的,是不是哪里配置 ...

那你把flash 配上然后看看是不是用的pro。

绝地潜兵 发表于 2026-4-27 13:39

本帖最后由 绝地潜兵 于 2026-4-27 14:03 编辑

我草flash,能把脸颊发红能说成是颧骨发热,这284B的参数真的不够用

御坂MKII 发表于 2026-4-27 14:19

本帖最后由 御坂MKII 于 2026-4-27 14:22 编辑

villsian 发表于 2026-4-27 10:38
你这是不是多轮拼接的有问题啊。我有一次调用API的时候压缩上下文,破坏了思维连,结果它自己出现反复思 ...
应该没问题,它现在就是被思维链里的屎污染思路了我们这些 infra 的巨型项目是这样的

leina0602 发表于 2026-4-27 14:44

有什么app或者桌面小挂件可以实时监视各种apikey消耗量吗,每天几个网站来回刷太蠢了

wandeeees 发表于 2026-4-27 15:01

leina0602 发表于 2026-4-27 14:44
有什么app或者桌面小挂件可以实时监视各种apikey消耗量吗,每天几个网站来回刷太蠢了 ...

让AI写一个不就得了

ayanamilin 发表于 2026-4-27 15:12

leina0602 发表于 2026-4-27 14:44
有什么app或者桌面小挂件可以实时监视各种apikey消耗量吗,每天几个网站来回刷太蠢了 ...

看你的调 API key 的框架吧,要是主用 CC、codex之类的 coding agent 的话可以用:https://github.com/mm7894215/TokenTracker

UncleDracula 发表于 2026-4-27 15:22

有大佬指点下么,cline的vscode插件怎么设置思考等级?问了AI都说不清楚

→熙← 发表于 2026-4-27 15:26

还是要ds,glm在高峰期体验完全没有
用了几天v4f在superpowers下也挺好用,还很快

半江瑟瑟半江红 发表于 2026-4-27 16:01

v4pro输出质量咋这么不稳定?同样提示词,有时候直出8000字巨棒巨优美,roll一下写4000字车轱辘话摆烂了,温度0.95,top p0.9

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

overflowal 发表于 2026-4-27 16:09

UncleDracula 发表于 2026-4-27 15:22
有大佬指点下么,cline的vscode插件怎么设置思考等级?问了AI都说不清楚

现在支持还不好。最好先用opencode或者claude code    Re:Source

近距离作战 发表于 2026-4-27 16:15

有鱼 发表于 2026-4-27 09:44
pro哥智商感觉明显强于flash小妹,现在折上折也是能爽用,但是速度还是不如flash,flash高速真的爽。
跟v4p ...

GPT能力上没有问题,但是口癖真的很烦,这时候DS的口癖至少没那么明显

雪夜霧語 发表于 2026-4-27 17:07

绝地潜兵 发表于 2026-4-27 13:39
我草flash,能把脸颊发红能说成是颧骨发热,这284B的参数真的不够用

我感觉还是得喂范文。写个两人拥抱的场景跟TM老中医正骨似的,摸的哪根骨头哪块肌肉给我写的明明白白,十分倒胃口
喂了范文之后感觉好多了

绝地潜兵 发表于 2026-4-27 17:27

本帖最后由 绝地潜兵 于 2026-4-27 17:38 编辑

雪夜霧語 发表于 2026-4-27 17:07
我感觉还是得喂范文。写个两人拥抱的场景跟TM老中医正骨似的,摸的哪根骨头哪块肌肉给我写的明明白白,十 ...
它认为描述身体部位用骨块定位更加精准……
应该还有性别意识形态屎的权重问题,用骨块描述人体不会触发风险

1. 原文:大腿
2. 译文:thigh
3. 逐词比对:大腿(thigh)
4. 负面映射提示:【大腿】(身体部位)可能关联“性暗示/物化/色情”等负面隐喻,尤其在广告、影视或日常调侃中易被客体化。

需要就标注的负面映射深入讨论吗?
举一个例子……反正很emmm

结论:在需要描述身体部位且希望避免客体化时,优先使用解剖学/医学专用术语(如股骨、肱骨、盆骨)是推荐的策略,但必须配合恰当的语境和补充说明(如“大腿区域”对应“股骨及周围软组织”),以防止语义偏差或生硬感。

页: 18 19 20 21 22 23 24 25 26 27 [28] 29 30 31 32 33 34 35 36 37
查看完整版本: FT:DeepSeek下周发|已发,转为v4讨论楼