FT：DeepSeek下周发｜已发，转为v4讨论楼 - 第28页 - 归墟 - Stage1st

→熙← 发表于 2026-4-26 21:06

缓存可没说限时啊

Chenlh 发表于 2026-4-26 21:08

除了打折还有别的东西吧，我前两天抽空用用就花了四十多块，今天高强度用了一天就五块钱。

爱护动物抓根宝 发表于 2026-4-26 21:20

Chenlh 发表于 2026-4-26 21:08
除了打折还有别的东西吧，我前两天抽空用用就花了四十多块，今天高强度用了一天就五块钱。 ...

前天首发的时候命中有bug，昨天好像热修了

绝地潜兵 发表于 2026-4-26 21:44

笑死我了，DS有秋之回忆2的剧情，我用框架提取并构建角色卡和RAG场景
用户扮演白河萤抓奸

vdo 发表于 2026-4-26 21:59

草，锋哥我哭死。充钱去了。

L-JoeW 发表于 2026-4-26 22:27

老哥们，新模型api是直接用就行了吗，原来对应3.2模型的api需不需要再替换成一个新创建的key

断恶之剑 发表于 2026-4-26 22:29

L-JoeW 发表于 2026-4-26 22:27
老哥们，新模型api是直接用就行了吗，原来对应3.2模型的api需不需要再替换成一个新创建的key ...

换API网址吧 KEY 不用换

脸宽发表于 2026-4-26 22:42

月白天青发表于 2026-4-26 19:32
酒馆我今天折腾了1个多小时，有点复杂，别人发布的角色卡试了个输出的文本质量很烂，可能是我不会玩。我就 ...
先装选一个预设，然后安装酒馆助手，再安装一个表格总结，有很多，会根据楼层自动总结。

如果需要帮忙可以私我

脸宽发表于 2026-4-26 22:50

已严肃充钱

neptunehs 发表于 2026-4-26 23:33

此誓的守望发表于 2026-4-26 19:54
我没看错吧？一个27B的模型价钱这么贵？一张4090都可以部署的东西15块？

4090可跑不了262144上下文窗口 27b的话 35a3b才可以这还是q4的情况下
按照lmstudio的计算跑满262144 q5的情况下需要50gb的显存
那非量化的真满血版本体大约是q5的3倍大小那简单计算也要150gb的显存
消耗并不低
当然你这个比dspro还贵就有点离谱了

—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99

闪雷可达鸭 发表于 2026-4-26 23:49

又降价了吗？

vdo 发表于 2026-4-27 00:21

闪雷可达鸭发表于 2026-4-26 23:49
又降价了吗？

我永远追随ds🥹

chaoswing 发表于 2026-4-27 01:30

这性价比太离谱了吧

宅🍐eriri 发表于 2026-4-27 03:02

确实又降价了

🔥DeepSeek Input Cache Price Drop!

Effective immediately, the price for input cache hits across the ENTIRE DeepSeek API series is reduced to just 1/10th of the original price! Build more efficiently for less.

📌Reminder: The DeepSeek-V4-Pro 75% OFF promotion is still active until May 5th, 2026, 15:59 (UTC Time).
🔥 DeepSeek 输入缓存价格下调！

即日起，DeepSeek 全系列 API 的输入缓存命中价格降至原价的十分之一！以更低成本实现更高效构建。

📌 温馨提示：DeepSeek-V4-Pro 七五折优惠活动仍在进行中，截止时间为 2026 年 5 月 5 日 15:59（UTC 时间）。

御坂MKII 发表于 2026-4-27 03:18

本帖最后由御坂MKII 于 2026-4-27 03:23 编辑

跑自己的 bench 测了一下，感觉后训练还要着重提升一下 token efficiency。思维链拉屎太多已经影响自己思考了。大方向的思考上并不比 k2.6 差，但是在细节上确出现了不该出现的思维链思考浅了感觉智力在，但是自己误导自己了
而且第一个 case 对于 5.5来说，已经是不到 5 分钟就可以查出来的问题了。4pro+max 目前第一轮就啰嗦了 25 分钟。彻底纠正完又是两轮一共 15 分钟

hencechen 发表于 2026-4-27 07:20

api崩了？

—— 来自 HONOR PTP-AN10, Android 16, 鹅球 v3.5.99-alpha

Litccc 发表于 2026-4-27 08:53

论坛助手,iPhone

有鱼发表于 2026-4-27 09:44

ymm1030 发表于 2026-4-27 10:11

爽写了一个周末。状态还是时上时下的，有时候能roll出一段特别有感觉的东西，但是有可能中断，然后重roll好几次都再也写不出来。上限真的很不错，未来可期。

之世郎 发表于 2026-4-27 10:20

羊寢发表于 2026-4-25 21:19
api
这下是真的梁圣了
另外傍晚时看到某脑有人说自己在发的世界书被v4炼进去了，看来他们是真的有人潜伏 ...

某脑是哪

—— 来自鹅球 v3.3.96

yuren 发表于 2026-4-27 10:23

昨天晚上用着用着，发现不扣钱了。 Re:Source

wokazuleaa 发表于 2026-4-27 10:30

villsian 发表于 2026-4-27 10:38

御坂MKII 发表于 2026-4-27 03:18
跑自己的 bench 测了一下，感觉后训练还要着重提升一下 token efficiency。思维链拉屎太多已经影响自己思考 ...

你这是不是多轮拼接的有问题啊。我有一次调用API的时候压缩上下文，破坏了思维连，结果它自己出现反复思考横跳的问题。

sdefrfg1 发表于 2026-4-27 10:58

所以说v4的agent，代码，还有逻辑推理能力到底是什么水平，能跟opus4.5或者4.6比吗，真不想给A➗送钱了

论坛助手,iPhone

overflowal 发表于 2026-4-27 11:14

sdefrfg1 发表于 2026-4-27 10:58
所以说v4的agent，代码，还有逻辑推理能力到底是什么水平，能跟opus4.5或者4.6比吗，真不想给A➗送钱了

论 ...

肯定有差距，但是还是要你自己试试，推荐用opencode，跟deepseek官方联调适配过的。一定开max。
有可能在你的工作流里差距不大 Re:Source

风烨晨曦 发表于 2026-4-27 11:18

终于发布了，试了下，个人感觉 v4 pro 比 GLM 5.1 和 K 2.6 都强，而且强很多，感觉很不错。

—— 来自鹅球 v3.5.99-alpha

acgcon 发表于 2026-4-27 12:06

请教个问题，用cherry studio调用的API，模型只留了4pro，结果用量信息里基本都是flash的，是不是哪里配置错了？

zerona 发表于 2026-4-27 12:22

acgcon 发表于 2026-4-27 12:06
请教个问题，用cherry studio调用的API，模型只留了4pro，结果用量信息里基本都是flash的，是不是哪里配置 ...

那你把flash 配上然后看看是不是用的pro。

绝地潜兵 发表于 2026-4-27 13:39

本帖最后由绝地潜兵于 2026-4-27 14:03 编辑

我草flash，能把脸颊发红能说成是颧骨发热，这284B的参数真的不够用

御坂MKII 发表于 2026-4-27 14:19

本帖最后由御坂MKII 于 2026-4-27 14:22 编辑

villsian 发表于 2026-4-27 10:38
你这是不是多轮拼接的有问题啊。我有一次调用API的时候压缩上下文，破坏了思维连，结果它自己出现反复思 ...
应该没问题，它现在就是被思维链里的屎污染思路了我们这些 infra 的巨型项目是这样的

leina0602 发表于 2026-4-27 14:44

有什么app或者桌面小挂件可以实时监视各种apikey消耗量吗，每天几个网站来回刷太蠢了

wandeeees 发表于 2026-4-27 15:01

leina0602 发表于 2026-4-27 14:44
有什么app或者桌面小挂件可以实时监视各种apikey消耗量吗，每天几个网站来回刷太蠢了 ...

让AI写一个不就得了

ayanamilin 发表于 2026-4-27 15:12

leina0602 发表于 2026-4-27 14:44
有什么app或者桌面小挂件可以实时监视各种apikey消耗量吗，每天几个网站来回刷太蠢了 ...

看你的调 API key 的框架吧，要是主用 CC、codex之类的 coding agent 的话可以用：https://github.com/mm7894215/TokenTracker

UncleDracula 发表于 2026-4-27 15:22

有大佬指点下么，cline的vscode插件怎么设置思考等级？问了AI都说不清楚

→熙← 发表于 2026-4-27 15:26

还是要ds,glm在高峰期体验完全没有
用了几天v4f在superpowers下也挺好用,还很快

半江瑟瑟半江红 发表于 2026-4-27 16:01

v4pro输出质量咋这么不稳定？同样提示词，有时候直出8000字巨棒巨优美，roll一下写4000字车轱辘话摆烂了，温度0.95，top p0.9

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

overflowal 发表于 2026-4-27 16:09

UncleDracula 发表于 2026-4-27 15:22
有大佬指点下么，cline的vscode插件怎么设置思考等级？问了AI都说不清楚

现在支持还不好。最好先用opencode或者claude code Re:Source

近距离作战 发表于 2026-4-27 16:15

有鱼发表于 2026-4-27 09:44
pro哥智商感觉明显强于flash小妹，现在折上折也是能爽用，但是速度还是不如flash，flash高速真的爽。
跟v4p ...

GPT能力上没有问题，但是口癖真的很烦，这时候DS的口癖至少没那么明显

雪夜霧語 发表于 2026-4-27 17:07

绝地潜兵发表于 2026-4-27 13:39
我草flash，能把脸颊发红能说成是颧骨发热，这284B的参数真的不够用

我感觉还是得喂范文。写个两人拥抱的场景跟TM老中医正骨似的，摸的哪根骨头哪块肌肉给我写的明明白白，十分倒胃口
喂了范文之后感觉好多了

绝地潜兵 发表于 2026-4-27 17:27

本帖最后由绝地潜兵于 2026-4-27 17:38 编辑

雪夜霧語发表于 2026-4-27 17:07
我感觉还是得喂范文。写个两人拥抱的场景跟TM老中医正骨似的，摸的哪根骨头哪块肌肉给我写的明明白白，十 ...
它认为描述身体部位用骨块定位更加精准……
应该还有性别意识形态屎的权重问题，用骨块描述人体不会触发风险

1. 原文：大腿
2. 译文：thigh
3. 逐词比对：大腿（thigh）
4. 负面映射提示：【大腿】（身体部位）可能关联“性暗示/物化/色情”等负面隐喻，尤其在广告、影视或日常调侃中易被客体化。

需要就标注的负面映射深入讨论吗？
举一个例子……反正很emmm

结论：在需要描述身体部位且希望避免客体化时，优先使用解剖学/医学专用术语（如股骨、肱骨、盆骨）是推荐的策略，但必须配合恰当的语境和补充说明（如“大腿区域”对应“股骨及周围软组织”），以防止语义偏差或生硬感。

页: 18 19 20 21 22 23 24 25 26 27 [28] 29 30 31 32 33 34 35 36 37

Stage1st's Archiver