whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗,我拿来当外网豆包用的
上传个小说让它总结大纲它只能读个26章,多的直接拒绝,还是pro会员呢,纯垃圾玩意
网页端不知道是不是V4
但明显回答变详细了
比之前敷衍的两三段话好太多了
仁义礼智信, Gemini占一个免费送会员的忠.
Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的
gemini文生图还是可以的吧
gemini是分析我的TASK里面的提示词,被DS放大了,这就说明1M上下文的准确度确实有提升的缘故?
这些模型升级prompt要重新优化了
好像有反馈部分Skill调用效果和国产御三家还有些差距,是要等后训练优化的正式版吗
gemini 主要发布后一路降智吧,自己当大号豆包用解决日常还是够的,上次写浏览器小插件还有处理表格脚本,最终结果还行,但是过程都稍微有些磕绊
—— 来自 Xiaomi 24129PN74C, Android 16, 鹅球 v3.5.99
发现写小说是特别能体现大小模型能力差异的地方,27/31b的模型就真的只会几个关键词和动作来回复读,完全理解不了人物心理和互动
高粱河车神 发表于 2026-4-24 14:14
Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的
看怎么比,同样免费版还是比ChatGPT 好用的
高粱河车神 发表于 2026-4-24 14:14
Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的
刚出gemini3pro,确实无敌
现在智商降太多了
多方面原因
弗里德里希大帝 发表于 2026-4-24 14:14
gemini文生图还是可以的吧
只能说姿势确认跟需求分析实现强
画风实在是。。。。
相比之下gptimage2就没那么单调的画风
—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99
看技术报告这次没有用到engram啊,技术不成熟还是什么原因
—— 来自 鹅球 v3.5.99
qz66618 发表于 2026-4-24 14:23
看技术报告这次没有用到engram啊,技术不成熟还是什么原因
—— 来自 鹅球 v3.5.99 ...
后面版本更新的时候会用
基于DeepSeek V4-Pro模型,在8K输入场景,昇腾950超节点可实现TPOT约20ms时单卡Decode 吞吐4700TPS。DeepSeek V4-Flash模型,8K长序列输入场景下可实现TPOT约10ms时单卡Decode 吞吐1600TPS
现在deepseek是不分R1和V3了吗?V4就自己有开和关思考的方式,用的都是V4?
qz66618 发表于 2026-4-24 14:23
看技术报告这次没有用到engram啊,技术不成熟还是什么原因
—— 来自 鹅球 v3.5.99 ...
这种跨CPU的通信对推理和训练的AI Infra压力都是极大的,贸然上风险极高
ml1642879 发表于 2026-4-24 12:09
感谢大A,感谢标普,感谢纳指,感谢道指
Re:Source · Xiaomi 15
歪一下,梁文峰开理想也不好好停车吗
engram我觉得不好说,知乎上看到有人在小模型上复现结果不是太好,只是一个模型提点trick,没有想象中那么有用
— from Xiaomi 23127PN0CC, Android 16, S1 Next Goose v3.5.99
Promeus 发表于 2026-4-24 13:53
可悲的循环又来了是吧?刚刚贴吧那边还说大的要来了,玩不了了呀。没关系,永远都还有下一个可以玩的版本。
—— 来自 S1Fun
ds一如既往的大幅提升了效率。价格上目前1.6t的pro模型和友商大致相当,不过下半年会大幅降价。推理速度上目前官方api提供的v4 flash最快能到100-200 token/s
要注意这个模型已经针对angetic优化了,需要更详细的提示对模型做出指令
目前还是preview版,个人觉得后续应该会先把spciale的超长推理链加进来。engram属于重大技术跨越了,可能还要等一段时间
高粱河车神 发表于 2026-4-24 14:14
Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的
你也说了,那是半年前,现在的信息时代变化可太快了。
—— 来自 S1Fun
findpkq 发表于 2026-4-24 14:18
好像有反馈部分Skill调用效果和国产御三家还有些差距,是要等后训练优化的正式版吗
gemini 主要发布后一路 ...
应该是,现在v4p普遍反应就是后训练不足
后训练不足是算力问题?
底模是和高质量数据有关? Re:Source
无缓存的输入有点贵啊,其他家基本都是输出的四分之一价钱
本帖最后由 羊寢 于 2026-4-24 14:42 编辑
奈落的孤火花 发表于 2026-4-24 14:29
现在deepseek是不分R1和V3了吗?V4就自己有开和关思考的方式,用的都是V4?
官方r1在去年夏天v3.1出来后就不存在了啊……
现在官网api的原本reasoner/chat接口还保留着,得自行调用才有,7月底会撤掉,如果是直接用的话就是只有v4了
Su7 发表于 2026-4-24 14:49
美股开盘就砸是吧
—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99
cloudinsky 发表于 2026-4-24 13:48
小说得按照大型工程来吧。先给整体框架约束。提前规划好啊,每一章节精炼后给到上下文。
完全全文扔进去谁 ...
用ds带着我读了读v4的技术文档,好像整个第二章都是在说是怎么实现超大上下文注意力的,很复杂
试着给了段梗概让v4写小说,虽然还是那个熟悉的味,但是味轻了不少
德尔惠净水器 发表于 2026-4-24 14:29
基于DeepSeek V4-Pro模型,在8K输入场景,昇腾950超节点可实现TPOT约20ms时单卡Decode 吞吐4700TPS。DeepSe ...
怎么PRO比Flash速度还快?
下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间,很大一部分原因就是要跟华子做适配
秦南心 发表于 2026-4-24 14:09
上传个小说让它总结大纲它只能读个26章,多的直接拒绝,还是pro会员呢,纯垃圾玩意
...
你用notebooklm吧,这个读小说还蛮好用的
蒜苗 发表于 2026-4-24 15:14
怎么PRO比Flash速度还快?
TPS 是吞吐量。
目标 TPOT 不一样,所以 Pro 的吞吐要大一些。“TPOT为XXms时”,意思是给定 TPOT 来看 TPS
本帖最后由 ayanamilin 于 2026-4-24 15:27 编辑
vLLM-ascend(昇腾) 也 day-0 support 了,目前只支持 flash,A2 & A3 系列产品都能用:https://docs.vllm.ai/projects/as ... ls/DeepSeek-V4.html
DS 这波真可以算是半个国家队了,国内除了 DS 没有哪家模型和华子合作得如此密切,顶多搞点卡做训推。
体验确实超大杯
—— 来自 HUAWEI LMR-AL10, Android 12, 鹅球 v3.5.99
ayanamilin 发表于 2026-4-24 15:15
下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间,很大一部分原因就是要跟华子做适配 ...
不是晚上7点么
https://github.com/victorchen96/deepseek_v4_rolepaly_instruct/blob/main/README.md
感觉你楼可能不知道,就发一下:ds 做 v4 训练的时候专门加了俩角色扮演和创意写作专用的指令,赞美梁圣和小礼亚圣吧
Re:Source
chuchoselph 发表于 2026-4-24 15:33
不是晚上7点么
删了重新发,改时间了
—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99