话说现在最好用的AI是哪个？

aiooia · 发表于 2025-10-7 19:13

也是刷到极客湾直播切片说ds一直没更新，现在没gpt好用，尤其是多模态，所以才想问句……
感觉我作为一个不懂程序的轻度用户，平常主要拿ds当十万个为什么来用，工作主要靠ds解决excel的公式和宏，但理解逻辑方面ds问题还是挺多的，视频图片就是在用可灵豆包这些（话说首尾帧生成为啥不能选小于5秒），反正国内这些突出一个方便，但限制也多。

羊寢 · 发表于 2025-10-7 19:19

ds9月底二连更哪来的没更新……而且下一次更新大概就是15号，就算15号鸽了11月也多半会更
国内如果说综合能力最强的现在大概是豆包，写文的话还是ds，搞代码的话据说是glm，但因为我对代码不了解也是看别人说的

子虚乌有 · 发表于 2025-10-7 19:22

我用豆包比较多，其次是gpt。都没充钱

zyf199212 · 发表于 2025-10-7 19:26

纯文字生成的话，不花钱或者少花钱的话没有最好用的，都是得几个ai轮着用，不然不管是写文还是写代码，都会碰着ai犟嘴或者对它的文字看腻的情况。肉身在海外的话据说Claude很牛逼，但国内的话实在懒得鼓捣，反正几个国外ai免费额度也够用了

寻龙分金看缠山 · 发表于 2025-10-7 19:27

提示: 作者被禁止或删除内容自动屏蔽

保科智子 · 发表于 2025-10-7 19:28

写八股感觉ds不太行

—— 来自 HONOR FLC-AN00, Android 15, 鹅球 v3.5.99-alpha

naalo2 · 发表于 2025-10-7 19:32

日常问问题用，偶尔问代码
只说自身用得多的
元宝(deepseek）>=gemini>qwen

同样的代码问题
ds初答比较准，但想通过对话引导修正效果一般，感觉比较固执？
gemini初答比较空泛，但能引导修正，问题是容易说着说着忘记前面的内容，产生矛盾

免费的也就这样吧

数独无双 · 发表于 2025-10-7 19:32

主要用ai翻译、学外语和扯淡闲聊，综合使用体验来看GPT最好

死宅真恶心 · 发表于 2025-10-7 19:33

我投grok一票

zypyong · 发表于 2025-10-7 19:33

开电脑的情况下用Gpt多点。剩下的平时用的多的可能是豆包？

Lorraine_Kinney · 发表于 2025-10-7 19:35

本帖最后由 Lorraine_Kinney 于 2025-10-7 19:37 编辑

国内日常办公、检索是豆包
本地部署、微调啥的是qwen
编程主要是glm 4.6
翻译qwenmt，便宜速度快，但是**多；其次是混元，或者gml 4.5 flash
ds我通常拿来处理些文字工作，或者拿来对比
学术方面秘塔 novix aminer wos之类的ai助手

国外检索方面是grok，毕竟能浏览200以上的网页
文字处理是Gemini和gpt5
编程是claudecode搭着的claude sonnet 4.5和 codex搭的gpt5-high

赤星ビスコ · 发表于 2025-10-7 19:38

我用的最多的是gemini吧，有推特数据的gork也不错

ninini212 · 发表于 2025-10-7 19:40

我个人建议楼主还是多来点信息渠道吧，极客湾自己本行都快弄不懂了还评价这个评价那个的

shellcode · 发表于 2025-10-7 19:46

通用任务可以参考 LMArena 的排名，用户盲测出来的结果还是有可信度的。

但实际体验起来哪个更好就真的见仁见智了，尤其很多行业头部公司会自己做调优，这类模型不可能去打榜，所以一般用户很难留意到，
比如楼主这个 excel 公式的场景，飞书的 AI 写公式可能就比别的基础模型好很多。

反正现在很多模型不收费，同个问题都丢过去问问看，下次就知道同类场景下哪个更适合了

烦死了 · 发表于 2025-10-7 20:07

我就当搜索引擎用的，用的白嫖的Gemini pro

big9999 · 发表于 2025-10-7 20:16

写材料豆包劲，算命kimi劲。ds不更新已经是路边一条了

fat · 发表于 2025-10-7 20:23

本帖最后由 fat 于 2025-10-7 22:03 编辑

现在直接订阅Google的pro用Gemini 门槛大吗？

唔，用上了。就普通google门槛

—— 来自 OPPO PKU110, Android 15, 鹅球 v3.5.99-alpha

羊寢 · 发表于 2025-10-7 20:23

big9999 发表于 2025-10-7 20:16
写材料豆包劲，算命kimi劲。ds不更新已经是路边一条了

不是我真的很好奇你们这种ds不更新的说法究竟是从何而来，ds8月更一次3.1，9月更两次3.1t，3.2exp，为什么会觉得没更新

千秋难诉 · 发表于 2025-10-7 20:25

就刘备来说，写纯拔就gork，写剧情拔就gemini

新屋 · 发表于 2025-10-7 20:27

提示: 作者被禁止或删除内容自动屏蔽

无尽的牙刷 · 发表于 2025-10-7 20:37

ds的文言文能力依旧傲视寰宇
话说有时候写点简单的魔兽世界的宏，感觉ds准确率也比chatgpt高

藤井紫 · 发表于 2025-10-7 20:44

提示: 作者被禁止或删除内容自动屏蔽

Hatsune_miku · 发表于 2025-10-7 20:47

写代码最好用的是Claude，但Claude需要付费。
综合来说最好用的且免费的是Google Gemini，GPT比Gemini的跑分略微高了一点但也就只高了一点
缺点是这三个都锁区
所以我平时小型任务用deepseek，偶尔挂美区梯子用Gemini

—— 来自 HUAWEI HMA-AL00, Android 10, 鹅球 v3.5.99-alpha

塌方 · 发表于 2025-10-7 20:51

DS现在查找的网页从之前的50个降低到只有8-10个是个什么情况？

lostfile · 发表于 2025-10-7 21:22

新屋发表于 2025-10-7 20:27
几个月前问过豆包关于霍梅尼和哈梅内伊，本来想看看它的总结发散。结果回答让我很意外，这平台所在地怕不是 ...

豆包是这样的。之前让他翻译一个外媒关于以色列和哈马斯的文章，直接说不符合事实不翻译。
正经外媒华尔街日报。
据说tiktok美国有很多犹太高管。
谨慎怀疑小眼镜片已经投诚了。

naalo2 · 发表于 2025-10-7 21:23

新屋发表于 2025-10-7 20:27
几个月前问过豆包关于霍梅尼和哈梅内伊，本来想看看它的总结发散。结果回答让我很意外，这平台所在地怕不是 ...

ai基本不能用来问这些，屁股极歪

与天争锋_L · 发表于 2025-10-7 21:32

我一般小的找deepseek，大的找grok

—— 来自 Xiaomi 22041211AC, Android 12, 鹅球 v3.5.99

红丽 · 发表于 2025-10-7 21:32

付费用户表示claude最好用
chatgpt时好时坏。。。

狭义文具爱好者 · 发表于 2025-10-7 21:34

本帖最后由狭义文具爱好者于 2025-10-7 21:36 编辑

为什么认为ds提升小就是因为跑分提升有限吧，都在等r2v4级别的提升，v3.1虽然进步不算小但是同期闭源模型进步更大。横评水平没有年初r1的级别。
另一个角度，本来r1刚出那阵子主流模型更新pdf评分柱状图对比都是有ds的，这两个月的pdf逐渐又没了。

big9999 · 发表于 2025-10-7 22:13

羊寢发表于 2025-10-7 20:23
不是我真的很好奇你们这种ds不更新的说法究竟是从何而来，ds8月更一次3.1，9月更两次3.1t，3.2exp，为什 ...

不更新当然指大更，小更新无视他，不大更已经跟不上现在的水平了，同样一篇材料给同样关键词豆包写的就是比d师傅强。

sellboy · 发表于 2025-10-7 22:17

dsv3.2吐字快多了，这自然也是进步。

云卷花开 · 发表于 2025-10-7 23:15

本帖最后由云卷花开于 2025-10-7 23:18 编辑

分情况吧，当前来说如果是普通 chatbot 用户，那么豆包最好
创意写作的话，kimi 和 ds 都不错，这俩针对创意写作的特调风格是类似的，能输出较长的文本，ds 赢一手成本，而如果是特指搞黄色类的创意写作的话， ds 只弱于 gemini
专业用户写代码 glm 和 ds 两家都可以，基本可以当 claude 平替，kimi qwen 能力也行，可惜定价过于幽默
总的来说看需求，不同需求用法不一样，非专业连 api 咋用都不知道的用户无脑用豆包就行，反正也用不出啥区别

ai 本身评价是上面的，一般来说其实大家在讨论模型能力只在更多的还是在谈 ai 团队的能力，说 ds 强其实有时候是从团队打分的，所以有时候普通用户会觉得体感和网上看到的信息不符，评分维度不一样

—— 来自鹅球 v3.3.96

mintslime · 发表于 2025-10-7 23:15

编程体感是claude4.5远不如gpt5，唯一优点是快。一旦出bug，不是那种直接console log能出的bug，claude自己很可能是debug不出来的，要换gpt，当然可能是因为我图快用claude多。
ds写文独一档，3.1不大行，但3.2似乎又喂了之前r1的数据，文风八股和发癫法都很像。强推3.1真是太败好感了。
kimi通识比较强，写脚本一般。
qwen和字节的那啥生图都一般，审美土到难受，建议还是有蕉用蕉。但是qwen的vl模型我觉得挺行。

cabrio · 发表于 2025-10-7 23:38

看你做什么用

目前个人觉得综合来讲哈基米天下第一

diohanmilton · 发表于 2025-10-8 00:26

gemini的深度研究，写学术性综述非常棒。

—— 来自 HONOR PGT-AN10, Android 15, 鹅球 v3.5.99-alpha

Ollie · 发表于 2025-10-8 00:51

我现在比较爱用gemini，等一个ds r2更新

奶香花卷 · 发表于 2025-10-8 00:56

日常ds 3.2 thinking雷打不动，百炼云api输出巨快
多模态需求上2.5pro，openrouter的api
偶尔grok，因为输出也快
天下武功唯快不破

wtwtwt21 · 发表于 2025-10-8 01:26

提示: 作者被禁止或删除内容自动屏蔽

mortal1976 · 发表于 2025-10-8 07:13

狭义文具爱好者发表于 2025-10-7 21:34
为什么认为ds提升小就是因为跑分提升有限吧，都在等r2v4级别的提升，v3.1虽然进步不算小但是同期闭源模型进 ...

个人来说得分无所谓，ds问题是，今年的几次更新，对于幻觉控制基本没有改进，这点对于楼上想拿ai当百科全书的影响极大，问个问题还要去百度核实是否是ai编造的答案，为何不直接用传统搜索引擎或换ai？
在幻觉控制这方面，国产ai提升空间还很大，qwen号称新版本严格控制幻觉，但代价是不检索最新联网数据

caspol · 发表于 2025-10-8 10:12

借楼问问，AI视频的话国内哪个比较好用

		自动登录	找回密码
密码			立即注册

寻龙分金看缠山寻龙分金看缠山当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2023-12-25 头像被屏蔽	发表于 2025-10-7 19:27 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

新屋新屋当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2013-1-19 头像被屏蔽	发表于 2025-10-7 20:27 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

藤井紫藤井紫当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2009-6-2 头像被屏蔽	发表于 2025-10-7 20:44 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

wtwtwt21 wtwtwt21 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2009-7-14 头像被屏蔽	发表于 2025-10-8 01:26 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

[职场] 话说现在最好用的AI是哪个？