找回密码
 立即注册
搜索
查看: 4412|回复: 52

[职场] 话说现在最好用的AI是哪个?

[复制链接]
发表于 2025-10-7 19:13 | 显示全部楼层 |阅读模式
也是刷到极客湾直播切片说ds一直没更新,现在没gpt好用,尤其是多模态,所以才想问句……
感觉我作为一个不懂程序的轻度用户,平常主要拿ds当十万个为什么来用,工作主要靠ds解决excel的公式和宏,但理解逻辑方面ds问题还是挺多的,视频图片就是在用可灵豆包这些(话说首尾帧生成为啥不能选小于5秒),反正国内这些突出一个方便,但限制也多。
回复

使用道具 举报

     
发表于 2025-10-7 19:19 来自手机 | 显示全部楼层
ds9月底二连更哪来的没更新……而且下一次更新大概就是15号,就算15号鸽了11月也多半会更
国内如果说综合能力最强的现在大概是豆包,写文的话还是ds,搞代码的话据说是glm,但因为我对代码不了解也是看别人说的
回复

使用道具 举报

     
发表于 2025-10-7 19:22 来自手机 | 显示全部楼层
我用豆包比较多,其次是gpt。都没充钱
回复

使用道具 举报

     
发表于 2025-10-7 19:26 | 显示全部楼层
纯文字生成的话,不花钱或者少花钱的话没有最好用的,都是得几个ai轮着用,不然不管是写文还是写代码,都会碰着ai犟嘴或者对它的文字看腻的情况。肉身在海外的话据说Claude很牛逼,但国内的话实在懒得鼓捣,反正几个国外ai免费额度也够用了
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-10-7 19:27 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-10-7 19:28 来自手机 | 显示全部楼层
写八股感觉ds不太行

—— 来自 HONOR FLC-AN00, Android 15, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2025-10-7 19:32 来自手机 | 显示全部楼层
日常问问题用,偶尔问代码
只说自身用得多的
元宝(deepseek)>=gemini>qwen

同样的代码问题
ds初答比较准,但想通过对话引导修正效果一般,感觉比较固执?
gemini初答比较空泛,但能引导修正,问题是容易说着说着忘记前面的内容,产生矛盾

免费的也就这样吧
回复

使用道具 举报

     
发表于 2025-10-7 19:32 | 显示全部楼层
主要用ai翻译、学外语和扯淡闲聊,综合使用体验来看GPT最好
回复

使用道具 举报

     
发表于 2025-10-7 19:33 | 显示全部楼层
我投grok一票
回复

使用道具 举报

     
发表于 2025-10-7 19:33 | 显示全部楼层
开电脑的情况下用Gpt多点。剩下的平时用的多的可能是豆包?
回复

使用道具 举报

     
发表于 2025-10-7 19:35 | 显示全部楼层
本帖最后由 Lorraine_Kinney 于 2025-10-7 19:37 编辑

国内日常办公、检索是豆包
本地部署、微调啥的是qwen
编程主要是glm 4.6
翻译qwenmt,便宜速度快,但是**多;其次是混元,或者gml 4.5 flash
ds我通常拿来处理些文字工作,或者拿来对比
学术方面 秘塔 novix aminer wos之类的ai助手

国外检索方面是grok,毕竟能浏览200以上的网页
文字处理是Gemini和gpt5
编程是claudecode搭着的claude sonnet 4.5和 codex搭的gpt5-high
回复

使用道具 举报

     
发表于 2025-10-7 19:38 来自手机 | 显示全部楼层
我用的最多的是gemini吧,有推特数据的gork也不错
回复

使用道具 举报

     
发表于 2025-10-7 19:40 来自手机 | 显示全部楼层
我个人建议楼主还是多来点信息渠道吧,极客湾自己本行都快弄不懂了还评价这个评价那个的
回复

使用道具 举报

发表于 2025-10-7 19:46 | 显示全部楼层
通用任务可以参考 LMArena 的排名,用户盲测出来的结果还是有可信度的。

但实际体验起来哪个更好就真的见仁见智了,尤其很多行业头部公司会自己做调优,这类模型不可能去打榜,所以一般用户很难留意到,
比如楼主这个 excel 公式的场景,飞书的 AI 写公式可能就比别的基础模型好很多。

反正现在很多模型不收费,同个问题都丢过去问问看,下次就知道同类场景下哪个更适合了
回复

使用道具 举报

     
发表于 2025-10-7 20:07 | 显示全部楼层
我就当搜索引擎用的,用的白嫖的Gemini pro
回复

使用道具 举报

发表于 2025-10-7 20:16 来自手机 | 显示全部楼层
写材料豆包劲,算命kimi劲。ds不更新已经是路边一条了
回复

使用道具 举报

发表于 2025-10-7 20:23 来自手机 | 显示全部楼层
本帖最后由 fat 于 2025-10-7 22:03 编辑

现在直接订阅Google的pro用Gemini 门槛大吗?

唔,用上了。就普通google门槛

—— 来自 OPPO PKU110, Android 15, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2025-10-7 20:23 来自手机 | 显示全部楼层
big9999 发表于 2025-10-7 20:16
写材料豆包劲,算命kimi劲。ds不更新已经是路边一条了

不是我真的很好奇你们这种ds不更新的说法究竟是从何而来,ds8月更一次3.1,9月更两次3.1t,3.2exp,为什么会觉得没更新
回复

使用道具 举报

     
发表于 2025-10-7 20:25 | 显示全部楼层
就刘备来说,写纯拔就gork,写剧情拔就gemini
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-10-7 20:27 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-10-7 20:37 | 显示全部楼层
ds的文言文能力依旧傲视寰宇
话说有时候写点简单的魔兽世界的宏,感觉ds准确率也比chatgpt高
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-10-7 20:44 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-10-7 20:47 来自手机 | 显示全部楼层
写代码最好用的是Claude,但Claude需要付费。
综合来说最好用的且免费的是Google Gemini,GPT比Gemini的跑分略微高了一点但也就只高了一点
缺点是这三个都锁区
所以我平时小型任务用deepseek,偶尔挂美区梯子用Gemini

—— 来自 HUAWEI HMA-AL00, Android 10, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2025-10-7 20:51 | 显示全部楼层
DS现在查找的网页从之前的50个降低到只有8-10个是个什么情况?
回复

使用道具 举报

     
发表于 2025-10-7 21:22 | 显示全部楼层
新屋 发表于 2025-10-7 20:27
几个月前问过豆包关于霍梅尼和哈梅内伊,本来想看看它的总结发散。结果回答让我很意外,这平台所在地怕不是 ...

豆包是这样的。之前让他翻译一个外媒关于以色列和哈马斯的文章,直接说不符合事实不翻译。
正经外媒华尔街日报。
据说tiktok美国有很多犹太高管。
谨慎怀疑小眼镜片已经投诚了。
回复

使用道具 举报

     
发表于 2025-10-7 21:23 来自手机 | 显示全部楼层
新屋 发表于 2025-10-7 20:27
几个月前问过豆包关于霍梅尼和哈梅内伊,本来想看看它的总结发散。结果回答让我很意外,这平台所在地怕不是 ...

ai基本不能用来问这些,屁股极歪
回复

使用道具 举报

     
发表于 2025-10-7 21:32 来自手机 | 显示全部楼层
我一般小的找deepseek,大的找grok

—— 来自 Xiaomi 22041211AC, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2025-10-7 21:32 | 显示全部楼层
付费用户表示claude最好用
chatgpt时好时坏。。。
回复

使用道具 举报

     
发表于 2025-10-7 21:34 来自手机 | 显示全部楼层
本帖最后由 狭义文具爱好者 于 2025-10-7 21:36 编辑

为什么认为ds提升小就是因为跑分提升有限吧,都在等r2v4级别的提升,v3.1虽然进步不算小但是同期闭源模型进步更大。横评水平没有年初r1的级别。
另一个角度,本来r1刚出那阵子主流模型更新pdf评分柱状图对比都是有ds的,这两个月的pdf逐渐又没了。
回复

使用道具 举报

发表于 2025-10-7 22:13 来自手机 | 显示全部楼层
羊寢 发表于 2025-10-7 20:23
不是我真的很好奇你们这种ds不更新的说法究竟是从何而来,ds8月更一次3.1,9月更两次3.1t,3.2exp,为什 ...

不更新当然指大更,小更新无视他,不大更已经跟不上现在的水平了,同样一篇材料给同样关键词豆包写的就是比d师傅强。
回复

使用道具 举报

     
发表于 2025-10-7 22:17 来自手机 | 显示全部楼层
dsv3.2吐字快多了,这自然也是进步。
回复

使用道具 举报

     
发表于 2025-10-7 23:15 来自手机 | 显示全部楼层
本帖最后由 云卷花开 于 2025-10-7 23:18 编辑

分情况吧,当前来说如果是普通 chatbot 用户,那么豆包最好
创意写作的话,kimi 和 ds 都不错,这俩针对创意写作的特调风格是类似的,能输出较长的文本,ds 赢一手成本,而如果是特指搞黄色类的创意写作的话, ds 只弱于 gemini
专业用户写代码 glm 和 ds 两家都可以,基本可以当 claude 平替,kimi qwen 能力也行,可惜定价过于幽默
总的来说看需求,不同需求用法不一样,非专业连 api 咋用都不知道的用户无脑用豆包就行,反正也用不出啥区别

ai 本身评价是上面的,一般来说其实大家在讨论模型能力只在更多的还是在谈 ai 团队的能力,说 ds 强其实有时候是从团队打分的,所以有时候普通用户会觉得体感和网上看到的信息不符,评分维度不一样

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-10-7 23:15 来自手机 | 显示全部楼层
编程体感是claude4.5远不如gpt5,唯一优点是快。一旦出bug,不是那种直接console log能出的bug,claude自己很可能是debug不出来的,要换gpt,当然可能是因为我图快用claude多。
ds写文独一档,3.1不大行,但3.2似乎又喂了之前r1的数据,文风八股和发癫法都很像。强推3.1真是太败好感了。
kimi通识比较强,写脚本一般。
qwen和字节的那啥生图都一般,审美土到难受,建议还是有蕉用蕉。但是qwen的vl模型我觉得挺行。
回复

使用道具 举报

发表于 2025-10-7 23:38 来自手机 | 显示全部楼层
看你做什么用

目前个人觉得综合来讲哈基米天下第一
回复

使用道具 举报

     
发表于 2025-10-8 00:26 来自手机 | 显示全部楼层
gemini的深度研究,写学术性综述非常棒。

—— 来自 HONOR PGT-AN10, Android 15, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2025-10-8 00:51 | 显示全部楼层
我现在比较爱用gemini,等一个ds r2更新
回复

使用道具 举报

     
发表于 2025-10-8 00:56 | 显示全部楼层
日常ds 3.2 thinking雷打不动,百炼云api输出巨快
多模态需求上2.5pro,openrouter的api
偶尔grok,因为输出也快
天下武功唯快不破
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-10-8 01:26 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-10-8 07:13 来自手机 | 显示全部楼层
狭义文具爱好者 发表于 2025-10-7 21:34
为什么认为ds提升小就是因为跑分提升有限吧,都在等r2v4级别的提升,v3.1虽然进步不算小但是同期闭源模型进 ...

个人来说得分无所谓,ds问题是,今年的几次更新,对于幻觉控制基本没有改进,这点对于楼上想拿ai当百科全书的影响极大,问个问题还要去百度核实是否是ai编造的答案,为何不直接用传统搜索引擎或换ai?
在幻觉控制这方面,国产ai提升空间还很大,qwen号称新版本严格控制幻觉,但代价是不检索最新联网数据
回复

使用道具 举报

     
发表于 2025-10-8 10:12 | 显示全部楼层
借楼问问,AI视频的话国内哪个比较好用
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-25 15:38 , Processed in 0.375637 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表