找回密码
 立即注册
搜索

[生活] 感觉现在在ai使用上也两极分化的很严重?

[复制链接]
     
发表于 2025-11-27 07:22 来自手机 | 显示全部楼层
不是两极分化啊,在专业的工作内容上,哪怕性能只好一点,各行各业的人也都会选择更好用的工具的
回复

使用道具 举报

     
发表于 2025-11-27 07:47 来自手机 | 显示全部楼层
那么写材料用哪个好些?
回复

使用道具 举报

     
发表于 2025-11-27 07:59 | 显示全部楼层
mitzvah 发表于 2025-11-27 05:46
都不用glm吗,我觉得国内glm是最好的,够聪明也够便宜,哪怕本地部署glm4.5air也爆了qwen3 next啊

主要用来辅助翻译跟问日常问题,确实能感觉出glm4.6是国内最好用的,哪怕算上国外模型,也就gemini3出了后能才能胜出
回复

使用道具 举报

     
发表于 2025-11-27 08:05 | 显示全部楼层
无尽的牙刷 发表于 2025-11-27 07:59
主要用来辅助翻译跟问日常问题,确实能感觉出glm4.6是国内最好用的,哪怕算上国外模型,也就gemini3出了 ...

对一般人来说,试错成本太高了,不是随便对几句话就能摸到模型能力到底好不好的,模型跑分刷榜也就那么回事

对绝大数人的体验来说,就是觉得他用了上百小时的那个最好用,因为不好用他早换了,有点类似于imdb上电视剧的高分会普遍比电影的高分高个0.5分左右,因为追着看电视剧的观众普遍对那部电视剧是有好感的
回复

使用道具 举报

     
发表于 2025-11-27 08:20 来自手机 | 显示全部楼层
写代码这块目前用下来综合体验最好的确实是Gemini对用户意图推测也是最准的
日常问题倒是跟别的AI差距不大

—— 来自 OPPO PKJ110, Android 16, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2025-11-27 08:59 | 显示全部楼层
广州粉肠 发表于 2025-11-26 22:01
在我的理解里,写代码不都要上下文,但ds不是只有对话吗?也没法上传很多个文本吧,那怎么写 ...

直接把源代码文件往网页上丢呀
回复

使用道具 举报

头像被屏蔽
发表于 2025-11-27 08:59 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-11-27 09:05 来自手机 | 显示全部楼层
本帖最后由 狭义文具爱好者 于 2025-11-27 09:09 编辑

程序员本来就是市场前景的重要一环,claude真正翻身做主不就是3.5sonnet之后api卖了个爽。
目前来看这是唯一明晰的付费用户群体了,连带着所有模型更新都朝着这个方向做题家化,闭三家都如此。现在做题和工具使用上确实是代差了。
毕竟干其他活一个月花个20刀充会员,是消费,程序员一个月花上百刀买api和会员说不定还能回本呢。

另外,其实写刘备的也在乎,能用gemini和claude的,很少有人回去用ds,这里上下文其实都是次要问题,gpt倒是历史遗留问题用的人一直有,但不多。

而实验室和企业那要考虑的肯定就多了,而且算力闲着也是闲着。
回复

使用道具 举报

     
发表于 2025-11-27 11:50 | 显示全部楼层
我有个同学在药企做研发,平常要用python写实验程序,去年问过她,说她们公司是自己部署的,但没有说具体用哪个模型。而且仅作为辅助,核心的一些工作没啥大帮助。
回复

使用道具 举报

发表于 2025-11-27 18:14 | 显示全部楼层
本帖最后由 mitzvah 于 2025-11-27 18:16 编辑
agsva 发表于 2025-11-27 11:50
我有个同学在药企做研发,平常要用python写实验程序,去年问过她,说她们公司是自己部署的,但没有说具体用 ...

glm4.6都能开源部署的今天,去年那些破模型怎么比得了?不是要说开源,就算闭源,编程而论,去年的gpt4o gpto1,放现在连本地部署的q4版glm4.5 air都比不了的
回复

使用道具 举报

发表于 2025-11-27 18:15 | 显示全部楼层
llm的性能五六十天暴增一波,30-60b模型跟顶级开源模型相比一般落后一年,去年都啥时候的老黄历了
回复

使用道具 举报

     
发表于 2025-11-27 18:24 来自手机 | 显示全部楼层
日常信息提问确认怎么没人用自带手机语音助手
豆包之类每次要打开不会跟繁琐吗
回复

使用道具 举报

     
发表于 2025-11-27 19:08 | 显示全部楼层
差距真的很大,除非你就纯当搜索引擎用。
回复

使用道具 举报

     
发表于 2025-11-27 19:21 | 显示全部楼层
我一般用来写文、跑期货策略以及讨论些历史问题和日常问题,一直在用DS,偶尔用用豆包或者KIMI
国外的AI基本都锁IP,虽然有梯子但我懒得去弄,因为DS已经够用了
年纪大了,真的懒得折腾了,你不让我用,我也就懒得去用
回复

使用道具 举报

     
发表于 2025-11-27 20:00 来自手机 | 显示全部楼层
我也是平常都是拿来写文,用下来综合体感最好的还是ds
国外御三家我用比较多的是哈基米,哈基米确实很聪明,但写文时如果没有预设prompt很容易就出现发癫神化之类的毛病,而且写出来的东西感觉和我口味不是很搭
另外国外模型我有时候会用下grok,但怎么说,它写出来的剧情就完全是那种老美口味,哈基米甚至都没那么重的老美味道
国内模型glm4.6我觉得是仅次于ds的水平,但glm问题是太听话了,你给个大纲它就完全按大纲来写,不会自己额外安排一些剧情(当然也有人会喜欢这种,但对我来说这算是个扣分点)。
k2t的话……我不知道是酒馆预设的问题还是这模型本身的问题,反正写出来的都没法让我满意,我给大纲它会用很简短的剧情把我的大纲内容写完然后开始自我发挥,然而自我发挥的内容又通常不符合我给的设定……而且还有个重复的问题,所以我也不是很喜欢。
ds写作能力方面0528和3.1t是最好的,但3.1t大概因为是v3架构的关系字数老是没法达到我的要求,0528当初是真的随便写写就能超过我规定的字数。这两个版本都是写作会很细腻,特别是3.1t(另外3.1t的nsfw写得很好,这也是我喜欢用它的原因之一)。相比之下3.2exp文笔就比较死人了……但据说强行调教的话sfw还是能写好,但nsfw是真的没救。
回复

使用道具 举报

     
发表于 2025-11-27 20:21 | 显示全部楼层
gemini一年的羊毛是真良心,就是锁区太难搞了,转区也麻烦
回复

使用道具 举报

     
发表于 2025-11-27 20:21 | 显示全部楼层
主要是费用问题和安全问题 自己用倒是无所谓  工程落地还是考虑Qwen Kimi Deepseek这种可以自己部署的更安全。

而且说实话 在大部分场景下是足够用的。
回复

使用道具 举报

发表于 2025-11-27 20:32 | 显示全部楼层
我用豆包
回复

使用道具 举报

     
发表于 2025-11-27 22:47 | 显示全部楼层
普通人肯定用便宜易用的Ai啊,或者说稳定的Ai,一般使用场景早就够用了。
那种极端应用场景又不是人人都会遇到。
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-11-27 22:52 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-11-27 22:58 | 显示全部楼层
上面说的本地调 API 吧,现在的硬件水平,能支持一般人本地部署了?这东西要 7 万啊,最多也就部署个量化版本

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-11-27 23:01 | 显示全部楼层
Vacuolar 发表于 2025-11-26 21:59
后者很好理解,我能自己部署为什么要组网再享受各种不能即时回应的问题,并且思考各种可能的法律问题。
前 ...

本地部署那股热劲过去后基本就图一乐了,除了出点不好说的图,其他就那样了
回复

使用道具 举报

发表于 2025-11-27 23:26 | 显示全部楼层
本帖最后由 mitzvah 于 2025-11-28 05:48 编辑
moekyo 发表于 2025-11-27 22:58
上面说的本地调 API 吧,现在的硬件水平,能支持一般人本地部署了?这东西要 7 万啊,最多也就部署个量化版 ...

这个现在真不行,我手上就有一台96g的,只有跑30b模型是比较舒服,拿来跑120b q4 glm4.5air都慢的要死要活,极其痛苦。瓶颈根本不在显存容量或者带宽。主要就是算力,真实算力只有38Tflops的水平,且完全没有对fp8,in4的加速能力

算力太低了,导致提示处理只有4090十分之一的水平,拿来跑kilocode ,一轮对话,一组操作消耗十几ktoken起步,要等几分钟才吐字


至少要等下一代或者下下代的m5ultra,上张量单元,pp处理能力4.5倍加速实装之后才有一点实用性


不过按照历史规律,一年以后的30b开源模型,差不多就能有今天glm4.6的agent能力,到时候,现在的96g m3 ultra就有实用性了。然而那时候如果买一台64g版 的m5pro估计更加实用,更大显存也没有多少实际意义
回复

使用道具 举报

     
发表于 2025-11-27 23:42 来自手机 | 显示全部楼层
大部分人的需求也就是个高级搜索引擎啊,这方面豆包体验就很好了
专业的事情再找专业的模型干
回复

使用道具 举报

头像被屏蔽
发表于 2025-11-27 23:55 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-11-28 01:09 | 显示全部楼层
mitzvah 发表于 2025-11-27 23:26
这个现在真不行,我手上就有一台96g的,只有跑30b模型是比较舒服,拿来跑120b q4 glm4.5air都慢的要死要活 ...

只能说慢是慢,但是还能吐字,只能说距离个人部署的时代还早着呢
回复

使用道具 举报

发表于 2025-11-28 03:39 来自手机 | 显示全部楼层
claude,反正公司付钱
收钱还是有道理的,生产力工具和消费产品不是一个价格模型

— from samsung SM-S911U1, Android 16, S1 Next Goose v3.5.99
回复

使用道具 举报

     
发表于 2025-11-28 04:34 | 显示全部楼层
习惯白嫖Gemini,pro试完了就切flash
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-21 05:57 , Processed in 0.149300 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表