2026年1月哪个大模型比较好用?
去年deepseek出来后感觉比强大更重要的是方便,后来单位里也搞了本地部署的deepseek不太好用。后来用了一些其他坛友推荐的豆包、秘塔之类。个人感觉deepseek在写作上越来越不如豆包,主要是写长文不行。用来翻译和修改英文语法问题,以上都不如chatgpt地道。现在市面上的产品这么多,用来中翻英,或者修改英文语法哪家更好用?哪个版本更好用?提示词和API之类的用法有些什么新的技巧吗? 中翻英体感上还是豆包好用提示词没啥新鲜活,提示词直接让gemani写框架,自己优化细节
如果你愿意倒是可以尝试一下opencode+api试试文字工作好不好使,我没需求没这么搞过,但你可以试试 反正我写文是用ds,体感是国模中写得最好的,其他家要么不好调教要么文风不对胃口
不过我是玩创意写作,而且是用酒馆这种前端可以自动总结后隐藏前文,所以长文效果不好这点是感觉不出来 DS最好的是甲薄,用API就完全没甲让写啥写啥 deepseek问问题,很容易参杂献媚或者爹味
一样容易献媚的还有grok和gemini,
所以我现在问问题都是找GPT或者cluade、国产的话找GLM
日常写材料这种A4垃圾那还是豆包
查东西我还挺喜欢夸克调教的千问
写论文是gpt 5.2和gemini 3pro混用,之前感觉ds v3.2 和gemini 2.5 pro写出来差不多,主要是为了配合本地论文的知识库
代码glm4.7 claude gpt 跟着kilo cc混着用 现在此时此刻,综合实力,gemini3 pro无敌。
而写代码opus 4.5稍稍好用一点,写文档gpt 5.2稍稍细致一点,找实时内容grok稍稍出彩一点,实时对话豆包稍稍方便一点。 本帖最后由 gooyoy 于 2026-1-20 17:36 编辑
Gemini好用,就是太民主了。下午的真实事件:
起因为群友发了张图。上面列举了很多美国媒体报道的各种负责新闻,看起来跟牢A说的有些像,我倾向于是有人拿牢A的输出,找AI做了这个图,编造了这个资料,所以想证明一下。于是我找了G老师,精彩的来了:
它直接变成了中国的负面新闻。
我质问他为什么会这样
G老师说他眼花看不清,就是虽然我看不清,但是从字行中还是隐约能感觉,"满本都写着两个字是吃人"是吧
而同样一张图,不管是豆包,还是元宝,都能看出上面的事迹并总结:
所以你说Gemini好不好用呢,确实好用。但是这个所谓的不作恶公司嘛,哈哈
羊寢 发表于 2026-1-20 15:12
反正我写文是用ds,体感是国模中写得最好的,其他家要么不好调教要么文风不对胃口
不过我是玩创意写作,而 ...
有触发词吗,求一个,想试试写ai短片玩 现在用的多的是豆包
DS自我阉割太严重,我让他找一下我回忆的以前我国外交官文章,这个玩意说东西敏感,尼玛的 哈利谢顿 发表于 2026-1-20 18:04
现在用的多的是豆包
DS自我阉割太严重,我让他找一下我回忆的以前我国外交官文章,这个玩意说东西敏感,尼 ...
去用API,不要在网页端或APP端问,那俩问啥都敏感 本帖最后由 MeursaulT 于 2026-1-20 19:00 编辑
实际上很多人对比的时候,并不是在对比模型,而是在对比软件,也就是自带的提示词和工具。
豆包的模型除了能够多模态以外,一无是处,但是它的软件搜索部分做得很好,图像识别也可圈可点。
Deepseek 如果以 API 的角度来看,并没有什么和谐,这一点是 Reddit 上也证实的,只是它的软件和网页版上面有限制,并且因为工具残缺,整体日用不如豆包。
国产的软件里面,搜索做的比较好的其实是千问,像“皮裤套棉裤,必定有缘故”这种歇后语,如果只说后半句,让它答前半句,只有千问能答出来,甚至能说出来出处,Deepseek、 豆包以及 Gemini 都做不到。
Gemini 自从更新到 3 之后,搜索也变得积极了一些,整体体验上佳,再加上和 YouTube 以及 Google Map 的整合,日用水平还不错。只是网页版有太多的和谐以及阉割,美国的产品和谐起来也是毫不手软的。
—— 来自 S1Fun 有知识库的情况下 写文glm4.7比较舒服,逻辑顺畅,大多数情况能一遍过;dsv3.2就是快,但经常会丢失我的要求
豆包用在日常比较方便。都说豆包写材料好用,简单试了一下感觉就纯粹是从网上抄了一篇垃圾来敷衍我,所以到底怎么用
自己用的离线模型千问还行,自用不太会调整
平常工作不说人话的时候就用豆包/元宝/ds,大同小异,材料往里一丢排好版一交
国外的一开始玩来着,次次挂梯麻烦
说起模型今儿连ollama都不能直连了吗 gemini不要直接用,自定gem后相当无敌
再者google的整个生态已经起来了,notebookLM、antigravity、ai studio这几个产品单拎出来都非常能打了
国内差距现在是逐渐被拉大的,卡不够的问题不是一张两张,是差一两个数量级 本帖最后由 stunflare 于 2026-1-20 20:23 编辑
国内模型的话,我个人用着是qwen最强,ds幻觉太太太严重了 我用gemini搞了个游戏开发高手gem,感觉好用的很,一些手感参数调节都能给意见,蓝图也能截图给它看帮忙分析问题
—— 来自 vivo V2405A, Android 16, 鹅球 v3.5.99 本帖最后由 羊寢 于 2026-1-21 07:29 编辑
暗月杀人兔 发表于 2026-1-20 17:42
有触发词吗,求一个,想试试写ai短片玩
我用酒馆是不用自己写提示词直接现成的预设放进去告诉他你想写的内容他就框框写,在官网或者app上玩自己写提示词的话大概就把你要什么样的文风,禁止出现什么东西,可以出现什么元素之类的告诉他就行。
不过在官网和app上玩限制会比较多,如果写擦边甚至nsfw的话还是得用api来写,不写敏感内容的话官网和app也能用,但就像楼主说的,写长了就容易忘记前文
另外还要注意,llm一般新版本刚上线一两周是表现最佳的时候(不光国模,外模也是一样),后面就会因为练新模型等原因智商逐渐下降,然后每天也是会有智商高低的时候,ds3.2刚出时写的是真的好,不过前两周再试感觉就和之前会有一点差距了 最近感觉千问好于豆包,p图和解决小学奥数都更强点,但也没有本质区别 本地部署的模型肯定不大行啦
页:
[1]