阿里发布 Qwen3.7-Plus 模型,升级多模态交互混合 AI 智能体
本帖最后由 德尔惠净水器 于 2026-6-2 08:37 编辑阿里千问大模型今天(6 月 2 日)发布博文,宣布推出 Qwen3.7-Plus 模型,定位为多模态交互混合智能体。
Qwen3.7-Plus 是 Qwen3.7 的多模态升级版,核心定位是视觉与语言统一的智能体基座。
它保留文本、编码、工具使用和生产力工作流能力,同时强化视觉理解、视觉推理和跨模态任务处理。
在模型表现上,Qwen3.7-Plus 凭 Vision Arena 成绩帮助阿里进入全球前 5、中国第 1。
纯文本测试中,它接近 Max 级别模型,在编码智能体、通用智能体、推理、指令遵循和多语言任务上保持强表现。 试用过后的评价,很一般 想起来之前吹了半天和GPT5.5不相上下的国模A(Qwen 3.7 MAX),出来以后果然是刷分第一名😅
论坛助手,iPhone qwen一直都这样,只有纸面参数强
—— 来自 鹅球 v3.5.99 qwen经典刷分了 天天吹跑分其实没啥用,不如学学deepseek,实话实说,该怎么样就怎么样。不会qwen的研发团队做vibe coding的时候从来不用自己的模型吧 跟此前的preview版有啥区别吗 事实证明刷榜没有用,连手机都不跑分,实际的工程能力才是大模型的评判标准,行不行,真实做一个项目就一目了然了。 这应该是对标豆包瞄准下沉市场,跑个高分也是有用的,毕竟有的人只看得懂这个
—— 来自 nubia NX809J, Android 16, 鹅球 v3.5.99-alpha 跑分越来越高,实际能力没啥进步。
国外模型也一个样子,是不是ai这轮到头了?LLM永远不是agi Jet.Black 发表于 2026-6-2 09:09
跑分越来越高,实际能力没啥进步。
国外模型也一个样子,是不是ai这轮到头了?LLM永远不是agi ...
不是的,至少chatgpt-5.5进步是真的明显(不抽风的情况下) drodchang 发表于 2026-6-2 09:16
不是的,至少chatgpt-5.5进步是真的明显(不抽风的情况下)
Gpt 5.5体感和opus 4.6差不多
opus 4.8 4.7也和4.6差不多,llm在原地打转有段日子了 但是 qwen 一直都是高分低能代表
论坛助手,iPhone 豆包属于llm吗,为什么那么强
—— 来自 Hisense HNR320T, Android 10, 鹅球 v3.5.99-alpha 拜拜 发表于 2026-6-2 10:28
豆包属于llm吗,为什么那么强
—— 来自 Hisense HNR320T, Android 10, 鹅球 v3.5.99-alpha ...
糖包从来没有强过,但它入口做得足够好覆盖面足够广…… 跑分没输过,问你用吗一问一个不吱声 Jet.Black 发表于 2026-6-2 09:09
跑分越来越高,实际能力没啥进步。
国外模型也一个样子,是不是ai这轮到头了?LLM永远不是agi ...
进步其实还是蛮大的,现在的3.6 27b,大多数任务上爆了去年7月的235b问题不大,就是397b进步实在有限 qwen 3.7 max 强制用英文CoT, 表现会好很多 借楼问下现在国产有没有生图能和GPT比较一下的,主要是生成海报,花钱的也行 hyde999 发表于 2026-6-2 10:42
借楼问下现在国产有没有生图能和GPT比较一下的,主要是生成海报,花钱的也行 ...
Image2现在独一档,不说国产我个人用下来nano banana2都差他一截。国产商业模型其实没怎么在生图上使力,阿里家几个开源的生图模型是不错,但能力上限对于小模型肯定是不高的。既然只是做海报还愿意花钱,直接找个gpt image2的中转站就完了,也就几毛钱一张。 tillnight 发表于 2026-6-2 11:01
Image2现在独一档,不说国产我个人用下来nano banana2都差他一截。国产商业模型其实没怎么在生图上使力, ...
谢谢大佬 有稳定的点的中转站推荐不 阿里的东西,呵呵
之前不是吹阿里有个做视频的多牛逼嘛,也是跑分怎样怎样,我就说试试,拿给seedance20一样的无聊和提示词狗屁都生成不出来。 Q问会脸不红心不挑的跟你扯谎,编数据,就生编,我让他查上市公司年报给个百分比,他给编了个,还围绕这个假数据给了我一堆分析,跟真的一样。
页:
[1]