德尔惠净水器 发表于 2026-6-2 08:35

阿里发布 Qwen3.7-Plus 模型,升级多模态交互混合 AI 智能体

本帖最后由 德尔惠净水器 于 2026-6-2 08:37 编辑

阿里千问大模型今天(6 月 2 日)发布博文,宣布推出 Qwen3.7-Plus 模型,定位为多模态交互混合智能体。

Qwen3.7-Plus 是 Qwen3.7 的多模态升级版,核心定位是视觉与语言统一的智能体基座。

它保留文本、编码、工具使用和生产力工作流能力,同时强化视觉理解、视觉推理和跨模态任务处理。

在模型表现上,Qwen3.7-Plus 凭 Vision Arena 成绩帮助阿里进入全球前 5、中国第 1。




纯文本测试中,它接近 Max 级别模型,在编码智能体、通用智能体、推理、指令遵循和多语言任务上保持强表现。

drodchang 发表于 2026-6-2 08:37

试用过后的评价,很一般

忧郁的杰哥 发表于 2026-6-2 08:38

Litccc 发表于 2026-6-2 08:41

想起来之前吹了半天和GPT5.5不相上下的国模A(Qwen 3.7 MAX),出来以后果然是刷分第一名😅

论坛助手,iPhone

schneehertz 发表于 2026-6-2 08:43

qwen一直都这样,只有纸面参数强

—— 来自 鹅球 v3.5.99

二岩枫 发表于 2026-6-2 08:48

qwen经典刷分了

Van夫膜开 发表于 2026-6-2 08:50

天天吹跑分其实没啥用,不如学学deepseek,实话实说,该怎么样就怎么样。不会qwen的研发团队做vibe coding的时候从来不用自己的模型吧

酱狐狸 发表于 2026-6-2 08:52

跟此前的preview版有啥区别吗

drodchang 发表于 2026-6-2 08:56

事实证明刷榜没有用,连手机都不跑分,实际的工程能力才是大模型的评判标准,行不行,真实做一个项目就一目了然了。

tk553521 发表于 2026-6-2 09:08

这应该是对标豆包瞄准下沉市场,跑个高分也是有用的,毕竟有的人只看得懂这个

—— 来自 nubia NX809J, Android 16, 鹅球 v3.5.99-alpha

Jet.Black 发表于 2026-6-2 09:09

跑分越来越高,实际能力没啥进步。

国外模型也一个样子,是不是ai这轮到头了?LLM永远不是agi

drodchang 发表于 2026-6-2 09:16

Jet.Black 发表于 2026-6-2 09:09
跑分越来越高,实际能力没啥进步。

国外模型也一个样子,是不是ai这轮到头了?LLM永远不是agi ...

不是的,至少chatgpt-5.5进步是真的明显(不抽风的情况下)

Jet.Black 发表于 2026-6-2 09:20

drodchang 发表于 2026-6-2 09:16
不是的,至少chatgpt-5.5进步是真的明显(不抽风的情况下)

Gpt 5.5体感和opus 4.6差不多

opus 4.8 4.7也和4.6差不多,llm在原地打转有段日子了

Nanachi 发表于 2026-6-2 09:23

但是 qwen 一直都是高分低能代表

论坛助手,iPhone

拜拜 发表于 2026-6-2 10:28

豆包属于llm吗,为什么那么强

—— 来自 Hisense HNR320T, Android 10, 鹅球 v3.5.99-alpha

枯风瘦雪 发表于 2026-6-2 10:33

拜拜 发表于 2026-6-2 10:28
豆包属于llm吗,为什么那么强

—— 来自 Hisense HNR320T, Android 10, 鹅球 v3.5.99-alpha ...

糖包从来没有强过,但它入口做得足够好覆盖面足够广……

暗口崩子 发表于 2026-6-2 10:33

跑分没输过,问你用吗一问一个不吱声

mitzvah 发表于 2026-6-2 10:35

Jet.Black 发表于 2026-6-2 09:09
跑分越来越高,实际能力没啥进步。

国外模型也一个样子,是不是ai这轮到头了?LLM永远不是agi ...

进步其实还是蛮大的,现在的3.6 27b,大多数任务上爆了去年7月的235b问题不大,就是397b进步实在有限

omnitoken 发表于 2026-6-2 10:39

qwen 3.7 max 强制用英文CoT, 表现会好很多

hyde999 发表于 2026-6-2 10:42

借楼问下现在国产有没有生图能和GPT比较一下的,主要是生成海报,花钱的也行

tillnight 发表于 2026-6-2 11:01

hyde999 发表于 2026-6-2 10:42
借楼问下现在国产有没有生图能和GPT比较一下的,主要是生成海报,花钱的也行 ...

Image2现在独一档,不说国产我个人用下来nano banana2都差他一截。国产商业模型其实没怎么在生图上使力,阿里家几个开源的生图模型是不错,但能力上限对于小模型肯定是不高的。既然只是做海报还愿意花钱,直接找个gpt image2的中转站就完了,也就几毛钱一张。

hyde999 发表于 2026-6-2 12:30

tillnight 发表于 2026-6-2 11:01
Image2现在独一档,不说国产我个人用下来nano banana2都差他一截。国产商业模型其实没怎么在生图上使力, ...

谢谢大佬 有稳定的点的中转站推荐不

EFSF 发表于 2026-6-2 12:44

阿里的东西,呵呵
之前不是吹阿里有个做视频的多牛逼嘛,也是跑分怎样怎样,我就说试试,拿给seedance20一样的无聊和提示词狗屁都生成不出来。

farAway 发表于 2026-6-2 15:04

Q问会脸不红心不挑的跟你扯谎,编数据,就生编,我让他查上市公司年报给个百分比,他给编了个,还围绕这个假数据给了我一堆分析,跟真的一样。
页: [1]
查看完整版本: 阿里发布 Qwen3.7-Plus 模型,升级多模态交互混合 AI 智能体