找回密码
 立即注册
搜索
查看: 2447|回复: 23

[科技] 阿里发布 Qwen3.7-Plus 模型,升级多模态交互混合 AI 智能体

[复制链接]
发表于 2026-6-2 08:35 来自手机 | 显示全部楼层 |阅读模式
此帖将于2026-07-02 08:34自动关闭
本帖最后由 德尔惠净水器 于 2026-6-2 08:37 编辑

阿里千问大模型今天(6 月 2 日)发布博文,宣布推出 Qwen3.7-Plus 模型,定位为多模态交互混合智能体。

Qwen3.7-Plus 是 Qwen3.7 的多模态升级版,核心定位是视觉与语言统一的智能体基座。

它保留文本、编码、工具使用和生产力工作流能力,同时强化视觉理解、视觉推理和跨模态任务处理。

在模型表现上,Qwen3.7-Plus 凭 Vision Arena 成绩帮助阿里进入全球前 5、中国第 1。




纯文本测试中,它接近 Max 级别模型,在编码智能体、通用智能体、推理、指令遵循和多语言任务上保持强表现。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2026-6-2 08:37 | 显示全部楼层
试用过后的评价,很一般
回复

使用道具 举报

头像被屏蔽
     
发表于 2026-6-2 08:38 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-6-2 08:41 | 显示全部楼层
想起来之前吹了半天和GPT5.5不相上下的国模A(Qwen 3.7 MAX),出来以后果然是刷分第一名😅

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-6-2 08:43 来自手机 | 显示全部楼层
qwen一直都这样,只有纸面参数强

—— 来自 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-2 08:48 来自手机 | 显示全部楼层
qwen经典刷分了
回复

使用道具 举报

     
发表于 2026-6-2 08:50 | 显示全部楼层
天天吹跑分其实没啥用,不如学学deepseek,实话实说,该怎么样就怎么样。不会qwen的研发团队做vibe coding的时候从来不用自己的模型吧
回复

使用道具 举报

     
发表于 2026-6-2 08:52 | 显示全部楼层
跟此前的preview版有啥区别吗
回复

使用道具 举报

     
发表于 2026-6-2 08:56 | 显示全部楼层
事实证明刷榜没有用,连手机都不跑分,实际的工程能力才是大模型的评判标准,行不行,真实做一个项目就一目了然了。
回复

使用道具 举报

     
发表于 2026-6-2 09:08 来自手机 | 显示全部楼层
这应该是对标豆包瞄准下沉市场,跑个高分也是有用的,毕竟有的人只看得懂这个

—— 来自 nubia NX809J, Android 16, 鹅球 v3.5.99-alpha
回复

使用道具 举报

发表于 2026-6-2 09:09 | 显示全部楼层
跑分越来越高,实际能力没啥进步。

国外模型也一个样子,是不是ai这轮到头了?LLM永远不是agi
回复

使用道具 举报

     
发表于 2026-6-2 09:16 | 显示全部楼层
Jet.Black 发表于 2026-6-2 09:09
跑分越来越高,实际能力没啥进步。

国外模型也一个样子,是不是ai这轮到头了?LLM永远不是agi ...

不是的,至少chatgpt-5.5进步是真的明显(不抽风的情况下)
回复

使用道具 举报

发表于 2026-6-2 09:20 | 显示全部楼层
drodchang 发表于 2026-6-2 09:16
不是的,至少chatgpt-5.5进步是真的明显(不抽风的情况下)

Gpt 5.5体感和opus 4.6差不多

opus 4.8 4.7也和4.6差不多,llm在原地打转有段日子了
回复

使用道具 举报

     
发表于 2026-6-2 09:23 来自手机 | 显示全部楼层
但是 qwen 一直都是高分低能代表

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-6-2 10:28 来自手机 | 显示全部楼层
豆包属于llm吗,为什么那么强

—— 来自 Hisense HNR320T, Android 10, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-6-2 10:33 | 显示全部楼层
拜拜 发表于 2026-6-2 10:28
豆包属于llm吗,为什么那么强

—— 来自 Hisense HNR320T, Android 10, 鹅球 v3.5.99-alpha ...

糖包从来没有强过,但它入口做得足够好覆盖面足够广……
回复

使用道具 举报

     
发表于 2026-6-2 10:33 | 显示全部楼层
跑分没输过,问你用吗一问一个不吱声
回复

使用道具 举报

发表于 2026-6-2 10:35 | 显示全部楼层
Jet.Black 发表于 2026-6-2 09:09
跑分越来越高,实际能力没啥进步。

国外模型也一个样子,是不是ai这轮到头了?LLM永远不是agi ...

进步其实还是蛮大的,现在的3.6 27b,大多数任务上爆了去年7月的235b问题不大,就是397b进步实在有限
回复

使用道具 举报

     
发表于 2026-6-2 10:39 | 显示全部楼层
qwen 3.7 max 强制用英文CoT, 表现会好很多
回复

使用道具 举报

     
发表于 2026-6-2 10:42 | 显示全部楼层
借楼问下现在国产有没有生图能和GPT比较一下的,主要是生成海报,花钱的也行
回复

使用道具 举报

     
发表于 2026-6-2 11:01 来自手机 | 显示全部楼层
hyde999 发表于 2026-6-2 10:42
借楼问下现在国产有没有生图能和GPT比较一下的,主要是生成海报,花钱的也行 ...

Image2现在独一档,不说国产我个人用下来nano banana2都差他一截。国产商业模型其实没怎么在生图上使力,阿里家几个开源的生图模型是不错,但能力上限对于小模型肯定是不高的。既然只是做海报还愿意花钱,直接找个gpt image2的中转站就完了,也就几毛钱一张。
回复

使用道具 举报

     
发表于 2026-6-2 12:30 | 显示全部楼层
tillnight 发表于 2026-6-2 11:01
Image2现在独一档,不说国产我个人用下来nano banana2都差他一截。国产商业模型其实没怎么在生图上使力, ...

谢谢大佬 有稳定的点的中转站推荐不
回复

使用道具 举报

     
发表于 2026-6-2 12:44 | 显示全部楼层
阿里的东西,呵呵
之前不是吹阿里有个做视频的多牛逼嘛,也是跑分怎样怎样,我就说试试,拿给seedance20一样的无聊和提示词狗屁都生成不出来。
回复

使用道具 举报

     
发表于 2026-6-2 15:04 | 显示全部楼层
Q问会脸不红心不挑的跟你扯谎,编数据,就生编,我让他查上市公司年报给个百分比,他给编了个,还围绕这个假数据给了我一堆分析,跟真的一样。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-24 13:27 , Processed in 0.221180 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表