
一个模型,能看、能想、能写代码、能行动
2026年6月2日凌晨,阿里通义实验室正式发布Qwen3.7-Plus多模态智能体模型。这不仅是千问3.7系列的最新成员,更标志着AI从“能看能说”向着“动手干活”的关键跨越。在Vision Arena全球视觉模型榜单中,阿里凭借Qwen3.7-Plus跻身全球前五、中国第一,刷新中国多模态AI的排名纪录。
它到底有何特别之处?又能为普通人和专业人士做些什么?今天,我们就来聊聊这个正在悄悄改变我们工作方式的AI模型。
Qwen3.7-Plus到底是个什么?
简单来说,它是一款视觉与语言统一的智能体模型——不只是能看懂图片和视频,更能深度推理、自主编程、调用工具、验证测试、自主迭代。

(来自百度百科)
打个比方:绝大多数多模态AI就像一个能看懂图纸的人,能告诉你“这张图上是哪个App的界面”;而Qwen3.7-Plus则像一个既能看懂图纸,又能拿着图纸把房子真正盖出来的全栈工程师。
Qwen3.7-Plus的特别之处
Qwen3.7-Plus最核心的突破,是首次将一个完整的任务闭环——“看、想、写、做、验”五大能力,融入了同一套智能体架构。
“看”: 感知真实世界场景,读取屏幕并理解GUI界面布局。它能看懂地铁线路图、文档图表、App界面和视频内容,并快速锁定关键信息。

(QWen 3.7 puls 生成)
“想”: 基于视觉信息进行深度推理,规划复杂任务的行动路径。在BabyVision等纯视觉推理基准测试中,Qwen3.7-Plus得分从上代的37.4大幅提升至64.7,超越了Gemini 3.1 Pro。
“写”: 基于视觉参考生成可执行代码,可以将图像、视频、UI截图一键转化为SVG、网页或前端原型。

(QWen 3.7 puls 生成)
“做”: 在GUI(图形用户界面)和CLI(命令行界面)之间无缝切换,直接操作应用、调用工具、完成部署。
“验”: 自主执行测试用例,检查运行结果,发现Bug后自动改代码再验证,形成闭环迭代。
在技术指标上,Qwen3.7-Plus也相当硬核:纯文本能力接近旗舰模型水平,整体Agent能力在Skillbench评测中大幅提升10.2分,数学推理能力更是达到上代模型的近3倍。
11小时独立开发App:它到底能干什么?
如果说上面的技术指标还不够直观,那下面的案例一定能让你看到差距。
① 11小时自主开发一款学英语App
在一次实测中,基于Qwen3.7-Plus构建的Hybrid-Agent系统连续稳定运行11小时以上,累计生成超10000行代码,触发超1000次调用,完成了从需求文档到测试、部署的完整研发闭环。
② 高保真复刻macOS原生股市应用
智能体主动交互macOS原生股票App,理解UI布局后自行生成SwiftUI源码、接入真实行情API,最终10项功能验证测试全部通过。
③ 云控制台无人值守运维
搭载Qwen3.7-Plus能力的浏览器插件能够理解自然语言需求,自主进入云控制台完成ECS服务器比价、选型、配置、购买等全套操作。
④ 看懂地铁线路图、做视频转SVG
模型还支持多模态推理,能解析复杂的地铁路线图,也能把视频动态转化成交互式SVG——对内容创作者和设计师来说,这个能力相当实用。
(QWen 3.7 puls 生成)
对普通人能带来哪些帮助?
不懂编程也能做小型应用
过去想做一个小工具App,必须委托开发团队,动辄投入数万甚至数十万。而借助Qwen3.7-Plus,只需要向模型描述自己想要的功能,它就能生成完整代码——甚至完成部署和测试。虽然目前复杂页面仍可能存在乱码或交互失效,整体输出还需要人工检查,但这一趋势已经显而易见:编程的门槛正在大幅降低。
自动化处理繁琐事务
用一句话告诉插件,让它替你完成服务器配置、购买资源等操作。对个体创业者和小微企业来说,这几乎等于请了一位“全能运维助理”。
智能教育和个人学习
11小时做出来的学英语App就是一个很好的例子。未来只需将需求交给AI,就能生成定制化的学习工具。
创意变现加速器
如果你有视觉创意,Qwen3.7-Plus能直接将草图、参考图转化为可执行代码或者SVG矢量图,极大缩短从灵感到成品的周期。
对专业人士能产生什么影响?
开发者/工程师
代码生成只是基础。Qwen3.7-Plus可以理解设计稿直接生成符合规范的代码,大幅缩短开发周期;还能一键复刻参考应用,减少重复造轮子。在Terminal Bench 2.0等复杂软件工程基准上,其表现强劲。
产品经理/设计师
直接上传设计稿,AI就能生成可交互原型,团队内部验证效率将大幅提升。
数据科学家/科研人员
在高难度STEM推理基准GPQA Diamond上,Qwen3.7-Plus位列Plus级别模型前列,能在科学编程等方向辅助研究者。
企业/运营团队
在处理客服、数据分析等业务流程时,Qwen3.7-Plus能通过自动化工具调用节省大量人力成本,在MCP-Mark等工具使用基准上也交出了漂亮答卷。
自媒体/内容创作者
图片转SVG、视频转代码等技能可以帮创作者快速产出交互式内容,为创意表达提供了新工具。
如何获取与使用Qwen3.7-Plus?
Qwen3.7-Plus已于2026年6月2日正式在阿里云百炼平台上线,并开放了API商业调用。
在线体验:登录Qwen Studio(chat.qwen.ai),选择Qwen3.7-Plus即可免费试用。
开发者接入:支持OpenAI兼容API协议,也可以通过Claude Code、OpenClaw或Qwen Code直接调用,几乎无需修改已有的技术栈。
定价:输入0.4美元/百万token,输出1.6美元/百万token,在同类模型中颇具竞争力。

总结
Qwen3.7-Plus的最大意义在于:它让AI真正走出了聊天框,开始动手解决现实世界的问题。
对普通人来说,AI正在成为可以随时调用的“全能助理”;对专业人士而言,它意味着生产力工具的再一次革新——不是取代人,而是让人把精力放在更有创造力的地方。
正如千问团队的官方表述:“让AI不再只是‘读懂世界’,更能动手改变世界。”AI开发正式进入“自主闭环”的时代,而国产模型正站在这场变革的前排。
如果你正在寻找一个能帮你“动手干活”的AI,Qwen3.7-Plus值得一试。
夜雨聆风