11小时独立开发一个App,让AI“动手干活”!国产多模态模型Qwen3.7-Plus来了

一个模型，能看、能想、能写代码、能行动

2026年6月2日凌晨，阿里通义实验室正式发布Qwen3.7-Plus多模态智能体模型。这不仅是千问3.7系列的最新成员，更标志着AI从“能看能说”向着“动手干活”的关键跨越。在Vision Arena全球视觉模型榜单中，阿里凭借Qwen3.7-Plus跻身全球前五、中国第一，刷新中国多模态AI的排名纪录。

它到底有何特别之处？又能为普通人和专业人士做些什么？今天，我们就来聊聊这个正在悄悄改变我们工作方式的AI模型。

Qwen3.7-Plus到底是个什么？

简单来说，它是一款视觉与语言统一的智能体模型——不只是能看懂图片和视频，更能深度推理、自主编程、调用工具、验证测试、自主迭代。

（来自百度百科）

打个比方：绝大多数多模态AI就像一个能看懂图纸的人，能告诉你“这张图上是哪个App的界面”；而Qwen3.7-Plus则像一个既能看懂图纸，又能拿着图纸把房子真正盖出来的全栈工程师。

Qwen3.7-Plus的特别之处

Qwen3.7-Plus最核心的突破，是首次将一个完整的任务闭环——“看、想、写、做、验”五大能力，融入了同一套智能体架构。

“看”： 感知真实世界场景，读取屏幕并理解GUI界面布局。它能看懂地铁线路图、文档图表、App界面和视频内容，并快速锁定关键信息。
（QWen 3.7 puls 生成）
“想”： 基于视觉信息进行深度推理，规划复杂任务的行动路径。在BabyVision等纯视觉推理基准测试中，Qwen3.7-Plus得分从上代的37.4大幅提升至64.7，超越了Gemini 3.1 Pro。
“写”： 基于视觉参考生成可执行代码，可以将图像、视频、UI截图一键转化为SVG、网页或前端原型。
（QWen 3.7 puls 生成）
“做”： 在GUI（图形用户界面）和CLI（命令行界面）之间无缝切换，直接操作应用、调用工具、完成部署。
“验”： 自主执行测试用例，检查运行结果，发现Bug后自动改代码再验证，形成闭环迭代。

在技术指标上，Qwen3.7-Plus也相当硬核：纯文本能力接近旗舰模型水平，整体Agent能力在Skillbench评测中大幅提升10.2分，数学推理能力更是达到上代模型的近3倍。

11小时独立开发App：它到底能干什么？

如果说上面的技术指标还不够直观，那下面的案例一定能让你看到差距。

① 11小时自主开发一款学英语App

在一次实测中，基于Qwen3.7-Plus构建的Hybrid-Agent系统连续稳定运行11小时以上，累计生成超10000行代码，触发超1000次调用，完成了从需求文档到测试、部署的完整研发闭环。

② 高保真复刻macOS原生股市应用

智能体主动交互macOS原生股票App，理解UI布局后自行生成SwiftUI源码、接入真实行情API，最终10项功能验证测试全部通过。

③ 云控制台无人值守运维

搭载Qwen3.7-Plus能力的浏览器插件能够理解自然语言需求，自主进入云控制台完成ECS服务器比价、选型、配置、购买等全套操作。

④ 看懂地铁线路图、做视频转SVG

模型还支持多模态推理，能解析复杂的地铁路线图，也能把视频动态转化成交互式SVG——对内容创作者和设计师来说，这个能力相当实用。

（QWen 3.7 puls 生成）

对普通人能带来哪些帮助？

不懂编程也能做小型应用

过去想做一个小工具App，必须委托开发团队，动辄投入数万甚至数十万。而借助Qwen3.7-Plus，只需要向模型描述自己想要的功能，它就能生成完整代码——甚至完成部署和测试。虽然目前复杂页面仍可能存在乱码或交互失效，整体输出还需要人工检查，但这一趋势已经显而易见：编程的门槛正在大幅降低。

自动化处理繁琐事务

用一句话告诉插件，让它替你完成服务器配置、购买资源等操作。对个体创业者和小微企业来说，这几乎等于请了一位“全能运维助理”。

智能教育和个人学习

11小时做出来的学英语App就是一个很好的例子。未来只需将需求交给AI，就能生成定制化的学习工具。

创意变现加速器

如果你有视觉创意，Qwen3.7-Plus能直接将草图、参考图转化为可执行代码或者SVG矢量图，极大缩短从灵感到成品的周期。

对专业人士能产生什么影响？

开发者/工程师

代码生成只是基础。Qwen3.7-Plus可以理解设计稿直接生成符合规范的代码，大幅缩短开发周期；还能一键复刻参考应用，减少重复造轮子。在Terminal Bench 2.0等复杂软件工程基准上，其表现强劲。

产品经理/设计师

直接上传设计稿，AI就能生成可交互原型，团队内部验证效率将大幅提升。

数据科学家/科研人员

在高难度STEM推理基准GPQA Diamond上，Qwen3.7-Plus位列Plus级别模型前列，能在科学编程等方向辅助研究者。

企业/运营团队

在处理客服、数据分析等业务流程时，Qwen3.7-Plus能通过自动化工具调用节省大量人力成本，在MCP-Mark等工具使用基准上也交出了漂亮答卷。

自媒体/内容创作者

图片转SVG、视频转代码等技能可以帮创作者快速产出交互式内容，为创意表达提供了新工具。

如何获取与使用Qwen3.7-Plus？

Qwen3.7-Plus已于2026年6月2日正式在阿里云百炼平台上线，并开放了API商业调用。

在线体验：登录Qwen Studio（chat.qwen.ai），选择Qwen3.7-Plus即可免费试用。

开发者接入：支持OpenAI兼容API协议，也可以通过Claude Code、OpenClaw或Qwen Code直接调用，几乎无需修改已有的技术栈。

定价：输入0.4美元/百万token，输出1.6美元/百万token，在同类模型中颇具竞争力。

总结

Qwen3.7-Plus的最大意义在于：它让AI真正走出了聊天框，开始动手解决现实世界的问题。

对普通人来说，AI正在成为可以随时调用的“全能助理”；对专业人士而言，它意味着生产力工具的再一次革新——不是取代人，而是让人把精力放在更有创造力的地方。

正如千问团队的官方表述：“让AI不再只是‘读懂世界’，更能动手改变世界。”AI开发正式进入“自主闭环”的时代，而国产模型正站在这场变革的前排。

如果你正在寻找一个能帮你“动手干活”的AI，Qwen3.7-Plus值得一试。