↑ 订阅我们,回复“AI”,免费获取大量AI教程资源
大家好呀,
周末刷新闻,看到一条消息,
阿里 Qwen 团队发布了 Qwen3.7-Max,专门给自主 Agent 任务用的。
不是那种你问一句它答一句的聊天模式。
是在真实测试里,自己连续干了约 35 小时,优化自家 AI 芯片上的内核代码。
432 次内核测试,1158 次工具调用,最后平均 10 倍加速。

我的第一反应不是程序员要失业了。
是「这玩意儿,要是能接进我的副业项目里,一个人能干多少活?」
35 小时不间断,它到底在干什么
先把事儿说清楚。
Qwen 团队给 Qwen3.7-Max 的任务,是优化 SGLang 推理软件里一个硬件 attention 内核。
硬件是阿里平头哥(T-Head)的 ZW-M890 加速器,Triton 语言写的参考实现。
关键细节在这里:训练时模型没见过这块芯片架构。
没有硬件文档,没有样例代码,没有测量数据。
就一份参考实现,然后开干。
35 个小时里,它自己编译、跑测试、量性能、改代码、抓编译错误、找瓶颈,循环往复。
Qwen 团队称,最终相对参考实现平均 10 倍加速。
同条件下,GLM 5.1 约 7.3 倍,Kimi K2.6 约 5 倍,DeepSeek V4 Pro 约 3.3 倍,上一代 Qwen3.6-Plus 只有 1.1 倍。
在 KernelBench L3 基准上,96% 的加速率,仅次于 Anthropic Opus 4.6 的 98%。

这些数据来自 Qwen 团队自己的测试报告,The Decoder 等媒体做了转述。
别慌「被替代」,先看「被放大」
网上最容易炒的方向,是「AI 自己干 35 小时,程序员还有活吗?」
我的看法相反。
这种长时程自主 Agent,短期里替代的不是「会写代码的人」,而是「重复试错、没人盯就不往下推」的那部分活。
你回想一下自己做副业项目的经历。
用 Cursor 或者 Claude Code 写代码,最耗时间的往往不是第一版能不能跑。
是你改了一版,测一下,发现问题,再改,再测,循环十几轮,人先累了,项目就搁那儿了。
Qwen 这次演示的核心能力,恰恰是 「没人催也能持续推进」。
35 小时,1158 次工具调用,中间没有「我明天再弄」。
这对想搞一人公司的人来说,意义比「又出了一个更强的模型」大得多。
我去年用 Cursor 给朋友做过一套系统,第一笔副业收入就是这么来的。
但整个过程里,真正卡住我的,从来不是「AI 写不出代码」,而是「我有没有耐心陪它把链路跑通」。
现在模型开始具备长时程自主推进的能力,瓶颈正在从「AI 会不会写」转向「人会不会定目标、会不会验收」。
三个现实,独立开发者得心里有数
那是不是明天就能开干了?还没有。
第一,这是 API 闭源模型,不是本地部署。
Qwen3.7-Max 只通过阿里云 Model Studio API 提供,和 Qwen3-Max、Qwen3.6-Plus 一样。
最后一个开源旗舰是 2026 年 2 月的 Qwen3.5-397B-A17B,之后旗舰路线就转向 API 了。
所以普通人能用的是「调用 API 接入服务」,不是「下载权重本地跑」。
成本、配额、数据出境,都得自己算清楚。
第二,35 小时是实验室条件下的硬核任务,不是日常写 CRUD。
优化芯片内核,和帮你改个 Next.js 页面、写个公众号排版脚本,难度不在一个量级。
别看到 10 倍加速就以为 Agent 明天能替你全自动上线产品。
第三,长时程 Agent 的上限,取决于你怎么拆任务。
Qwen 团队在训练里把每个任务拆成三块:任务本身、工具环境、结果验证器,三块可以自由组合。
这其实给独立开发者一个很实用的启发。
你想让 AI 自主跑久一点,不能丢一句「帮我做个网站」就撒手。
得把目标拆成可验证的小步:这一步编译过,这一步测试过,这一步性能达标。
会拆任务的人,才能用好长时程 Agent。
一人公司的真正杠杆,正在变
我主业做 AI 平台,副业在做海外工具站和 AI 自媒体。
两边跑下来,一个感受越来越清晰:
一人公司拼的不是你会多少技术,是你能不能把 AI 当成「能加班的搭档」,而不是「偶尔问一次的搜索引擎」。
Qwen3.7-Max 这次 35 小时的演示,放大的正是这个方向。
它支持 OpenAI 和 Anthropic 兼容接口,能接 Claude Code、OpenClaw、Qwen Code 这些 Agent 框架。
也就是说,模型厂商在主动适配「Agent 工作流」,而不只是「对话框」。
对独立开发者来说,接下来值得关注的不是「哪个模型参数更大」,而是:
你的项目能不能拆成 Agent 能自主推进的任务链?
你有没有清晰的验收标准,让 AI 知道什么叫「做完了」?
你愿不愿意从「亲自写每一行」切换到「定方向、验结果、收成果」?
AI编程在去年争议点就在于「到底靠不靠谱」。
现在答案越来越清楚了:靠谱,但靠谱的方式不是 AI 替你思考,是 AI 替你把已经想清楚的方案,用更长的时间、更多的耐心,一点点推到底。
35 小时自主优化芯片代码,听起来离普通人很远。
但「AI 能长时间自主推进一个明确目标」,这个能力离想搞一人公司的程序员,已经近得多了。
长时程 Agent 的核心,从来不是替代程序员,而是让「只有一个人」的团队,也能拥有「不会累的在线助手」。

祝您的生活一帆风顺,点个“❤”支持一下吧!
夜雨聆风