AI自己干了35小时活:对想搞一人公司的程序员,这是好消息

↑ 订阅我们，回复“AI”，免费获取大量AI教程资源

大家好呀，

周末刷新闻，看到一条消息，

阿里 Qwen 团队发布了 Qwen3.7-Max，专门给自主 Agent 任务用的。

不是那种你问一句它答一句的聊天模式。

是在真实测试里，自己连续干了约 35 小时，优化自家 AI 芯片上的内核代码。

432 次内核测试，1158 次工具调用，最后平均 10 倍加速。

我的第一反应不是程序员要失业了。

是「这玩意儿，要是能接进我的副业项目里，一个人能干多少活？」

35 小时不间断，它到底在干什么

先把事儿说清楚。

Qwen 团队给 Qwen3.7-Max 的任务，是优化 SGLang 推理软件里一个硬件 attention 内核。

硬件是阿里平头哥（T-Head）的 ZW-M890 加速器，Triton 语言写的参考实现。

关键细节在这里：训练时模型没见过这块芯片架构。

没有硬件文档，没有样例代码，没有测量数据。

就一份参考实现，然后开干。

35 个小时里，它自己编译、跑测试、量性能、改代码、抓编译错误、找瓶颈，循环往复。

Qwen 团队称，最终相对参考实现平均 10 倍加速。

同条件下，GLM 5.1 约 7.3 倍，Kimi K2.6 约 5 倍，DeepSeek V4 Pro 约 3.3 倍，上一代 Qwen3.6-Plus 只有 1.1 倍。

在 KernelBench L3 基准上，96% 的加速率，仅次于 Anthropic Opus 4.6 的 98%。

这些数据来自 Qwen 团队自己的测试报告，The Decoder 等媒体做了转述。

别慌「被替代」，先看「被放大」

网上最容易炒的方向，是「AI 自己干 35 小时，程序员还有活吗？」

我的看法相反。

这种长时程自主 Agent，短期里替代的不是「会写代码的人」，而是「重复试错、没人盯就不往下推」的那部分活。

你回想一下自己做副业项目的经历。

用 Cursor 或者 Claude Code 写代码，最耗时间的往往不是第一版能不能跑。

是你改了一版，测一下，发现问题，再改，再测，循环十几轮，人先累了，项目就搁那儿了。

Qwen 这次演示的核心能力，恰恰是 「没人催也能持续推进」。

35 小时，1158 次工具调用，中间没有「我明天再弄」。

这对想搞一人公司的人来说，意义比「又出了一个更强的模型」大得多。

我去年用 Cursor 给朋友做过一套系统，第一笔副业收入就是这么来的。

但整个过程里，真正卡住我的，从来不是「AI 写不出代码」，而是「我有没有耐心陪它把链路跑通」。

现在模型开始具备长时程自主推进的能力，瓶颈正在从「AI 会不会写」转向「人会不会定目标、会不会验收」。

三个现实，独立开发者得心里有数

那是不是明天就能开干了？还没有。

第一，这是 API 闭源模型，不是本地部署。

Qwen3.7-Max 只通过阿里云 Model Studio API 提供，和 Qwen3-Max、Qwen3.6-Plus 一样。

最后一个开源旗舰是 2026 年 2 月的 Qwen3.5-397B-A17B，之后旗舰路线就转向 API 了。

所以普通人能用的是「调用 API 接入服务」，不是「下载权重本地跑」。

成本、配额、数据出境，都得自己算清楚。

第二，35 小时是实验室条件下的硬核任务，不是日常写 CRUD。

优化芯片内核，和帮你改个 Next.js 页面、写个公众号排版脚本，难度不在一个量级。

别看到 10 倍加速就以为 Agent 明天能替你全自动上线产品。

第三，长时程 Agent 的上限，取决于你怎么拆任务。

Qwen 团队在训练里把每个任务拆成三块：任务本身、工具环境、结果验证器，三块可以自由组合。

这其实给独立开发者一个很实用的启发。

你想让 AI 自主跑久一点，不能丢一句「帮我做个网站」就撒手。

得把目标拆成可验证的小步：这一步编译过，这一步测试过，这一步性能达标。

会拆任务的人，才能用好长时程 Agent。

一人公司的真正杠杆，正在变

我主业做 AI 平台，副业在做海外工具站和 AI 自媒体。

两边跑下来，一个感受越来越清晰：

一人公司拼的不是你会多少技术，是你能不能把 AI 当成「能加班的搭档」，而不是「偶尔问一次的搜索引擎」。

Qwen3.7-Max 这次 35 小时的演示，放大的正是这个方向。

它支持 OpenAI 和 Anthropic 兼容接口，能接 Claude Code、OpenClaw、Qwen Code 这些 Agent 框架。

也就是说，模型厂商在主动适配「Agent 工作流」，而不只是「对话框」。

对独立开发者来说，接下来值得关注的不是「哪个模型参数更大」，而是：

你的项目能不能拆成 Agent 能自主推进的任务链？

你有没有清晰的验收标准，让 AI 知道什么叫「做完了」？

你愿不愿意从「亲自写每一行」切换到「定方向、验结果、收成果」？

AI编程在去年争议点就在于「到底靠不靠谱」。

现在答案越来越清楚了：靠谱，但靠谱的方式不是 AI 替你思考，是 AI 替你把已经想清楚的方案，用更长的时间、更多的耐心，一点点推到底。

35 小时自主优化芯片代码，听起来离普通人很远。

但「AI 能长时间自主推进一个明确目标」，这个能力离想搞一人公司的程序员，已经近得多了。

长时程 Agent 的核心，从来不是替代程序员，而是让「只有一个人」的团队，也能拥有「不会累的在线助手」。

祝您的生活一帆风顺，点个“❤”支持一下吧！