乐于分享
好东西不私藏

AI正在吞噬软件工程

AI正在吞噬软件工程

AI正在吞噬软件工程  

程序员的未来与变革  

AI技术正引领软件开发范式的革命,单人AI完成多年工程量,软件工程正经历前所未有的转型。这是软件工程的终结,还是新生的开始?  

从Claude Code到Kimi K2.6:AI正在吃掉整个软件工程  

单人用AI两个月完成高级程序员两年工程量,硅谷软件股集体“寒潮”——软件工程的末日还是新生?  4月21日凌晨,月之暗面在深夜悄悄上线了Kimi K2.6。300个子Agent并行跑、13小时不间断编码、4000个协作步骤一气呵成——没有预热,没有发布会,就这么“深夜空降”了。  很多人以为这只是一次普通的产品更新。  错了。  这标志着软件工程的终极范式转移已经完成。AI不再只是写代码的辅助工具,它正在成为整个开发流程的执行者。Claude Code、Kimi K2.6、智谱GLM-5.1——你手里的键盘,很快就要凉了。  

“AI打工人”正式上岗:这不是预告,是实况  

Kimi K2.6:13小时不停写代码  Kimi K2.6的升级重点——长程编码能力支持13小时不间断编码,编写或修改超过4000行代码,完成复杂系统的开发和优化。  但这还不是最炸裂的。它的Agent集群最多支持300个子Agent并行运行,执行约4000个协作步骤,能够一次性完成从文档到网页、再到PPT和表格的多产物端到端交付。而且,它已经适配了当前最火的OpenClaw、Hermes Agent框架,意味着Agent可以持久化自动化执行。  同时,Kimi K2.6将代码与视觉能力深度融合,可以交付极具设计创意的专业级Web应用。在内部代码评测中,成绩较上一代K2.5提升了约20%。在多项权威基准测试中,成绩持平或优于GPT-5.4、Claude Opus 4.6和Gemini 3.1 Pro等闭源模型。  在泛化能力方面,实测显示Kimi K2.6可在Mac本地部署,通过Zig语言优化推理流程,在4000余次工具调用、12小时连续运行中,将吞吐量从约15tokens/s提升至约193tokens/s,最终实现比LM Studio快约20%的推理效率。  

Claude Code:关机也能修bug  如果说Kimi K2.6主打“深夜空降”,那Claude Code走的是另一条路子——彻底重构终端原生AI开发体验。  4月,Claude Code已迭代至v2.1.112稳定版,基于Opus 4.7与Sonnet 4.6模型,彻底从代码生成工具进化为终端原生全链路AI开发智能体,覆盖从代码读写、调试重构到自动化部署的全流程。  最让人睡不着觉的功能是 Routines(常规任务) 。它的本质是一个持久化、托管在Anthropic云端基础设施上的智能体。你只需要把Claude Code的配置打包好(prompt+仓库+连接器),然后就可以合上电脑下班。API触发、GitHub事件触发、定时触发,三种方式都能让它自己醒来干活。  想象这个场景:凌晨三点突然报警。过去意味着一个夺命电话。现在,监控系统直接通过Webhook唤醒云端的Claude,自动拉取最近代码,定位Bug,提交包含修复方案的Draft PR。值班老哥醒来后看到的不是让人头皮发麻的报警邮件,而是一个已经写好了修复方案、静静等待他Review的PR。  而在Auto Mode加持下,Claude Code可减少人工确认带来的打断,让AI自主决策权限范围。但它并非无懈可击——香港科技大学与ETH Zurich的128个压力测试场景显示,Auto Mode误放行率高达81.0%,36.8%的状态改变动作通过文件编辑路径绕过分类器。这说明权限审核仍是AI自主执行的最大短板。  此外,Claude体系还突破了工具调用限制,可模拟人类操作电脑,打开文件、操控浏览器,无接口时也能自主完成点击、滚动等完整流程。  

智谱GLM-5.1:8小时“工程师”  开源赛道也不甘落后。智谱发布的GLM-5.1刷新了SWE-Bench Pro基准测试的全球最佳成绩,超过GPT-5.4和Claude Opus 4.6。这是唯一达到8小时级持续工作 的开源模型。其内核在于,它不只是在写代码,而是在执行“实验→分析→优化”的完整人类工程闭环。  官方展示的三个案例令人震撼:8小时从零构建Linux桌面,完成1200多步操作,产出4.8MB配套文件,相当于4人团队一周的工作量;655轮迭代优化向量数据库,查询吞吐从3108 QPS提升至21472 QPS;超24小时优化50个机器学习负载,加速比达3.6倍。  

软件工程正在被“吃掉”:五个趋势,一个结论  

第一,衡量标准变了。  过去两年行业用Benchmark衡量模型有多智能,现在智谱明确提出下一阶段的衡量标准应该是“能工作多久”——模型在Long-Horizon Task中的表现。当AI能像人类工程师一样持续工作8小时、13小时甚至更久,开发范式就彻底变了。  

第二,Agent集群打破单体瓶颈。  300个子Agent并行跑4000个协作步骤,意味着AI可以像超强外包公司一样同时处理N个任务。过去的单体Agent面对复杂任务力不从心,现在这种瓶颈已被击穿。  

第三,“云端员工”规模化上岗。  把电脑一合,AI在云端继续修bug、写代码、审PR。这不是未来的概念,是今天就已经上线的功能。  

第四,工作流被重新定义。  从命令行到GUI终端、从CLI插件到拖拽布局、从API调用到直接操控电脑——Claude Code通过桌面端重构,正在把开发者从碎片化工具切换中彻底解放出来。  

第五,长程任务已成核心战场。  无论是Kimi的13小时编码,还是GLM-5.1的8小时系统构建,抑或Claude Code的云端自动化,都在指向同一个方向:AI不再是对话式助手,而是能独立完成从规划、执行到交付完整闭环的工程主体。正如Anthropic在《2026年智能体编码趋势报告》中指出的,软件开发正经历自图形界面发明以来最重大的范式转移。  

资本正在豪赌:“AI吃掉软件”不是科幻,是财报  

软件工程的变革正在迅速传导至资本市场。今年2月初,全球软件股遭遇了一场“寒潮”。以Salesforce为例,该公司有九成收入来自用户订阅,高度依赖客户团队规模的扩张。然而,AI工具的出现可以辅助甚至部分替代人工,这可能导致企业相关团队规模从5人压缩至1人,所需订阅账号数量大幅减少。AI智能体可以直接调用软件底层系统,这动摇了传统软件“按人头订阅”的盈利逻辑,推动行业向“按使用计费”的模式转型。  技术迭代与资本竞速已形成双向绑定。Kimi正同步推进赴港IPO计划与新一轮约10亿美元融资,最新估值达100亿美元,计划以约180亿美元估值启动Pre-IPO轮融资。DeepSeek开放融资,字节跳动2025年净利润下跌70%,OpenAI与Anthropic竞速上市——冲向AGI的路径需要高额资本作为船票。  

程序员的明天:是“被取代”还是“被升维”?  

那么问题来了——程序员是不是要失业了?  答案是:只会写代码的程序员会失业,懂AI、懂架构、懂设计的程序员会变得更值钱。  Anthropic的CEO达里奥·阿莫代伊一年前预言:“未来3~6个月,AI将编写90%的软件代码。”如今这一预言正逐步转化为现实。2026年以来,全球科技公司已裁员数万人,甲骨文一夜之间裁撤3万人,Twitter前CEO创办的金融科技公司Block一次性砍掉40%员工。今年第一季度全球科技公司裁员达8万人,其中近半数岗位削减直接或间接归因于AI技术的实施。  但与此同时,Anthropic的报告明确指出:程序员职业并不会消失,但那些“只会写代码”的程序员将逐渐被市场淘汰。角色正在从“代码编写者”转变为“智能体指挥官”。英伟达CEO黄仁勋也表示,AI不会取代现有软件,而是与之融合共生,复杂软件架构的构建仍依赖人类工程经验与生态积累。  还有一个反常识的洞察来自OpenAI Codex负责人:代码写得越快,程序员反而越不够用。当写代码的成本降到近乎为零,世界对软件的需求会呈指数级爆炸。AI会制造出一个代码的大通胀时代,我们需要成千上万倍的建造者去填补这些新冒出来的需求。在追求极致速度的AI原生团队里,一个拥有产品思维的“全栈建造者”靠着Agent军团就能搞定一切。  未来的核心资产只有两个:品味和验证。代码本身一文不值。你是否知道该往哪走(品味),以及你是否能从AI吐出的垃圾里一眼揪出那个致命的Bug(验证),将决定你是那个操控Agent的超级个体,还是被通胀代码淹没的牺牲品。  

写在最后  

凌晨三点,你电脑合上了。屏幕另一边,AI正替你修bug、写PR、部署新版本。  这不是科幻电影。  今天,它已经发生了。  AI正在吃掉整个软件工程。但如果你学会驾驭它,它也会让你变得前所未有的强大。  (本文综合自月之暗面、Anthropic、智谱官方发布信息及行业公开报道)

END