AI编程,正在被重新定义

前两天，DeepSeek的招聘页面上悄悄多了两个岗位：Agent Harness产品经理，Agent Harness研发工程师。

放在往常，一家公司招人不是什么新闻。但这回不一样。

DeepSeek要做的不是又一个模型。他们要做的，是一个能写代码的AI Agent，内部代号叫Harness，直接对标Anthropic的Claude Code。

你可能觉得，AI写代码不是早就有了吗？GitHub Copilot、Cursor，用的人不在少数。但这次的区别在于：不是"帮你补全代码"，而是"替你把项目做完"。从理解需求到读代码库，从写文件到跑测试，从修bug到部署上线，一个Agent全包了。

我认真地想了两天，这件事比很多人以为的要大。它不是一个技术升级，它是一个信号。AI编程这件事，正在被重新定义。

DeepSeek为什么突然这么干？

先说说Harness这个词的含义。在工程领域，Harness指的是"线束"或者"工作系统"。一辆车的电路线束，把所有传感器、控制器、执行器串在一起，让整车协同运作。

DeepSeek的Harness团队要做的，是模型之外的"工程线束系统"。文件管理、上下文控制、shell调用、测试执行、权限管理、差异记录——这些不是模型能力，是工程能力。

我问了一个在AI公司做工程的朋友，他原话是："基座模型打的是天赋，Harness打的是纪律。"这话说到了点子上。

2026年的基座模型竞争，已经有点审美疲劳了。GPT-5.5、Claude 4、DeepSeek V4、Gemini 3.5、Qwen 3.7，参数越来越大，跑分越来越高，但说实话，对大多数用户来说，区别已经不太感觉得出来了。模型能力的边际收益在下降。

但Harness不一样。它不是"让模型更强"，是"让模型能干"。这里面的差距，是论文和产品之间的差距，是Demo和生产系统之间的差距。

DeepSeek为什么在这个时间点出手？我想有三个原因。

第一个原因：代码是AI最擅长的事。写出来的代码能不能跑，编译一下就知道了；逻辑对不对，跑一遍测试就验证了。这是极少数能形成"自动闭环反馈"的AI应用场景。别的领域，AI的判断是对是错，还得人来检验。编程不用，编译器替你检验。

第二个原因：开发者愿意付费。普通用户用AI聊天，免费就够了。但开发者用AI写代码，用的是Token、是算力、是时间，他们天然有付费习惯。全球2800万开发者，哪怕只渗透10%，也是个百亿美元级别的市场。

第三个原因，也是最关键的：DeepSeek已经悄悄把路铺好了。他们官网上有一整套教程，教你怎么把Claude Code接入DeepSeek模型。先把桥搭好，把用户引过来，然后告诉用户：用我们的模型跑Claude Code，效果差不多，成本只有几分之一。等用户习惯了，再端出Harness这个"完整版"产品，一切水到渠成。

这就是DeepSeek的节奏感。不抢发、不喊口号、不开发布会，但每一步都踩在节奏点上。

国内AI编程，打成了一锅粥

DeepSeek不是唯一看到这个方向的。过去半年，国内AI编程赛道上挤进来的玩家，比过去五年加起来还多。

百度推出了秒哒。它的逻辑很有意思：不用你写一行代码，你只需要用自然语言说"我要一个报名系统"、"我要一个小程序商城"，多个AI Agent就自动协作——产品经理Agent分析需求，前端Agent画界面，后端Agent写接口，测试Agent跑验证。整个过程就像你给一个外包团队交代任务，只不过这个团队全是AI。

我试用了一下，说实话，生成的页面还不够精细，交互细节也有不少瑕疵。但问题不在这里。问题在于，它把"做一个能用的东西"的时间从几周压缩到了几分钟。对一个小企业的活动报名页面来说，能用比好看重要得多。

美团拿出了NoCode。它的切入点非常精准——本地生活场景。餐饮老板想要一个优惠券小程序？几分钟。门店经理想搭一个库存管理后台？几分钟。所有应用天然接入美团生态，从生成到上线一气呵成。美团不跟你比谁生成的代码更优雅，它跟你比谁离生意更近。

蚂蚁的灵光AI走了一条不同的路。强调多模态输入——你画个草图，拍张照片，说几句话，它帮你生成一个轻应用。这条路能不能跑通还不好说，但它方向是对的：降低输入门槛，让完全不会打字的人也能用AI做东西。

还有字节的扣子，定位是"AI Agent操作系统"，重点打办公自动化和企业助手场景。阿里云的Meoo，打的是大企业的ERP、CRM内部系统生成。再加上码上飞、Lovable、Bolt.new、Windsurf这些新玩家，整个赛道已经挤得喘不过气来。

看这个局面，我有一个感受：所有人都在抢同一块地，但每个人画的图纸都不一样。百度想让你"不用写代码"。美团想让你"用AI做本地生意"。蚂蚁想让你"用什么方式都行，把想法变成应用"。DeepSeek想让你"有一个真正的AI程序员同事"。

方向和方向之间，差别巨大。这说明什么？说明这个市场还非常早期。没有标准答案，没有公认的赢家，所有人都还在摸索。但有一件事是确定的：需求是真实存在的，而且来势汹汹。

Vibe Coding的冰与火

2025年初，Andrej Karpathy发了一条推文，发明了一个词：Vibe Coding。大意是：你完全不会写代码也没关系。你只需要把你的"感觉"描述给AI，AI帮你把代码写出来。你不用管底层逻辑，不用管数据结构，甚至不用看生成的代码。语法的东西都交给AI，你只管"这个功能我想要"和"这个效果不太对"。

一年后，这个词进了Collins词典年度词汇候选名单。一项调查显示，92%的美国开发者已经在日常工作中使用某种形式的Vibe Coding。全球AI编程工具市场规模达到了128亿美元。

数据很漂亮。但"冰"的那一面，也开始浮出水面了。安全公司RedAccess在5月份发了一份报告：市面上通过Vibe Coding开发的超过5000款Web应用，存在严重安全隐患。有的完全没有身份验证，有的把数据库连接字符串写在客户端代码里，有的直接把管理员密码硬编码在前端页面上。

这还不算完。北大在2026年出了一份Agentic Coding的研究报告，里面提到一个核心问题——"信任鸿沟"。AI生成的代码能不能用？编译通过了、测试也跑过了，那是不是意味着它没bug？AI改了一个函数，它有没有顺带把另一个不相关的功能搞坏了？你让AI重构一段代码，它的"优化"真的比你原来的写法更好吗？这些问题，用"反正编译过了"是回答不了的。

我一个做独立开发的朋友跟我说了句大实话：用AI写代码，前80%快得飞起，后20%慢到崩溃。AI能帮你搭起一个东西的骨架，但骨架要变成能抗住真实流量的产品，还需要人来打磨。调试、优化、边界情况处理、用户体验微调，这些东西目前的AI还做不好。

这让我想到一个比喻：Vibe Coding就像宜家家具。AI帮你把所有板材裁好、螺丝配齐、说明书打印清楚。但把这些东西变成一张能用的桌子，还是得你自己动手。而且，如果你完全不会拧螺丝，你还是会搞砸。所以，Vibe Coding不是"不会写代码的人突然变成了程序员"。它是"会写代码的人效率翻了三倍"。

这个区别很关键。理解了这个区别，你才能理解为什么DeepSeek要做Harness，而不是又一个Vibe Coding工具。

编程这件事，本质是什么变了？

很多人可能没意识到，AI编程工具带来的最大改变，不是"代码写得更快了"。是"谁可以写代码"的边界被打破了。

过去，写代码是一道很高的门槛。你要学语法、学框架、学数据结构、学设计模式。没有一年半载的投入，你写不出一个能用的东西。现在不一样了。一个开面馆的老板，用NoCode几分钟做出了优惠券小程序。一个市场部的同事，用秒哒搭出了一个活动报名系统。一个中学生，用Vibe Coding生成了自己的第一个网页游戏。

这些人不是程序员，也不会成为程序员。但他们确实在"制造软件"。这就是本质的变化：软件生产从"专业能力"变成了"通用意愿"。你想不想做一个东西，比你会不会写代码重要得多。

这个变化有多深远？我拿两个行业来类比。第一个是拍照。20年前，拍一张好照片需要单反、需要懂光圈快门、需要会后期。今天，手机拿起来就拍，AI自动调色、自动美颜、自动构图。拍照的门槛从"技能"变成了"意愿"。第二个是开车。100年前，开车需要会修发动机。今天，你只需要方向盘、油门和刹车，其他都由车载电脑搞定。再过几年，你连方向盘都不需要了。编程正在走同样的路。

但这里有一个很多人会忽略的点：门槛降低不等于不需要专业。虽然谁都能拍照了，但商业摄影依然是专业摄影师的天下。虽然谁都能开车了，但F1赛车手依然是万里挑一的存在。编程也是。Vibe Coding让"做一个能用的小工具"变得极其容易，但"做一个支撑百万用户的可靠系统"、"设计一个优雅的软件架构"、"保障一个金融级产品的安全性"，这些仍然是专业壁垒，甚至比之前更高了。

为什么？因为当基础开发效率翻三倍之后，竞争会从"谁能做出来"变成"谁做得更好"。而"更好"的标准会被推得越来越远。

DeepSeek显然看清了这一点。Harness不是要替代所有程序员，它是要把"初级程序员能做的事"自动化掉，然后把"高级程序员的时间"解放出来，去做更高价值的事。这才是AI编程的终局。

一些声音，一些担心

写到这里，我注意到圈子里有两种声音。一种是极度乐观的。说AI编程3年内会替代90%的程序员，说软件工程这个职业要消失了，说以后所有东西都是AI写的，人类只是提需求的。我不同意。不是因为我觉得AI不够强。而是因为我觉得他们太低估"写代码"这件事的复杂性了。

一个软件产品从0到1的过程中，"写代码"大概只占了30%的工作量。剩下的70%是什么？是理解用户到底要什么，是判断哪个功能先做哪个后做，是跟各方对齐预期，是在技术债和交付压力之间做取舍，是在凌晨三点收到报警后爬起来定位问题。这些事，跟写代码关系不大。AI可以帮你写代码，但AI理解不了你的用户为什么今天心情不好，理解不了你的老板为什么突发奇想要改方案，更理解不了你的团队里那个不愿意说话的同事其实发现了关键bug但不想担责。编程不是纯技术活，它是个社会活动。只要有人的因素在里面，就轮不到AI完全接管。

另一种声音是极度悲观的。说Vibe Coding产出的都是垃圾代码，说AI会毁掉软件质量，说以后互联网会被AI生成的漏洞代码塞满。我也不完全同意。不是因为我觉得安全问题不重要。而是因为我觉得他们把"工具"和"使用工具的人"搞混了。一把菜刀可以切菜，也可以伤人。你不能因为有人拿刀打架就说菜刀是坏东西。Vibe Coding的生产力是真实的，安全问题也是真实的。解决方法不是禁用工具，而是建立规范和底线。就像开车需要驾照，AI编程也需要一套安全标准——自动检查、强制加密、最低安全基线。市场已经在做这件事了。Claude Code有内置的安全扫描，Cursor有代码审查功能，企业级AI编程平台都在建自己的安全护栏。

所以，乐观和悲观都对，也都不全对。事情既没有那么好，也没有那么糟。它在变，在往某个方向走，但不走直线。

写在最后

总结一下我的判断。

第一，AI编程正在从"辅助工具"变成"独立生产者"。这不是小修小补，是范式级别的变化。第二，门槛的降低会让软件生产从"专业能力"变成"通用意愿"。不是程序员变少了，是用程序解决问题的人变多了。第三，Harness类系统是决定谁能赢的关键。基座模型的差距会缩小，但工程系统的差距不会。能把模型"装进生产系统"的人，才能笑到最后。第四，安全问题不是Vibe Coding的死穴，而是Vibe Coding进入成熟期的必经之路。

最后说一句不那么"产品分析"的话。从2022年底ChatGPT发布到现在，三年半了。这三年半里，AI行业发生了太多事。融了几千亿美元，发了上百个大模型，上演了无数的发布会和PPT。但说实话，最让我兴奋的，不是哪个模型的跑分又涨了几个点，不是哪家公司又融了多少轮，不是哪个大佬又说了什么惊人之语。最让我兴奋的，是一个完全不会写代码的面馆老板，花了十分钟，给自己做了一个能用的优惠券小程序。

这才是技术该有的样子。不是高高在上，是触手可及。不是用来做PPT的，是用来做事的。AI编程这件事，正在被重新定义。而这次的定义权，不在硅谷的实验室里，在每一个普通人"想做点什么"的那个念头里。