前两天,DeepSeek的招聘页面上悄悄多了两个岗位:Agent Harness产品经理,Agent Harness研发工程师。
放在往常,一家公司招人不是什么新闻。但这回不一样。
DeepSeek要做的不是又一个模型。他们要做的,是一个能写代码的AI Agent,内部代号叫Harness,直接对标Anthropic的Claude Code。
你可能觉得,AI写代码不是早就有了吗?GitHub Copilot、Cursor,用的人不在少数。但这次的区别在于:不是"帮你补全代码",而是"替你把项目做完"。从理解需求到读代码库,从写文件到跑测试,从修bug到部署上线,一个Agent全包了。
我认真地想了两天,这件事比很多人以为的要大。它不是一个技术升级,它是一个信号。AI编程这件事,正在被重新定义。
DeepSeek为什么突然这么干?
先说说Harness这个词的含义。在工程领域,Harness指的是"线束"或者"工作系统"。一辆车的电路线束,把所有传感器、控制器、执行器串在一起,让整车协同运作。
DeepSeek的Harness团队要做的,是模型之外的"工程线束系统"。文件管理、上下文控制、shell调用、测试执行、权限管理、差异记录——这些不是模型能力,是工程能力。
我问了一个在AI公司做工程的朋友,他原话是:"基座模型打的是天赋,Harness打的是纪律。"这话说到了点子上。
2026年的基座模型竞争,已经有点审美疲劳了。GPT-5.5、Claude 4、DeepSeek V4、Gemini 3.5、Qwen 3.7,参数越来越大,跑分越来越高,但说实话,对大多数用户来说,区别已经不太感觉得出来了。模型能力的边际收益在下降。
但Harness不一样。它不是"让模型更强",是"让模型能干"。这里面的差距,是论文和产品之间的差距,是Demo和生产系统之间的差距。
DeepSeek为什么在这个时间点出手?我想有三个原因。
第一个原因:代码是AI最擅长的事。写出来的代码能不能跑,编译一下就知道了;逻辑对不对,跑一遍测试就验证了。这是极少数能形成"自动闭环反馈"的AI应用场景。别的领域,AI的判断是对是错,还得人来检验。编程不用,编译器替你检验。
第二个原因:开发者愿意付费。普通用户用AI聊天,免费就够了。但开发者用AI写代码,用的是Token、是算力、是时间,他们天然有付费习惯。全球2800万开发者,哪怕只渗透10%,也是个百亿美元级别的市场。
第三个原因,也是最关键的:DeepSeek已经悄悄把路铺好了。他们官网上有一整套教程,教你怎么把Claude Code接入DeepSeek模型。先把桥搭好,把用户引过来,然后告诉用户:用我们的模型跑Claude Code,效果差不多,成本只有几分之一。等用户习惯了,再端出Harness这个"完整版"产品,一切水到渠成。
这就是DeepSeek的节奏感。不抢发、不喊口号、不开发布会,但每一步都踩在节奏点上。
国内AI编程,打成了一锅粥
DeepSeek不是唯一看到这个方向的。过去半年,国内AI编程赛道上挤进来的玩家,比过去五年加起来还多。
百度推出了秒哒。它的逻辑很有意思:不用你写一行代码,你只需要用自然语言说"我要一个报名系统"、"我要一个小程序商城",多个AI Agent就自动协作——产品经理Agent分析需求,前端Agent画界面,后端Agent写接口,测试Agent跑验证。整个过程就像你给一个外包团队交代任务,只不过这个团队全是AI。
我试用了一下,说实话,生成的页面还不够精细,交互细节也有不少瑕疵。但问题不在这里。问题在于,它把"做一个能用的东西"的时间从几周压缩到了几分钟。对一个小企业的活动报名页面来说,能用比好看重要得多。
美团拿出了NoCode。它的切入点非常精准——本地生活场景。餐饮老板想要一个优惠券小程序?几分钟。门店经理想搭一个库存管理后台?几分钟。所有应用天然接入美团生态,从生成到上线一气呵成。美团不跟你比谁生成的代码更优雅,它跟你比谁离生意更近。
蚂蚁的灵光AI走了一条不同的路。强调多模态输入——你画个草图,拍张照片,说几句话,它帮你生成一个轻应用。这条路能不能跑通还不好说,但它方向是对的:降低输入门槛,让完全不会打字的人也能用AI做东西。
还有字节的扣子,定位是"AI Agent操作系统",重点打办公自动化和企业助手场景。阿里云的Meoo,打的是大企业的ERP、CRM内部系统生成。再加上码上飞、Lovable、Bolt.new、Windsurf这些新玩家,整个赛道已经挤得喘不过气来。
看这个局面,我有一个感受:所有人都在抢同一块地,但每个人画的图纸都不一样。百度想让你"不用写代码"。美团想让你"用AI做本地生意"。蚂蚁想让你"用什么方式都行,把想法变成应用"。DeepSeek想让你"有一个真正的AI程序员同事"。
方向和方向之间,差别巨大。这说明什么?说明这个市场还非常早期。没有标准答案,没有公认的赢家,所有人都还在摸索。但有一件事是确定的:需求是真实存在的,而且来势汹汹。
Vibe Coding的冰与火
2025年初,Andrej Karpathy发了一条推文,发明了一个词:Vibe Coding。大意是:你完全不会写代码也没关系。你只需要把你的"感觉"描述给AI,AI帮你把代码写出来。你不用管底层逻辑,不用管数据结构,甚至不用看生成的代码。语法的东西都交给AI,你只管"这个功能我想要"和"这个效果不太对"。
一年后,这个词进了Collins词典年度词汇候选名单。一项调查显示,92%的美国开发者已经在日常工作中使用某种形式的Vibe Coding。全球AI编程工具市场规模达到了128亿美元。
数据很漂亮。但"冰"的那一面,也开始浮出水面了。安全公司RedAccess在5月份发了一份报告:市面上通过Vibe Coding开发的超过5000款Web应用,存在严重安全隐患。有的完全没有身份验证,有的把数据库连接字符串写在客户端代码里,有的直接把管理员密码硬编码在前端页面上。
这还不算完。北大在2026年出了一份Agentic Coding的研究报告,里面提到一个核心问题——"信任鸿沟"。AI生成的代码能不能用?编译通过了、测试也跑过了,那是不是意味着它没bug?AI改了一个函数,它有没有顺带把另一个不相关的功能搞坏了?你让AI重构一段代码,它的"优化"真的比你原来的写法更好吗?这些问题,用"反正编译过了"是回答不了的。
我一个做独立开发的朋友跟我说了句大实话:用AI写代码,前80%快得飞起,后20%慢到崩溃。AI能帮你搭起一个东西的骨架,但骨架要变成能抗住真实流量的产品,还需要人来打磨。调试、优化、边界情况处理、用户体验微调,这些东西目前的AI还做不好。
这让我想到一个比喻:Vibe Coding就像宜家家具。AI帮你把所有板材裁好、螺丝配齐、说明书打印清楚。但把这些东西变成一张能用的桌子,还是得你自己动手。而且,如果你完全不会拧螺丝,你还是会搞砸。所以,Vibe Coding不是"不会写代码的人突然变成了程序员"。它是"会写代码的人效率翻了三倍"。
这个区别很关键。理解了这个区别,你才能理解为什么DeepSeek要做Harness,而不是又一个Vibe Coding工具。
编程这件事,本质是什么变了?
很多人可能没意识到,AI编程工具带来的最大改变,不是"代码写得更快了"。是"谁可以写代码"的边界被打破了。
过去,写代码是一道很高的门槛。你要学语法、学框架、学数据结构、学设计模式。没有一年半载的投入,你写不出一个能用的东西。现在不一样了。一个开面馆的老板,用NoCode几分钟做出了优惠券小程序。一个市场部的同事,用秒哒搭出了一个活动报名系统。一个中学生,用Vibe Coding生成了自己的第一个网页游戏。
这些人不是程序员,也不会成为程序员。但他们确实在"制造软件"。这就是本质的变化:软件生产从"专业能力"变成了"通用意愿"。你想不想做一个东西,比你会不会写代码重要得多。
这个变化有多深远?我拿两个行业来类比。第一个是拍照。20年前,拍一张好照片需要单反、需要懂光圈快门、需要会后期。今天,手机拿起来就拍,AI自动调色、自动美颜、自动构图。拍照的门槛从"技能"变成了"意愿"。第二个是开车。100年前,开车需要会修发动机。今天,你只需要方向盘、油门和刹车,其他都由车载电脑搞定。再过几年,你连方向盘都不需要了。编程正在走同样的路。
但这里有一个很多人会忽略的点:门槛降低不等于不需要专业。虽然谁都能拍照了,但商业摄影依然是专业摄影师的天下。虽然谁都能开车了,但F1赛车手依然是万里挑一的存在。编程也是。Vibe Coding让"做一个能用的小工具"变得极其容易,但"做一个支撑百万用户的可靠系统"、"设计一个优雅的软件架构"、"保障一个金融级产品的安全性",这些仍然是专业壁垒,甚至比之前更高了。
为什么?因为当基础开发效率翻三倍之后,竞争会从"谁能做出来"变成"谁做得更好"。而"更好"的标准会被推得越来越远。
DeepSeek显然看清了这一点。Harness不是要替代所有程序员,它是要把"初级程序员能做的事"自动化掉,然后把"高级程序员的时间"解放出来,去做更高价值的事。这才是AI编程的终局。
一些声音,一些担心
写到这里,我注意到圈子里有两种声音。一种是极度乐观的。说AI编程3年内会替代90%的程序员,说软件工程这个职业要消失了,说以后所有东西都是AI写的,人类只是提需求的。我不同意。不是因为我觉得AI不够强。而是因为我觉得他们太低估"写代码"这件事的复杂性了。
一个软件产品从0到1的过程中,"写代码"大概只占了30%的工作量。剩下的70%是什么?是理解用户到底要什么,是判断哪个功能先做哪个后做,是跟各方对齐预期,是在技术债和交付压力之间做取舍,是在凌晨三点收到报警后爬起来定位问题。这些事,跟写代码关系不大。AI可以帮你写代码,但AI理解不了你的用户为什么今天心情不好,理解不了你的老板为什么突发奇想要改方案,更理解不了你的团队里那个不愿意说话的同事其实发现了关键bug但不想担责。编程不是纯技术活,它是个社会活动。只要有人的因素在里面,就轮不到AI完全接管。
另一种声音是极度悲观的。说Vibe Coding产出的都是垃圾代码,说AI会毁掉软件质量,说以后互联网会被AI生成的漏洞代码塞满。我也不完全同意。不是因为我觉得安全问题不重要。而是因为我觉得他们把"工具"和"使用工具的人"搞混了。一把菜刀可以切菜,也可以伤人。你不能因为有人拿刀打架就说菜刀是坏东西。Vibe Coding的生产力是真实的,安全问题也是真实的。解决方法不是禁用工具,而是建立规范和底线。就像开车需要驾照,AI编程也需要一套安全标准——自动检查、强制加密、最低安全基线。市场已经在做这件事了。Claude Code有内置的安全扫描,Cursor有代码审查功能,企业级AI编程平台都在建自己的安全护栏。
所以,乐观和悲观都对,也都不全对。事情既没有那么好,也没有那么糟。它在变,在往某个方向走,但不走直线。
写在最后
总结一下我的判断。
第一,AI编程正在从"辅助工具"变成"独立生产者"。这不是小修小补,是范式级别的变化。第二,门槛的降低会让软件生产从"专业能力"变成"通用意愿"。不是程序员变少了,是用程序解决问题的人变多了。第三,Harness类系统是决定谁能赢的关键。基座模型的差距会缩小,但工程系统的差距不会。能把模型"装进生产系统"的人,才能笑到最后。第四,安全问题不是Vibe Coding的死穴,而是Vibe Coding进入成熟期的必经之路。
最后说一句不那么"产品分析"的话。从2022年底ChatGPT发布到现在,三年半了。这三年半里,AI行业发生了太多事。融了几千亿美元,发了上百个大模型,上演了无数的发布会和PPT。但说实话,最让我兴奋的,不是哪个模型的跑分又涨了几个点,不是哪家公司又融了多少轮,不是哪个大佬又说了什么惊人之语。最让我兴奋的,是一个完全不会写代码的面馆老板,花了十分钟,给自己做了一个能用的优惠券小程序。
这才是技术该有的样子。不是高高在上,是触手可及。不是用来做PPT的,是用来做事的。AI编程这件事,正在被重新定义。而这次的定义权,不在硅谷的实验室里,在每一个普通人"想做点什么"的那个念头里。
夜雨聆风