微光智元报道
【导读】一边是C++之父直言资深开发者“宁愿退休”也不愿处理AI生成的代码,另一边是谷歌CEO承认在代理式编程领域落后,而ClickHouse等实战团队已在Agentic Coding中找到了真金白银的价值。这场关于AI编码工具价值的争论,本质上是“代码质量”与“开发速度”之间的古老博弈。
一、两座“大山”的质疑:AI编码真的带来负担?
75岁的C++之父Bjarne Stroustrup在最新一期播客中直言:“我已经看到一些高级开发者开始退休了——因为他们不想再处理这种验证工作:每次改代码或提示词,生成的东西都会变。”[3] 这句话在开发者社区迅速发酵,被概括为“资深开发人员宁愿退休,也不愿处理AI生成的代码”。
「AI 生成的代码更臃肿,有更多 bug 和安全漏洞,而且很难验证。」——Bjarne Stroustrup [3]
Stroustrup并非唯一持此立场的资深技术人。GitHub Copilot创始工程师Neel Sundaresan用了一个生动的比喻来形容当前AI编码工具的过度使用:“大多数AI编码‘就像开着法拉利去买牛奶一样’。”[4] 他指出,开发者有30%的代码都是API调用,AI工具在恰当的时机给出正确的函数调用才有价值,而非盲目生成大量代码。[4]
更有意思的是,就连谷歌CEO Sundar Pichai在最近的访谈中也承认了这一点。当被问及谷歌大模型能力时,Pichai坦言公司在“代理式编程(agentic coding)和长周期任务方面,依然落后于行业前沿水平”。[2] 这意味着,即便是行业巨头,也认为在复杂代码库上执行长期任务的AI编码能力,仍是一个需要“全力追赶的重要阵地”。[2] 这与Stroustrup对代码质量的批评角度不同,但共同指向了一个事实:AI编码工具远未成熟。
一位匿名作者在InfoQ发表的文章《人工智能无法加速软件交付》中提出了更尖锐的观点:速度从来都不是目标,提升工作效率的首要目的是更早获取反馈。[5] 他把那些只追求AI编码速度的机构比作:去救助中心想领养狗,却被告知可以带一只猎豹回家——只因为它跑得快。[5]
二、实战派的回应:Agentic Coding的真实价值在哪里?
然而,另一侧的声音同样响亮。ClickHouse团队在一篇深度实战分析中给出了截然不同的结论。他们从2025年2月Claude Code问世后就开始系统性地使用编码代理,并明确表示:“我们在ClickHouse中使用编码代理,它们在特定场景下是极佳的工具。”[6]
值得关注的是,ClickHouse团队对AI编码工具的定位非常清醒。他们承认,一年前测试时,Claude Code“在处理小型仓库中的各种样板任务时助我一臂之力”,但“当我将其应用到我们的主要C++代码库时,它便力不从心”。[6] 这种“场景适配”的认知,恰恰是争议双方容易忽略的中间地带。
更强烈的一个信号来自DeepSeek。就在5月中下旬,DeepSeek在多个平台发起招聘,目标是组建一支全新的Harness团队,“从零开始构建对标Claude Code的代码智能体产品”。[1] 其官网上发布的职位描述中有一句醒目的公式:Model + Harness = Agent。[1] 这意味着,DeepSeek认为“除模型本身以外的所有工作,都属于Harness的范畴”,而AI编码工具正是这个“Harness”的核心组成部分。[1]

▲ 配图
一个有趣的细节是,DeepSeek高级研究员陈德里在社交媒体X(原Twitter)上发布的招聘推文中,直接表达了对这一方向的信心。这家以模型能力闻名于世的公司,如今将“Harness”视为与模型同等重要的战略拼图,本身就是对AI编码工具价值的一种有力背书。
三、争议的本质:不是“能否”,而是“如何用”
将两方的观点放在一起对比,可以清晰地看到:争议的核心并非AI编码工具是否有用,而是在什么场景、以什么方式使用。
• 反对方的核心论点:AI生成的代码难以验证、存在安全漏洞、让资深开发者感到疲惫(来源[3]);过度追求编码速度忽略了软件开发的本质目标(来源[5]);AI编码更像是“开着法拉利去买牛奶”(来源[4])。
• 支持方的核心论点:在特定场景下(如样板任务、小型应用、一次性脚本)AI编码工具非常有用(来源[6]);头部公司正在将其视为战略基础设施(来源[1]);行业领导者承认需要“追赶”而非“放弃”(来源[2])。
背后的逻辑是,Stroustrup指责的是“AI生成代码后谁来验证、谁来理解、谁来承担系统长期运行的后果”[3],而ClickHouse团队则通过“与Anthropic、Windsurf和Cursor签订合作协议,解决所有法律和安全问题”来主动管理这些风险。[6] 前者在谈“系统质量”,后者在谈“工具效率”——两者看似矛盾,实则互补:质量是效率的前提,效率是质量的放大器。只有先解决质量验证问题,工具效率才能真正转化为生产力。
Copilot创始工程师Neel Sundaresan的视角或许能提供一种折中。他从2000年就开始研究开发者效率问题,远早于大语言模型的问世。他的核心发现是:“开发者有30%的代码都是API调用”,而AI工具的价值在于“在恰当的时机给出正确的函数调用”。[4] 这暗示着,AI编码工具的真正价值不在于“替代人类写代码”,而在于“让人类少写那些重复性的代码”。
四、我的判断:支持实战派,但反对盲目崇拜
在认真阅读了所有6篇素材后,我的立场是:我支持AI编码工具在限定场景下的使用,但坚决反对将其视为“银弹”的宣传。
理由有三:
第一,实战数据最有说服力。 ClickHouse团队作为C++核心数据库的开发者,他们的经验表明,尽管AI编码工具在大型C++代码库中“力不从心”,但在“重复性任务”上确实有效,且公司内部“对它们有着实际需求”。[6] 如果连这种底层基础设施的维护者都能在特定场景中获益,说明工具本身并非“无用”。
第二,头部公司的战略投入是风向标。 DeepSeek从零组建Harness团队对标Claude Code[1],谷歌CEO承认需要“全力追赶”[2],这些信号表明,最了解技术边界的人正在加注,而非撤退。
第三,但“验证问题”是真实存在的硬伤。 Stroustrup指出的“每次改提示词,生成出来的东西都会变”[3]是不可忽视的工程现实。这要求团队在使用AI编码工具时,必须建立更严格的代码审查、测试和安全机制——正如ClickHouse团队所做的那样。
AI编码工具不是“神”,也不是“坑”,而是一把需要正确握持的刀。
对于那些声称“AI将取代所有程序员”的狂热言论,我们应当保持警惕;但对于那些在实践中证明有效的场景,我们也不应因噎废食。真正的挑战不在于“要不要用”,而在于“如何建立一套能够驾驭AI编码工具的质量保障体系”——这才是所有AI从业者和技术爱好者当下最需要思考的问题。
[1] 模型之外,皆属Harness!DeepSeek终于出手:招人、组队、从零造一个中国版Claude Code,https://www.infoq.cn/article/zqYChrE48RgRbWTX7vhT?utm_source=rss&utm_medium=article
[2] 谷歌CEO最新访谈:谷歌多模态能力领先,但Coding确实落后了,https://www.tmtpost.com/8001070.html
[3] C++之父开撕AI Coding:资深开发者宁愿退休也不愿伺候AI生成的代码,https://www.infoq.cn/article/51fCFjwWFtJBDh04sLVQ?utm_source=rss&utm_medium=article
[4] Copilot 创始工程师:大多数 AI 编码“就像开着法拉利去买牛奶一样”,https://www.infoq.cn/article/e17xvwLZf8rQrArWAFR6?utm_source=rss&utm_medium=article
[5] 人工智能无法加速软件交付,https://www.infoq.cn/article/VvvDVygBzh1uKHT2MXH7?utm_source=rss&utm_medium=article
[6] ClickHouse实战:Agentic Coding,是“神”还是“坑”?,https://www.infoq.cn/article/OLEDsNifw48YdleTAZDg?utm_source=rss&utm_medium=article
感谢阅读,欢迎分享
夜雨聆风