AI 编码战争打到 2026:为什么 Codex、Claude Code 只是第一站

AI 编码战争打到 2026:为什么 Codex、Claude Code 只是第一站
Latent Space x Unsupervised Learning crossover,2026-04-23。这场 crossover 对谈把 2026 年 AI coding wars 放到更大的产业结构里看:模型公司、应用公司、基础设施公司和普通团队,都正在被 coding agent 重新排序。
01
这不是一场普通复盘:2026 年,coding agent 开始“越狱”
Jacob Effron:我们每年做一次 Unsupervised Learning 和 Latent Space 的 crossover,这次想从整个 AI 生态的变化谈起:模型层、基础设施、coding wars,以及创业公司的压力。
swyx:我刚从 AIE Europe 回来,最强烈的感受是:2025 年大家还在讨论 coding agents,2026 年它们开始从代码库里跑出来,去吃掉别的工作流。
Jacob Effron:所以这期的核心问题不是“哪个代码工具最好”,而是 AI coding 会不会成为所有应用市场的预演。
swyx:对。代码是软件的入口,而软件吃掉世界。coding agent 吃掉软件之后,自然会继续向外扩张。
02
AIE Europe 现场的三个关键词:OpenClaw、harness、context engineering
Jacob Effron:你刚办完 AIE Europe。站在 AI 工程社区的中心,现在大家最关心什么?
swyx:最前面的主题是 OpenClaw。过去四五个月,它几乎成了大家绕不开的话题。再往下是 harness engineering 和 context engineering,它们分别对应 agent 怎么被装进工作流、怎么管理上下文。
Jacob Effron:这和前两年的 AI infra 讨论不太一样。
swyx:是。过去 infra 公司像在追一个不断变形的目标,LangChain 这样的公司几乎每年都要重塑一次。现在某些东西开始稳定,比如 skill 这种格式:一个 Markdown 文件,加上一些脚本,已经很接近最小可行形态。
Jacob Effron:所以你觉得 agent infra 真的进入稳定阶段了吗?
swyx:不能说全部稳定,但 harness 这一层确实有了更清楚的形状。它不一定会永远不变,但现在已经足够让大家围绕它建产品。
03
为什么基础设施公司比应用公司更难活
Jacob Effron:应用公司可以告诉客户:模型变了,我们会把最好的方法重新接进去。客户相对粘,因为你解决的是最终业务问题。
swyx:基础设施公司就残酷很多。开发者会非常快地转向新的热门工具,而且迁移成本并不总是高到不可接受。
Jacob Effron:所以这是横向 infra 和纵向应用的老问题,在 AI 时代被放大了。
swyx:我会把 Sierra、Lara 这类公司看成“外包 AI 团队”。客户不想自己雇一整支 AI 团队,所以让它们持续吸收最前沿能力,再交付到业务里。这个模式相对稳。
Jacob Effron:而横向 infra 必须反复证明自己不是上一个周期的工具。
swyx:对。但也有一些横向机会会成立,比如 sandboxes,本质上是 AI 时代的新计算资源。只要 agent 需要安全、隔离、可执行的环境,这个需求就会很大。
04
Agent Labs playbook:先用最强模型,再训练自己的模型
Jacob Effron:现在公司到底应不应该自己训练模型?是否应该基于自己的数据做 RL?这个问题每三个月答案都会变。
swyx:我的看法是:如果你有足够 workload 和足够高质量用户数据,就会自然走向自训或后训练。
Jacob Effron:这就是你说的 agent lab playbook?
swyx:是。先用 OpenAI、Anthropic、Google 这类大实验室最强的模型,把产品跑起来;等你知道任务分布、收集了反馈、掌握了高价值数据,再为自己的领域做专门模型。
Jacob Effron:这其中有多少是真实价值,多少是营销价值?
swyx:两者都有。起一个自己的模型名字当然有传播价值,但成本、延迟、质量控制也是真问题。只要用户量够大,自己优化模型就是合理的。
05
开源模型和自定义芯片,让“差一点质量、快很多”重新变得诱人
swyx:模型选择永远是在质量、成本、延迟之间做交换。过去大家愿意为了质量忍受慢一点、贵一点,但自定义芯片改变了这个权衡。
Jacob Effron:你指的是 Cerebras、Groq 这类非 NVIDIA 路线?
swyx:对。替代硬件越来越多,推理速度可以从每秒不到一百 token 跳到上千 token。速度差距这么大时,质量小幅下降就不一定是致命问题。
Jacob Effron:你看到很多公司真的 All in 替代芯片了吗?
swyx:还没有全面铺开,但 Cognition 和 OpenAI 都在用 Cerebras。以前我觉得从 100 token/s 到 200 token/s 不值得激动,但如果是几千 token/s,产品形态就会改变。
Jacob Effron:这也会反过来影响开源模型的吸引力。
swyx:是。因为如果某个开源或可控模型能在新硬件上跑得极快,它就可能在特定场景里胜出。
06
产品要卖给 agent:API、文档和默认路径都要重写
Jacob Effron:越来越多 infra 公司开始把 agent 当成买方或使用者。卖给 agent 和卖给人有什么不同?
swyx:第一,agent 不是终极理性开发者。它们很容易被 prompt injection 影响,也很容易放大既有赢家。
Jacob Effron:也就是说,早早进入训练数据的工具会有复利。
swyx:对。如果你的库、API、文档在 2023 年之前就被广泛写进代码和教程,那 agent 会天然更容易选择你。
Jacob Effron:那产品应该怎么适配?
swyx:第一步是必须有 agent 能用的 API。第二步是文档要能被机器稳定理解。第三步是默认路径要非常清楚,因为 agent 会沿着阻力最小的路径走。
Jacob Effron:这意味着很多公司真正的“用户界面”不再是 dashboard,而是 agent 调用面。
swyx:对。Vercel 甚至看到管理应用配置的流量里,bot/agent 占比已经非常高。这不是未来式,已经在发生。
07
AI coding wars:三家公司突然长出数十亿美元级市场
Jacob Effron:自从上次聊,你加入了 Cognition,也站到了 AI coding 一线。现在这个市场到底是什么状态?
swyx:巨大,而且比我们一年前想象的还大。OpenAI 和 Anthropic 都把 coding 作为优先级。Claude Code 的 ARR 规模已经非常可观,OpenAI 的 Codex 也在快速追赶,Cursor 也被传到类似量级。
Jacob Effron:所以不是小众开发者工具,而是一个突然长出的主赛道。
swyx:是。更重要的是,它预演了未来其他 vertical AI 市场会发生什么:基础模型公司会亲自下场,应用公司也会用 workflow、数据和产品体验守住边界。
Jacob Effron:你怎么看 Claude Code 和 Codex 的差异?
swyx:很多人第一次被 Claude Code 击中,是因为它给了“魔法时刻”。即使后来 Codex 能力接近甚至更好,第一印象和习惯仍然会形成粘性。
08
Token-maxing:现在的浪费,可能是下一轮能力发现的门票
Jacob Effron:现在很多公司会看员工用了多少 token,这有点像用代码行数评价工程师。
swyx:确实粗糙,甚至有点难看。但方向上我觉得没错,因为我们总体仍然低估了 AI。
Jacob Effron:所以你不担心大家为了刷 token 而刷 token?
swyx:短期会有浪费,但真正高频、高消耗的人更可能发现新能力。Ryan Lopopolo 一天消耗十亿 token,这肯定有很多无效尝试,但如果新能力出现,他会比谨慎的人先看到。
Jacob Effron:这是一种能力探索,而不是效率优化。
swyx:对。现在行业还处在 capability exploration 阶段,不是 squeezing efficiency 阶段。等能力边界更清楚,大家才会回头优化成本。
09
编码市场的终局:两个大玩家,加一条长尾
Jacob Effron:你觉得 AI coding 市场最后会怎么分布?
swyx:最可能是两个大玩家占据主体,旁边有一条长尾,服务特殊场景或特殊偏好。
Jacob Effron:要改变这个格局需要什么?
swyx:需要经济模型、品牌、价值主张出现重大变化。过去六个月我还没看到足够大的变量。
Jacob Effron:那其他应用市场会复制这个结构吗?
swyx:很多会。区别在于基础模型公司不可能对所有垂直领域都保持同样强度的注意力。它们会重点打 finance、healthcare 这类大市场,但仍会给更专注的应用公司留下空间。
10
OpenAI、Anthropic 都想外扩,但专注本身仍是应用公司的武器
swyx:OpenAI 现在有 super app 叙事,也有 coding 叙事,还会看其他垂直场景。Anthropic 也不只是 Claude Code,还会尝试 finance、cowork 等方向。
Jacob Effron:这会不会让应用公司更危险?
swyx:中型应用公司危险更大,因为它们已经有收入、有估值,也更容易被模型公司的新功能打到。但早期创业公司不用太害怕。
Jacob Effron:为什么?
swyx:最坏的情况,你证明自己能做东西、能追前沿、能执行,最后也可能被实验室雇走。对个人和小团队来说,下行风险并不大。
Jacob Effron:但对已经融过很多钱的公司来说,每三个月都可能是命运重估。
swyx:是。AI 让 late-stage company 的估值区间变得极宽,三个月可能是上行,也可能是下行。
11
Consumer AI 平台期:ChatGPT 没输,但整个消费频次还没被打开
Jacob Effron:有人说 ChatGPT 增长放缓,是否说明消费 AI 被其他产品抢走了?
swyx:我更倾向于说,这是类别问题,不是单个产品输掉了。
Jacob Effron:很多知识工作者每天用 AI,但普通用户未必有同样频率。
swyx:对。coding AI 之所以爆,是因为开发者每天都有高频、刚需、可验证的任务。消费 AI 还没找到同样强的日常使用闭环。
Jacob Effron:下一种魔法体验可能是什么?
swyx:也许是 consumer agent、computer use,或者 coding agent 的能力迁移到普通人的电脑和生活工作流里。
12
2026 论点:coding agents break containment
swyx:我的当前理论是:OpenClaw 展示的是未来方向,但 OpenAI 并不天然拥有这个方向的胜利权。
Jacob Effron:你说的 break containment,就是 coding agent 从代码任务扩张到所有任务?
swyx:对。2025 年是 coding agents 年,2026 年是它们越过代码边界的一年。
Jacob Effron:因为它们会生成软件,而软件本来就能改造一切。
swyx:这就是链条:软件吃掉世界,coding agents 吃掉软件,所以 coding agents 最终会吃掉更多工作流。
Jacob Effron:在个人生活里,这种越界可能更容易被看见;在企业里,它会遇到流程、权限、审计和团队协作。
swyx:是。企业不会因为一个 demo 就重写自己,但方向已经很清楚。
13
Vibe coding 正在挤压 SaaS,但真正难的是让团队跟上
Jacob Effron:你自己有没有用 AI 重写内部 SaaS?
swyx:我们有一个活动和赞助管理 SaaS,一年大概 20 万美元。我可能花 2000 美元就能做一个定制版。
Jacob Effron:那为什么还没换?
swyx:问题不是我能不能做,而是团队能不能接受。公司里 AI native 和非 AI native 的差距在拉大。
Jacob Effron:一边觉得别人落后,一边觉得 vibe coder 做出 80% 方案后把剩下 20% 的烂摊子丢给团队。
swyx:这正是很多公司内部的撕裂。AI 让某些人看到“很多东西没必要”,也让另一些人看到“不完整方案的维护成本”。
Jacob Effron:所以 SaaS 会被挤压,但替换 SaaS 不是纯技术问题。
swyx:对。还会有一个更 AI-native 的 system of record 机会,也许像 AI apps 的 Firebase,但它还没有完全出现。
14
安全争论:不是只有网络安全,还有 biosafety 和模型分级释放
swyx:在一次 Anthropic CPO Mike Krieger 参加的 dinner 上,大家问最担心什么,我说的是 biosafety。
Jacob Effron:这听起来像早期 AI 风险讨论里的经典问题。
swyx:但很多人其实没意识到:如果模型让个人获得制造生物风险的能力,这不是普通产品风险。
Jacob Effron:那你觉得会不会出现高能力模型的配给或限制?
swyx:两年内对十万亿以上参数模型全面配给,我不太认为。但最前沿一代模型被限制、内部使用、蒸馏给下游模型,这是合理的。
Jacob Effron:类似实验室保留一个很大的 teacher model,然后发布更便宜可用的版本。
swyx:对。我的猜测是很多实验室都会这么做,因为真正被广泛使用的模型一定要考虑成本。
15
规模化还没结束,但 context 和 memory 可能是最大瓶颈
Jacob Effron:你之前认为模型可能在两万亿参数附近遇到上限,现在怎么看?
swyx:我觉得这个判断可能错了。模型参数还在继续放大,问题是到底会放到多大:两百万亿?更大?没人知道。
Jacob Effron:但大家也知道单纯规模化不可能给出下一个一千倍或一百万倍。
swyx:是。所以很多团队在找新的 architecture、新的 scaling law。把世界大部分变成数据中心,显然会挑战人的直觉。
Jacob Effron:除了算力,另一个限制是上下文。
swyx:context length 是 LLM 里增长最慢的维度。我们从 4K 到百万上下文用了几年,而且百万上下文出现很久了,真正高效使用的人并不多。
Jacob Effron:所以 memory 会成为下一阶段核心。
swyx:我认为是。不是把所有东西塞进上下文,而是让模型拥有可用、可更新、可检索的记忆。
16
swyx 改变主意:开源模型没有死,可能正在回升
Jacob Effron:过去一年你最大的观点变化是什么?
swyx:我去年对 open models 比较悲观,因为有些一线公司的观察是开源模型份额只有 5% 且还在下降。现在我觉得它可能在回升。
Jacob Effron:但公开 benchmark 上,闭源前沿模型的优势似乎还在扩大。
swyx:benchmark 很难信,因为太容易被 gaming。更有意义的是自由市场里人们真的选什么,比如 OpenRouter 的用量。
Jacob Effron:开源模型很多时候靠价格和折扣赢。
swyx:对,所以要做价格校正。但即使校正后,我也不认为 open models 可以被忽略。特别是结合自定义芯片、低成本推理和领域后训练,它们会在很多场景变得很重要。
17
Dark factory:从零人类写代码,到零人类审查
Jacob Effron:你提到过 dark factory,这到底是什么意思?
swyx:AI coding psychosis 有几个层级。第一层是 zero human-written code,也就是人不亲自写代码。几个月前这还听起来激进,现在已经没那么激进。
Jacob Effron:下一层是什么?
swyx:zero human review。代码不只是由 AI 写,还直接通过自动化验证、测试和部署机制进入系统。
Jacob Effron:这听起来更危险。
swyx:是,但如果想扩展到机器速度写代码,人类审查会成为瓶颈。真正可扩展的路径是重写 SDLC:更多测试、更强自动验证、更可靠的回滚和监控。
Jacob Effron:数量会先上来,质量再通过系统约束回来。
swyx:对。软件变得便宜、可丢弃、可大量试错之后,质量创新也可能从数量里长出来。
18
Post-training 和 RL:不一定长期领先,但可能赢下三个月窗口
Jacob Effron:我过去不太相信应用公司为了整体质量做 RL 或 post-training,因为三到六个月后基础模型会免费给你更强能力。
swyx:现在你有点改变了吗?
Jacob Effron:是。因为如果应用公司每三个月都重写产品,那么为了赢下这三个月窗口做后训练,也许就是最好的客户结果。
swyx:关键是要问:这是解决客户问题的最佳路径吗?有时候是加更多数据,有时候是 connectors,有时候是工程,有时候确实是 post-training。
Jacob Effron:所以它不是信仰问题,而是短周期 ROI 问题。
swyx:对。AI 产品会越来越像持续实验系统,而不是一次性产品路线图。
19
下一前沿:memory、world models,以及“知道很多但没经历过”的模型
Jacob Effron:接下来一年你最关注哪些未解问题?
swyx:第一是 memory 和 personalization。第二是 world models。
Jacob Effron:world models 很容易被理解成 3D、机器人或具身智能。
swyx:那是一部分,但我更关心它对智能本身的影响。现在的 LLM 很像知道很多文本事实,但缺少空间、物理和经验层面的理解。
Jacob Effron:所以 Fei-Fei Li 谈 spatial intelligence,你觉得重要。
swyx:是。world models 不只是让机器人走路,它也可能让模型从 next-token prediction 走向更接近经验世界的推理。
Jacob Effron:你用《心灵捕手》的场景来比喻这个差异。
swyx:对。一个 LLM 可能像 Will Hunting 一样什么都读过、什么都能说,但它并没有真正经历过世界。那种“知道”和“经历”之间的距离,可能就是下一代智能要跨过去的地方。
20
这场对谈真正留下的问题:AI 公司、SaaS 和每个团队都要重新排队
Jacob Effron:把这场对谈合起来看,AI coding wars 不是一个孤立市场。
swyx:它是模板。模型公司会进应用,应用公司会往模型和数据层走,infra 公司要重新定义自己卖给谁。
Jacob Effron:企业内部也会分化:有的人已经把 agent 当默认同事,有的人还在怀疑 80% 方案的维护成本。
swyx:这两边都有道理。真正的组织能力,是把 AI native 的速度和工程系统的可靠性结合起来。
Jacob Effron:所以 Codex、Claude Code、Cursor、Cognition 今天争的是代码,明天争的可能是所有知识工作。
swyx:是。AI coding 是第一块被点燃的市场,但不是最后一块。
延伸阅读:Latent Space 原文与 Unsupervised Learning 节目页。
夜雨聆风