乐于分享
好东西不私藏

【日报】AI Builders Digest:AI 正在重塑软件开发

【日报】AI Builders Digest:AI 正在重塑软件开发

**【日报】AI Builders Digest:AI 正在重塑软件开发来源:AI Builders | 2026.05.31

本期摘要

Anthropic 工程师分享 Salesforce 深度落地案例:231 天预估的项目 13 天完成,质量反而提升;OpenAI Codex 透露”让人开心的数字”,暗示增长态势良好;Y Combinator 总裁 Garry Tan 说了一句关于融资的本质洞察;Google VP 用”ridiculously easy”形容多语言 AI 支持;以色列安全公司 Onyx 分享”AI 监控 AI”的企业安全赛道机会。

Anthropic 工程师复盘 Salesforce 案例:真正带来收益的团队,是彻底重新设计流程

Boris Cherny 是 Anthropic Claude Code 团队的工程师。他分享了 Salesforce 深度使用 Claude Code 落地 agentic 开发流程的详细案例。

核心数据:

· 原本预估 231 天的迁移项目,实际 13 天完成· 一个 PR 交付了 21 个端点,测试覆盖率 100%· 代码产量增加,但线上事故反而下降 5%

“The teams seeing the biggest wins from AI are completely changing how they work, not speeding up what they already do. What steps can you delete, what handoffs go away, what can an agent just own end to end.”

真正带来巨大收益的团队不是简单地用 AI 加速现有工作流程,而是彻底重新设计流程——删除冗余步骤、消除交接环节、让 agent 端到端独立完成任务。

同时质量不降反升,因为安全 guardrails 和质量标准被内置到了 agentic 工作流本身。Boris Cherny 还特别指出:

“Productivity vs quality is sometimes framed as a tradeoff. They’re not seeing it.”

OpenAI Codex 团队:看了一个数字,很开心,我们仍然很早期

Thibault Sottiaux 是 OpenAI Codex 和 ChatGPT 团队的工程师。他在推特上透露:

“I looked at a number today on a codex dashboard and it made me happy. More news about the number soon. 👀 Thanks to everyone who keeps adopting codex. We are still early. So early.”

他暗示产品增长态势良好,同时预告”更多消息即将公布”。不过更值得关注的是他抛出的这个问题:

“Do you still trust benchmarks or do you just listen to your friends? What makes you try a new model?”

如今人们判断一个新模型好不好,是靠跑 benchmark 还是靠朋友圈口碑?模型评估方式正在发生变化。

Y Combinator 总裁 Garry Tan:钱不是火,油才是火

Garry Tan 分享了一句关于融资的本质洞察:

“Money is not the fire. Money is gasoline you pour on a fire that already exists. You don’t have a funding problem. You have a ‘people don’t want it yet’ problem. Go make the first fire.”

核心逻辑:你缺的不是一个资金问题,而是”还没人真正想要你的东西”这个问题。先去把第一把火点燃。

Box CEO Aaron Levie:愿意花 5 亿美元自己造,说明这个赛道被严重低估

Box CEO Aaron Levie 认为:

“The app layer couldn’t get a better advertisement than a company spending $500M to build their own version of it.”

当一家公司愿意花 5 亿美元自己造一个”应用层”的时候,就是对软件行业最大的背书。他暗示这个信号远比表面看起来更看多软件赛道。越是花大钱自己造,越是说明有巨大价值还没被满足。

Google VP:多语言 AI 支持已经”ridiculously easy”

Josh Woodward 是 Google GoogleLabs 和 Gemini 的 VP。他只用两句话透露了 Google 在消费者 AI 产品化方向上的最新动向:

“Turn your car into a Lamborghini.”
“Multilingual is now ‘ridiculously easy’.”

以色列公司 Onyx 做”AI 监控 AI”:传统安全工具为什么对 Agents 失效

Onyx Security CEO Maxim Bar Kogan 在 No Priors 播客中说了一句让很多人印象深刻的话:

“当我们把 ChatGPT 当作生产力工具使用时,是在玩火——因为这些 agents 会用我们的权限做任何事,包括那些我们并不希望它们做的事。”

核心逻辑:

传统安全工具(身份管理、端点防护、API 安全)之所以对 AI agents 失效,是因为这些工具不知道 agents 在”想什么”——它们不理解上下文,只看行为结果。

举例:你让 Claude Code 去重建一个数据库,Claude Code 正常执行了,这个操作完全符合 API 权限逻辑,但它可能正在处理一个完全不相关的任务,根本不该碰那个数据库。传统安全工具看不出来。

Onyx 的方案:训练专门的小模型来判断某个 AI 操作是否需要让更聪明的人(更贵的 agent)来看一眼。

这种”直觉判断”机制借鉴了国际象棋高手的思维模式——大多数步不需要深度计算,靠直觉;但关键步必须停下来算清楚。模型也是同理,不需要对每个操作都跑完整推理,用小模型做高效初筛,关键时刻再调起强模型处理。

关于漏洞发现成本骤降,Maxim 的态度是:市场没有过度反应,这是真实且巨大的变化。企业能做的就是假设这些模型迟早会来,赶紧把 foundational controls 筑牢。

他还提到了一个结构性机会:企业不愿意把历史行为数据给 Anthropic 或 OpenAI,因为知道这些公司会拿去训练模型。这意味着 Onyx 能拿到更丰富的数据来训练监控模型,而这是大厂做不到的事情。

本期其他亮点

· OpenClaw 核心贡献者 Peter Steinberger 透露团队新加入 Vince,并形容”Vince 是极少数真正理解新时代软件如何构建的人”,随后发了一条”I smell a takedown in 3…2…1″,暗示有大动作即将揭晓· every CEO Dan Shipper 转发了某条内容并评价”extremely sick”· FPV Ventures 合伙人 Nikunj Kothari 分享了见证朋友走完 Y Combinator 面试全流程的体验

AI Builders Digest | 每日 AI 行业资讯精选 | follow-builders