易点事务所 AI 观察 #003

2026 / 5 / 20 — 5 / 24 · 全球 AI / 设计 / 营销周报

本周主线从「模型发布」转向「Agent 怎么进企业、怎么算钱、怎么落地」：编码 Agent 拿到 Gartner 背书、专项小模型在垂直任务上碾压通用 API，Google I/O 则把 Stitch、Antigravity 和 agent 运行时摆上台面；设计侧的讨论集中在「自动化越多，定框架的人越稀缺」；营销与创始人栏目则共同指向一件事——流量逻辑在变（按结果收费、按推理贡献分润、点击经济性下滑），算力基建还要过社区这一关。以下按四个栏目概览重点。

一、AI 模型 / 产品动态

AdventHealth 全面部署 ChatGPT for Healthcare：行政耗时据称减少约 80%

医疗 AI 的竞争焦点，已从「能不能答医学题」转向「能不能省下医生填表时间」。美国 AdventHealth 在 50+ 院区推广 ChatGPT for Healthcare，医师顾问可自动生成结构化病历摘要，部分行政流程耗时从 10 分钟压到 2 分钟，整体行政负担据称下降约 80%。国内健康科技产品应优先锁定高频、低风险的文档与工单场景，并内置人工终审，而不是一上来碰诊断决策。

5/21 · 来源：OpenAI

企业选模型别再只比规模：任务对齐的「训练史」可能比参数量更关键

采购默认「越大越好」，正在让很多企业为用不到的通用能力买单。Dharma AI 基于 DharmaOCR 的实验显示，3B 专项 OCR 模型在结构化文档任务上胜过更大通用 API，单页成本据称比 Claude Opus 4.6 低约 52 倍，且训练轨迹与部署场景的对齐度比参数规模更能预测排名。国内团队立项时应先画清任务边界，再评估领域数据与微调资产是否值得替代一口价 frontier API。

5/22 · 来源：Hugging Face Blog

OpenAI Codex 获 Gartner 2026 企业编码 Agent 领导者认定

企业 AI 编码已从补全助手，进入可审计、可采购的 Agent 阶段。Gartner 首份企业 AI 编码 Agent 魔力象限将 OpenAI Codex 列为领导者，认可其多步改码、自动测试与企业级治理沙箱；Codex 周活已超 400 万，Cisco、NVIDIA 等头部公司正规模化使用。国内工程组织选型时，应把审批流、RBAC 与 OS 级隔离写进硬性清单，再谈模型有多聪明。

5/22 · 来源：OpenAI

Virgin Atlantic 借 Codex 在圣诞档期上线新版 App：近全量单测、零 P1

旺季上线大型 C 端应用，真正考验的是测试纪律而非 demo 速度。维珍航空用 Codex 在固定圣诞窗口交付改版移动 App，实现近完整单元测试覆盖与零 P1 缺陷，部分遗留代码重构从数周缩至约 30 分钟，代码体量可降 78–80%。国内产品团队可把 Agent 优先部署在测试生成与 legacy 清理，用覆盖率换发布窗口。

5/22 · 来源：OpenAI

二、AI + 设计

Google I/O 2026 首日实测：Stitch、Pomelli 与 Gemini 3.5 谁真能用

对设计师而言，Google I/O 2026 的胜负手不在跑分，而在 Stitch 流式改 UI、Pomelli 一键品牌资产，以及 Antigravity 2.0 能否替代 Codex、Claude Code 的日常编排。Lenny 现场实测显示 Gemini 3.5 Flash 速度亮眼，但不少创意工具仍卡在权限与可用性缺口。国内团队可先跟踪 Stitch、Pomelli 的交互范式，等工具稳定后再决定是否迁移 design-to-code 流程。

5/20 · 来源：Lenny's Newsletter

AI 越自动化，设计人与 PM 越吃香：Dan Shipper 谈 Codex 与 Claude Code

AI 自动化悖论正在改写设计岗价值：产出越廉价，越需要人定框架、审质量、做差异化。Every 约 30 人全员接入 Codex 与 Claude Code，团队规模未缩反增，PM 与全栈设计师成为稀缺位。国内团队应停止比出稿速度，转向审 AI 交付、沉淀可复用 design system。

5/24 · 来源：Lenny's Newsletter

三、AI + 海外营销

Helply 按 AI 结案收费：免费工单台挑战 Zendesk 按席位定价

B2B 客服软件的定价逻辑，正从卖登录位滑向卖可验证结果。Helply 工单平台永久免费、不限席位，仅在 AI 真正结案时收费 $0.50，并承诺 90 天内 65% 自动解决率否则零账单，SaaStr 现场三天拿到 125+ 场 demo。国内 SaaS 做客服或售后模块时，可试点按 resolved ticket 计费，把风险从买家转嫁到产品效果上。

5/23 · 来源：SaaStr

Google I/O 没终结 SEO，真正风险是点击经济性

SEO 没死，但用户越来越不必点进你的网站。Google I/O 后 AI Mode 月活已破 10 亿，Overview 触发查询的自然点击可少 38%，信息 Agent 更会在 Google 内汇总推送、绕过站长访问。国内做海外内容营销时，应少争 SEO 是否过时，多建原创数据、工具型内容与可溯源证据页，保住被 AI 引用时的品牌与转化链路。

5/23 · 来源：Search Engine Journal

两个 AI VP 月费 $257：SaaStr 把营销与客户成功 Agent 化

海外活动营销的最大杠杆，正在从加人变成把高频运营交给 Agent。SaaStr 用 10K 与 QB 两名 AI VP 覆盖票务、赞助商触达与财务快照，LLM 调用合计仅 $257/月，QB 曾在凌晨 12:20 自动发出 83 封逐客定制邮件。国内品牌办会、管渠道时可先把邮件清单、催办话术和 CRM 字段标准化，再让 Agent 承担规模化跟进。

5/24 · 来源：SaaStr

Cloudflare Agent Readiness Score：别被总分吓到，先选对扫描类型

Agent 能不能读懂你的网站，已经从感觉变成可量化指标。Cloudflare 在 isitagentready.com 给出 0–100 分，覆盖 robots.txt、MCP、OAuth 等五类信号，但多数拖后腿的检查并不适用于内容站。出海官网先做 discoverability 与 bot access 的低成本修补，再观察哪些标准在多家扫描器里反复出现。

5/24 · 来源：Search Engine Journal

四、创始人观点

Google I/O 争夺的是 agent 运行时

Ben Thompson 是 Stratechery 创始人。Google I/O 2026 最该读的不是又一颗 Gemini 模型，而是 Gemini 3.5 Flash 搭配 Antigravity 要把 agent 运行时做成连接 AI 与用户数字生活的中间层；发布仍显杂乱，但 DeepMind 以世界模型走模拟推理的 AGI 路径，与 OpenAI、Anthropic 都不同，能否与 Google 商业对齐，才是判断其能否后来居上的核心线索。

5/20 · 来源：Stratechery

Agent 时代内容该按推理贡献分润

Parag Agarwal 是 Parallel 创始人兼 CEO。Agent 调用 Web 的频率将远超人类阅读，内容价值必须从页面流量转向推理链上的边际贡献；Parallel 的 Index 用 Shapley 值量化各来源在 agent 完成任务中的独特价值并据此支付，高质量内容有机会在 agent 经济里扩大市场，国内内容平台可提前设计类似的调用遥测与分润机制。

5/21 · 来源：Stratechery

普通人握住了 AI 基建的否决权

Ben Thompson 是 Stratechery 创始人。AI 对白领的冲击主要发生在数字世界，但算力扩张必须落地数据中心并通过行政审批，普通人因此在物理层面握有全球化时代没有的否决权；只辟谣、不谈电价与环境代价，挡不住各地暂缓或否决新项目，国内算力布局应把社区补偿写进选址谈判而非事后公关。

5/23 · 来源：Stratechery

💡 本期一句话总结

当 Codex 写进企业采购清单、内容开始按推理贡献分润、数据中心还要过社区审批，Agent 时代的竞争已从「谁模型更强」转向「谁算得清账、谁接得住落地」。

专注于人工智能、产品设计与品牌营销的交叉融合。我们不仅分享前沿工具的实战技巧，更致力于通过设计为企业创造商业力 Designing for Business Impact。商务合作 / 出海官网定制请后台留言。