
2026 / 5 / 20 — 5 / 24 · 全球 AI / 设计 / 营销 周报
本周主线从「模型发布」转向「Agent 怎么进企业、怎么算钱、怎么落地」:编码 Agent 拿到 Gartner 背书、专项小模型在垂直任务上碾压通用 API,Google I/O 则把 Stitch、Antigravity 和 agent 运行时摆上台面;设计侧的讨论集中在「自动化越多,定框架的人越稀缺」;营销与创始人栏目则共同指向一件事——流量逻辑在变(按结果收费、按推理贡献分润、点击经济性下滑),算力基建还要过社区这一关。以下按四个栏目概览重点。
一、AI 模型 / 产品动态
AdventHealth 全面部署 ChatGPT for Healthcare:行政耗时据称减少约 80%
医疗 AI 的竞争焦点,已从「能不能答医学题」转向「能不能省下医生填表时间」。美国 AdventHealth 在 50+ 院区推广 ChatGPT for Healthcare,医师顾问可自动生成结构化病历摘要,部分行政流程耗时从 10 分钟压到 2 分钟,整体行政负担据称下降约 80%。国内健康科技产品应优先锁定高频、低风险的文档与工单场景,并内置人工终审,而不是一上来碰诊断决策。
5/21 · 来源:OpenAI
企业选模型别再只比规模:任务对齐的「训练史」可能比参数量更关键
采购默认「越大越好」,正在让很多企业为用不到的通用能力买单。Dharma AI 基于 DharmaOCR 的实验显示,3B 专项 OCR 模型在结构化文档任务上胜过更大通用 API,单页成本据称比 Claude Opus 4.6 低约 52 倍,且训练轨迹与部署场景的对齐度比参数规模更能预测排名。国内团队立项时应先画清任务边界,再评估领域数据与微调资产是否值得替代一口价 frontier API。
5/22 · 来源:Hugging Face Blog
OpenAI Codex 获 Gartner 2026 企业编码 Agent 领导者认定
企业 AI 编码已从补全助手,进入可审计、可采购的 Agent 阶段。Gartner 首份企业 AI 编码 Agent 魔力象限将 OpenAI Codex 列为领导者,认可其多步改码、自动测试与企业级治理沙箱;Codex 周活已超 400 万,Cisco、NVIDIA 等头部公司正规模化使用。国内工程组织选型时,应把审批流、RBAC 与 OS 级隔离写进硬性清单,再谈模型有多聪明。
5/22 · 来源:OpenAI
Virgin Atlantic 借 Codex 在圣诞档期上线新版 App:近全量单测、零 P1
旺季上线大型 C 端应用,真正考验的是测试纪律而非 demo 速度。维珍航空用 Codex 在固定圣诞窗口交付改版移动 App,实现近完整单元测试覆盖与零 P1 缺陷,部分遗留代码重构从数周缩至约 30 分钟,代码体量可降 78–80%。国内产品团队可把 Agent 优先部署在测试生成与 legacy 清理,用覆盖率换发布窗口。
5/22 · 来源:OpenAI
二、AI + 设计
Google I/O 2026 首日实测:Stitch、Pomelli 与 Gemini 3.5 谁真能用
对设计师而言,Google I/O 2026 的胜负手不在跑分,而在 Stitch 流式改 UI、Pomelli 一键品牌资产,以及 Antigravity 2.0 能否替代 Codex、Claude Code 的日常编排。Lenny 现场实测显示 Gemini 3.5 Flash 速度亮眼,但不少创意工具仍卡在权限与可用性缺口。国内团队可先跟踪 Stitch、Pomelli 的交互范式,等工具稳定后再决定是否迁移 design-to-code 流程。
5/20 · 来源:Lenny's Newsletter
AI 越自动化,设计人与 PM 越吃香:Dan Shipper 谈 Codex 与 Claude Code
AI 自动化悖论正在改写设计岗价值:产出越廉价,越需要人定框架、审质量、做差异化。Every 约 30 人全员接入 Codex 与 Claude Code,团队规模未缩反增,PM 与全栈设计师成为稀缺位。国内团队应停止比出稿速度,转向审 AI 交付、沉淀可复用 design system。
5/24 · 来源:Lenny's Newsletter
三、AI + 海外营销
Helply 按 AI 结案收费:免费工单台挑战 Zendesk 按席位定价
B2B 客服软件的定价逻辑,正从卖登录位滑向卖可验证结果。Helply 工单平台永久免费、不限席位,仅在 AI 真正结案时收费 $0.50,并承诺 90 天内 65% 自动解决率否则零账单,SaaStr 现场三天拿到 125+ 场 demo。国内 SaaS 做客服或售后模块时,可试点按 resolved ticket 计费,把风险从买家转嫁到产品效果上。
5/23 · 来源:SaaStr
Google I/O 没终结 SEO,真正风险是点击经济性
SEO 没死,但用户越来越不必点进你的网站。Google I/O 后 AI Mode 月活已破 10 亿,Overview 触发查询的自然点击可少 38%,信息 Agent 更会在 Google 内汇总推送、绕过站长访问。国内做海外内容营销时,应少争 SEO 是否过时,多建原创数据、工具型内容与可溯源证据页,保住被 AI 引用时的品牌与转化链路。
5/23 · 来源:Search Engine Journal
两个 AI VP 月费 $257:SaaStr 把营销与客户成功 Agent 化
海外活动营销的最大杠杆,正在从加人变成把高频运营交给 Agent。SaaStr 用 10K 与 QB 两名 AI VP 覆盖票务、赞助商触达与财务快照,LLM 调用合计仅 $257/月,QB 曾在凌晨 12:20 自动发出 83 封逐客定制邮件。国内品牌办会、管渠道时可先把邮件清单、催办话术和 CRM 字段标准化,再让 Agent 承担规模化跟进。
5/24 · 来源:SaaStr
Cloudflare Agent Readiness Score:别被总分吓到,先选对扫描类型
Agent 能不能读懂你的网站,已经从感觉变成可量化指标。Cloudflare 在 isitagentready.com 给出 0–100 分,覆盖 robots.txt、MCP、OAuth 等五类信号,但多数拖后腿的检查并不适用于内容站。出海官网先做 discoverability 与 bot access 的低成本修补,再观察哪些标准在多家扫描器里反复出现。
5/24 · 来源:Search Engine Journal
四、创始人观点
Google I/O 争夺的是 agent 运行时
Ben Thompson 是 Stratechery 创始人。Google I/O 2026 最该读的不是又一颗 Gemini 模型,而是 Gemini 3.5 Flash 搭配 Antigravity 要把 agent 运行时做成连接 AI 与用户数字生活的中间层;发布仍显杂乱,但 DeepMind 以世界模型走模拟推理的 AGI 路径,与 OpenAI、Anthropic 都不同,能否与 Google 商业对齐,才是判断其能否后来居上的核心线索。
5/20 · 来源:Stratechery
Agent 时代内容该按推理贡献分润
Parag Agarwal 是 Parallel 创始人兼 CEO。Agent 调用 Web 的频率将远超人类阅读,内容价值必须从页面流量转向推理链上的边际贡献;Parallel 的 Index 用 Shapley 值量化各来源在 agent 完成任务中的独特价值并据此支付,高质量内容有机会在 agent 经济里扩大市场,国内内容平台可提前设计类似的调用遥测与分润机制。
5/21 · 来源:Stratechery
普通人握住了 AI 基建的否决权
Ben Thompson 是 Stratechery 创始人。AI 对白领的冲击主要发生在数字世界,但算力扩张必须落地数据中心并通过行政审批,普通人因此在物理层面握有全球化时代没有的否决权;只辟谣、不谈电价与环境代价,挡不住各地暂缓或否决新项目,国内算力布局应把社区补偿写进选址谈判而非事后公关。
5/23 · 来源:Stratechery
💡 本期一句话总结
当 Codex 写进企业采购清单、内容开始按推理贡献分润、数据中心还要过社区审批,Agent 时代的竞争已从「谁模型更强」转向「谁算得清账、谁接得住落地」。
专注于人工智能、产品设计与品牌营销的交叉融合。我们不仅分享前沿工具的实战技巧,更致力于通过设计为企业创造商业力 Designing for Business Impact。商务合作 / 出海官网定制请后台留言。
夜雨聆风