乐于分享
好东西不私藏

今日 AI 三件事|4月24日

今日 AI 三件事|4月24日

🤖 AI资讯速览

1. 发布GPT-5.5的同一天,OpenAI挂出2.5万美元征集生物越狱

GPT-5.5今天对所有付费用户开放。同一天,OpenAI在博客挂出一份红队悬赏:找出让模型在生物安全话题上通用失守的越狱路径,最高可拿2.5万美元。页面强调赏金只发给通用型越狱,也就是对整类危险请求都有效的绕过手法,而不是针对某个具体提问的单次绕过。

小安说:OpenAI 现在的路子很明确,一边发新模型拉高能力上限,一边主动把最危险的边界摊到台面上测。拿奖金公开找漏洞,比关起门来自测更像成熟公司的做法,但也说明生物安全这根弦确实越来越紧了。

来源 | OpenAI

2. Anthropic罕见公开Claude Code降质postmortem,同周OpenAI把Codex晒到400万周活

花在AI上的钱比工资多,一批创业公司拿这事做融资卖点。估值叙事从团队规模切到人均产出。SaaS工具链、内容生成类赛道先被改写。高错误成本行业仍跑不起这套。

安说:这事放一起看,挺像 AI 编程进入真刀真枪阶段的信号。一边是基础设施和稳定性开始决定口碑,另一边是用户规模迅速拉开差距。接下来拼的已经不只是模型会不会写代码,而是谁能真正扛住企业级使用。

来源 | Anthropic、OpenAI

3. LLMs+、世界模型、agent编排:MIT把2026年的AI拆成三条主线

MIT Tech Review今年的AI清单不再把LLM当作单一未来主轴。取而代之的是三条并列路线:LLMs+、世界模型、agent编排。三条各自在补LLM的不同短板。从2026年开始,产品团队的第一个决策不再是 “选哪个基础模型” ,而是 “自己属于哪条主线” 。工具链一旦分叉,跨主线的迁移成本会远高于切换LLM。

小安说:这个判断我基本认同。大模型解决表达和推理,世界模型补上对环境和过程的理解,agent 编辑则把能力真正接到任务里。未来比的降不会再是谁单点最强,而是谁有能力把这三层接起来,形成可持续交付结果的系统

来源 | TechenologyReview