乐于分享
好东西不私藏

Vol.20 老吴AI早高峰 | ChatGPT开始卖广告了!中国开源模型争锋,芯片界最大IPO来了

Vol.20 老吴AI早高峰 | ChatGPT开始卖广告了!中国开源模型争锋,芯片界最大IPO来了

(文章音频版本,可结合正文放心食用,也可前往小宇宙平台搜索:老吴AI早高峰)

三天,三个信号。ChatGPT正式开闸卖广告了。中国四家AI实验室12天内集体发布开源编程模型,在一场8模型编程挑战赛中包揽前两名。一家用”整块硅片做一颗芯片”的公司即将完成2026年最大科技IPO。

2026年5月的关键词不再是”谁的模型最聪明”——而是”谁先把AI变成生意”。


一、OpenAI双响炮:GPT-5.5 Instant + ChatGPT广告平台

5月5日,OpenAI在同一天完成了两个重要动作。

第一个是将ChatGPT的默认模型升级为GPT-5.5 Instant。这款模型替换了此前的GPT-5.3 Instant,面向所有用户上线。OpenAI公布了几组核心改善数据:在医疗、法律、金融等高风险领域,模型产生虚假信息的比率下降了52.5%;在用户此前标记过的疑难问题上,不准确回复减少了37.3%。回复长度也有显著压缩——用词量减少了30.2%,行数减少了29.2%。OpenAI在公告中还特别提到减少了”不必要的表情符号使用”。

在功能层面,GPT-5.5 Instant支持搜索用户的历史对话、上传文件以及连接的Gmail,以提供更个性化的回答。这一功能率先面向Plus和Pro用户在网页端开放,移动端和免费用户将在未来几周内覆盖。

第二个更值得关注的动作是ChatGPT自助广告平台Ads Manager的正式上线。这标志着OpenAI的广告业务从”定向邀请制”进入了”开放自助制”的新阶段。

此前ChatGPT的广告测试仅限于少数品牌方通过代理投放。Ads Manager的上线意味着任何规模的企业——从初创公司到全球品牌——都可以自行注册账户、设置预算、上传广告素材、实时管理投放效果。在计费模式上,新增了CPC(按点击付费)竞价选项,弥补了此前仅有CPM(按展示付费)的局限。合作的广告技术和代理方包括电通、阳狮集团、WPP、Adobe、Criteo、Kargo等。

OpenAI的广告收入目标是2026年达到25亿美金,2030年达到1000亿美金。Ads Manager的广告变现负责人Asad Awan在新闻发布会上强调,广告”不会影响ChatGPT核心的有机回答模型”,用户隐私将得到保护。

这一步的战略意义在于:ChatGPT正在从一个纯产品工具,转变为一个具备商业闭环能力的平台。全球周活超过9亿的用户规模,加上用户在对话中主动进行决策和比较的行为特征,使得ChatGPT的广告场景与传统搜索和信息流存在本质差异。对营销和广告行业从业者而言,这是一个值得高度关注的新渠道。


二、中国开源编程模型集体爆发:12天四连发,挑战赛包揽前二

5月3日,开发者Rohana Rezel组织的AI Coding Contest编程挑战赛引爆了AI社区。这场比赛让8个顶级AI模型同台竞技一个Word Gem滑块拼图的编程任务——结果令所有人意外。

来自中国月之暗面(Moonshot AI)的Kimi K2.6以7胜1平0负、22个积分的成绩夺得冠军。小米的MiMo V2-Pro获得亚军。OpenAI的GPT-5.5排名第三,Anthropic的Claude Opus 4.7排名第五。前两名均为中国团队的开放权重模型,全部击败了欧美闭源模型。

Kimi K2.6由月之暗面于4月20日发布,采用1万亿参数的混合专家(MoE)架构,实际每个token仅激活320亿参数,配备256K上下文窗口。其在SWE-Bench Pro(业界最严格的编程基准测试)上得分58.6%,与GPT-5.5持平。在API使用成本上,K2.6约为Claude Opus 4.7的五分之一。

但K2.6最具差异化的能力是Agent Swarm(AI蚁群协同系统)。该系统可以将一个复杂任务自动拆分为数百个子任务,调配最多300个子Agent并行工作,在单次任务中完成超过4000步协调操作,已被验证可以连续自主运行13小时。输出物可以涵盖网页、文档、PPT和表格。

Air Street Press在其五月AI报告中特别指出,这不是孤立事件。在4月中旬到下旬的12天内,四家中国实验室先后发布了开放权重的编程模型:智谱的GLM-5.1、MiniMax的M2.7、月之暗面的Kimi K2.6和深度求索的DeepSeek V4,全部在SWE-Bench Pro上达到56-59分的水平,全部提供开放权重,全部使用成本不超过Claude Opus 4.7的三分之一。报告认为,此前”中国AI编程能力落后欧美六到九个月”的论断,在Agent编程领域已经不再适用。


三、Cerebras IPO:整块硅片做一颗芯片,瞄准266亿估值

5月4日,AI芯片公司Cerebras Systems正式公布了其IPO的关键财务细节。公司计划在纳斯达克发行2800万股,定价区间为每股115至125美金,融资规模最高达35亿美金,对应估值约266亿美金。Bloomberg此前报道,实际上Cerebras的IPO规模可能扩大至40亿美金、估值冲击400亿。据报道,银行手上已经收到超过100亿美金的认购意向,认购倍数接近3倍。

Cerebras的核心产品是Wafer-Scale Engine 3(WSE-3),一种将整块晶圆作为单颗芯片使用的AI处理器。传统芯片制造是将一块硅片切割成数百颗独立的小芯片分别封装。Cerebras反其道而行之——不做切割,整块晶圆即是一颗完整的处理器,内含90万个AI核心和44GB的SRAM片上内存。这种设计消除了芯片间的数据传输延迟,在AI推理场景中声称性能显著优于英伟达的GPU方案。

Cerebras的客户名单极具分量。今年年初,OpenAI与Cerebras签署了一份超过200亿美金的多年期合同,承诺部署750兆瓦的Cerebras算力。AWS也已达成合作协议,在其数据中心部署WSE-3芯片。Meta同样是其客户。

在2025年,Cerebras实现营收5.1亿美金(同比增长76%),净利润8790万美金——实现了从前一年亏损4.85亿的大幅扭亏。

如果Cerebras成功IPO,这将是2026年迄今最大的科技IPO。市场观察人士认为,Cerebras的上市也将为更大规模的IPO——包括目标估值1.75万亿美金的SpaceX——提供市场需求的风向标。


四、剑桥大学忆阻器论文:AI能耗有望降低70%

剑桥大学的研究团队在Science Advances上发表了一项关于新型脑启发芯片材料的研究。该研究开发出一种基于改良氧化铪的”忆阻器”——一种能够在同一物理位置同时存储和处理信息的纳米电子器件,模仿人脑突触的工作方式。

传统计算架构中,内存和处理单元物理分离,数据需要在两者之间频繁搬运,这一过程消耗大量电力。当前AI系统的能耗已经成为行业核心瓶颈之一。

剑桥团队的创新在于器件的切换机制。传统忆阻器依赖在材料内部形成和断裂微小的导电丝来改变电阻状态,这一过程随机性高、功耗大、稳定性差。剑桥团队通过在氧化铪中掺入锶和钛,采用两步生长法,在材料内部形成了可控的p-n结。器件通过调节界面能量势垒的高度来切换状态,而非依赖随机形成的导电丝。

实验结果显示,该器件的开关电流比传统氧化物忆阻器低约一百万倍,能够在数万次切换循环后保持稳定,并支持数百个不同的电导状态。论文指出,如果大规模应用脑启发的神经形态计算架构,AI硬件的能耗有望降低70%。

首席作者Babak Bakhit博士指出,能耗问题是当前AI硬件面临的核心挑战之一——解决这一问题需要”极低电流、卓越稳定性、出色的循环均匀性,以及在多种不同状态间切换的能力”。这项研究为实现这些目标提供了一条新的技术路径。


五、老吴的判断——变现

这几天的核心信号是两个字:变现。

OpenAI推出自助广告平台,不是一个产品更新——是一个商业模式的正式启动。ChatGPT从”工具”变成了”平台”,从”花钱”变成了”赚钱”。这个转变对整个AI行业的影响,可能比任何一次模型升级都大。

中国开源模型12天四连发、编程挑战赛包揽前二——这件事的意义不在于谁赢了谁输了,而在于:高性能AI编程工具的使用成本正在被拉低到所有人都用得起的水平。上期我们聊了四大巨头6500亿Capex的基建投入,这期就看到了红利——更多的模型、更低的成本、更强的能力。

Cerebras的IPO则代表了另一条线:AI芯片从英伟达一家独大的格局,正在走向多元竞争。整块晶圆做芯片这个路线能不能跑通,市场会给出答案。但至少OpenAI用200亿美金投了一票。

剑桥的忆阻器论文虽然离产业化还远,但它指向的方向——模仿大脑来造芯片——可能是未来十年AI硬件最重要的叙事之一。

做创意做活动的兄弟们,信号很清楚:AI工具的选择在变多、成本在变低、商业化在加速。窗口还开着。