每天9:30 · 5大方向 · 深度解读
今日导读
OpenAI Codex正式上线"录制回放"功能,AI编程Agent迈入自主执行时代;微软Copilot首次接入国产DeepSeek模型,多模型混合架构成为大厂降本共识;陆家嘴论坛宣布科创板向AI大模型敞开大门,DeepSeek完成510亿首轮外部融资——这个6月,AI行业正从"谁模型最强"转向"谁能把模型、资本、治理组织成可持续生态"。
深度解读
① OpenAI Codex上线"录制-回放":AI从补全代码走向操作电脑
6月22日,OpenAI为macOS端Codex推送了26.616版本更新,核心功能是Record & Replay——用户只需完整演示一遍操作流程,Codex就能将其转化为可无限复用的自动化技能。这绝非简单的鼠标轨迹录制:它抓取的是文件路径、操作逻辑和校验标准,跨文件、跨网页的复杂工作流都能稳定复刻,且支持本地与远程主机切换线程,录好的技能可在远程设备上持续运行。
这意味着什么?过去AI编程工具的核心能力是"补全"和"问答",开发者仍然是操作主体。而Record & Replay的底层依托的是Computer Use桌面操控权限,标志着AI从"被动回答"向"主动执行"的关键跃迁。一个值得注意的限制是:该功能欧盟、英国、瑞士因数据合规法规暂不开放,这也说明AI自主操控桌面带来的隐私合规挑战正在成为产品设计中不可忽视的前置约束。对开发者而言,越早上手这类Agent工具,越能在"数字员工"时代获得效率杠杆。
📎 来源:OpenAI官方更新日志 / aitop100.cn
② 微信"小微"灰度内测:10亿级入口的原生AI操作系统来了
6月22日,腾讯确认微信正在小范围灰度测试原生AI助手"小微"——部分内测用户发现主界面左上角出现AI聊天入口,但这并非又一个聊天机器人。"小微"拥有系统级权限,能直接调起微信原生功能和小程序:一句语音即可帮好友发消息、查朋友圈、预约服务。
这件事的技术意义被严重低估了。此前AI与微信的结合方式无非是公众号/小程序的第三方接入,本质上是"套壳",权限边界严格受限。而"小微"拥有的是操作系统级能力——能够直接解构并执行复杂跨应用指令。这意味着微信正在从"聊天工具"进化为"智能服务调度平台"。微信10亿+用户基数意味着"小微"一旦全量开放,将成为全球最大规模的原生AI入口。对开发者而言,这释放了一个明确信号:超级App原生AI化不再是概念,如何让自己的小程序、服务适配AI自然语言调度能力,将成为下一个生态竞争焦点。
📎 来源:aitop100.cn / 腾讯官方确认
③ 微软Copilot首次接入DeepSeek:大厂开始用"混合模型路由"降本
6月22日行业消息确认,微软将在企业级智能体Copilot Cowork中引入DeepSeek V4作为分层备选模型。这是美国头部科技大厂首次在核心B端AI产品中纳入国产大模型,背后的驱动力很简单——算力太贵了。Copilot Cowork上线后超过半数财富500强已部署,高频多工具调用带来的Token消耗让固定订阅模式难以持续。
微软的方案值得开发者仔细研究:不是简单替换模型,而是搭建了智能分层路由——简单日常任务自动调度DeepSeek,复杂高难度推理才启用高端闭源模型,并配套完整的质量校验机制。这套架构本质上是在做"风险路由+成本路由+能力路由"的三合一调度。DeepSeek的MoE混合专家架构使得同等任务算力开销远低于海外旗舰模型,这正是其被选中的核心原因。对开发者而言,这个案例提供了生产环境多模型调度的最佳参考——不要幻想一个模型包打天下,基于任务复杂度做分级调用才是务实路径。
📎 来源:aitop100.cn / 微软官方渠道
④ Anthropic开启"AI驱动AI"递归自进化:模型工厂概念浮出水面
6月23日AI内参独家分析指出,Anthropic正在推行一套"AI驱动AI"的递归自进化策略——将最新模型深度嵌入自身研发流程,构建研发效率指数级增长的"模型工厂"。具体而言,Anthropic正在用Fable 5/Mythos 5级别的模型来自动化完成代码审查、基准测试设计、安全评估和训练数据清洗等工作。
这背后是一个深刻范式转变:以前AI大模型公司是"人类工程师用工具造模型",现在是"模型辅助人类造更好的模型"。递归自进化的飞轮一旦转起来,每次迭代的加速度会超过线性改进,这是OpenAI、Google也在同步探索的方向。对普通开发者来说,这听起来很遥远,但其方法论可以降维应用——你是否在尝试用AI审查自己的代码?用AI做测试用例生成?"AI辅助AI开发"的工程实践已经可以落地到个人工作流中。Anthropic的模式暗示,下一代AI公司的竞争壁垒可能不再是单一模型性能,而是"模型迭代速度"本身。
📎 来源:AI内参(neican.ai) / Anthropic技术博客
⑤ GPT-5.6月底上线:150万Token上下文+自主操作设备能力
多方测试数据表明,OpenAI最快将在6月28日正式发布GPT-5.6。这次更新的最大看点不是参数竞赛,而是上下文窗口扩容至150万tokens——比上代提升43%,同时单位token算力消耗降低10%-15%。这意味着几十万行的完整代码库或超长行业文档可以不拆段直接输入分析。
更值得关注的是两个新能力:原生3D视觉复刻(上传设计图直接生成浏览器可交互三维素材)和内置Playwright自动化工具(AI能自主操控浏览器点击、填表、抓取数据)。这标志着GPT-5.6正在从"文字问答工具"升级为"全能智能体"。商业层面同样刺激——业内预估其token单价仅为Claude Fable 5的三分之一,OpenAI显然在用价格战锁定开发者生态。不过也有冷静的声音指出,5.6属于阶段性优化而非GPT-6式的跨代飞跃,开发者更期待官方修复过往版本的"逻辑降智"问题。无论如何,Agent长任务执行能力将成为下半年AI竞争的核心赛道。
📎 来源:aitop100.cn / OpenAI技术社区
⑥ 科创板为AI大模型敞开大门:DeepSeek 510亿融资背后的资本变局
6月22日陆家嘴论坛释放了重磅信号:证监会正式宣布科创板第五套上市标准适用范围扩大至人工智能大模型领域,未盈利但掌握自主核心技术的AI企业可申报上市。同日,DeepSeek宣布完成首轮外部融资超510亿元人民币,投后估值达4000亿元,投资方包括腾讯、宁德时代、网易、京东及国家人工智能产业投资基金。
这两件事连起来看意义重大。科创板通道的开辟解决了中国AI企业"去哪里上市"的长期困扰——过去未盈利AI公司只能赴美IPO,现在有了本土资本市场支撑。但值得注意的是,科创板明确要求AI企业必须证明"规模化应用"能力,单纯靠"定制化项目收入"撑估值的路走不通了,这对大模型创业公司的商业模式提出了硬约束。DeepSeek的510亿融资则是另一个信号:中国AI产业正从"美元VC驱动"转向"产业资本+国字号基金"主导。对AI从业者而言,资本生态的成熟意味着更多就业和创业机会,但同时也意味着AI公司需要证明自己的商业闭环能力,而不只是模型跑分。
📎 来源:知乎AI产业观察 / 陆家嘴论坛公告 / DeepSeek官方
⑦ 阿里HappyHorse 1.1发布:国产视频生成模型打响画质一致性攻坚战
6月22日阿里巴巴推出HappyHorse 1.1视频生成大模型,从动作流畅度、主体稳定性、指令识别、画面质感、音画同步五大维度全面迭代。新版最亮眼的特性是支持同时上传9张角色参考图,确保多镜头成片中人物/商品外观全程统一——这正是此前AI视频的致命痛点:人物变脸、穿帮频繁。
HappyHorse 1.1的技术改进反映了AIGC视频领域从"能生成"到"能商用"的关键跨越。动态时序建模的优化使得舞蹈、打斗、流体布料等高难度画面连贯度大幅提升,成片画质去掉了过度锐化和虚假磨皮的AI痕迹,更接近实拍质感。目前该模型已全量接入阿里云百炼和千问云,创作者可通过API批量生成短视频素材。这件事对开发者的启示是:视频生成模型正在快速从一个"好玩的技术"变成可商业化集成的API产品,电商广告、短剧制作、营销素材等场景会率先被AI视频覆盖。视频生成的工程化落地,比预想的来得更快。
📎 来源:aitop100.cn / 阿里云百炼平台公告
⑧ 恩和科技BPL:用编程语言"编译"生物实验,生物制造走向工业化
6月23日AI内参报道了恩和科技发布的BPL协议语言(Biological Protocol Language),这是一套专为生物实验设计的领域专用语言——将传统模糊的自然语言实验步骤转为可编译、可验证、可复用的结构化代码。这背后是Physical AI正在从机器人领域向生物制造延伸的明确信号。
为什么这件事重要?生物实验长期受困于"可重复性危机"——同一篇论文的实验步骤,不同实验室复现率低得惊人,本质原因是自然语言描述的歧义性。BPL的思路是用编程语言的严谨性替代自然语言的模糊性:实验步骤一旦被"编译",就变成了可被机器精确执行的指令序列。这为AI介入生物实验打开了大门——一旦实验流程变成结构化代码,AI就能像优化程序性能一样优化实验参数。对程序员而言,这提供了一个有趣的跨领域类比:Nature论文里的Methods章节,正在变成"源代码",而BPL就是这门"语言"的编译器和语法标准。生物制造的工业化时代,比我们预期的更近了。
📎 来源:AI内参(neican.ai) / 恩和科技
📌 源乐程序员 · AI科技日报
每个工作日 9:30 准时推送
关注我们,不错过每一次AI变革
夜雨聆风