
AI前沿日报 06.05|Poke接入iMessage,Meta给创作者配AI运营助理
01 今日速览
Poke 成为首个获准接入 Apple Messages for Business 的第三方 AI Agent。用户可以直接在 iMessage 里和 Poke 对话,让它做日程规划、管理日历、追踪健康健身、控制智能家居、编辑照片等任务。Poke 已经处理约 1 亿条消息,新的看点是分发入口:AI Agent 不一定要做一个新 App,也可以变成消息列表里的一个联系人。
Meta 在 Facebook 推出 AI creator assistant。它会根据创作者的内容风格、表现数据、社区互动和目标,回答“什么时候发帖”“评论区在说什么”“最近受众有什么变化”,也可以根据趋势生成内容建议。创作者工具正在从“看数据面板”变成“在平台内问一个运营助理”。
AI token 成本开始成为企业采购里的显性问题。TechCrunch 报道提到,Uber 在 4 月前用完全年 AI coding 预算,Microsoft 曾撤回开发者的 Claude Code 许可,Priceline 员工称 Cursor 合同续约报价上涨 4 到 5 倍。Linux Foundation 也计划成立 Tokenomics Foundation,把 AI token 成本管理标准化。
新华网拟投入 11.22 亿元建设“新华语典”项目,定位为权威时政资讯智能体,目标用户包括党政机关、科研院所、高校和国有企事业单位。它的产品形态不是普通资讯 App,而是面向政策研读、理论学习、政务文稿和舆情研判的垂直 Agent。
林洋智维发布电力交易智能体“虚拟交易员 2.0”,基于蚂蚁数科 DTClaw 智能体平台和 EnergyTS3.0 能源时序大模型,覆盖预测、策略、交易、调度、风控和复盘。官方披露的实测数据包括电价 / 出力预测准确率提升 5% 以上、交易收益提升 5% 以上、策略生成速度提升 20 倍以上。
GitHub 今日趋势里,CopilotKit、Agent-Reach、last30days-skill、Vibe-Trading、MemPalace 等项目集中在 Agent 产品的几层基础设施:前端交互、跨平台信息搜索、近期舆情研究、交易 Agent 和长期记忆。
Hugging Face 今日论文榜中,TIDE、AdaPlanBench、Personal AI Agent for Camera Roll VQA、RobotValues、Dream.exe 都在补 Agent 产品落地时的真实问题:主动发现隐藏问题、在约束变化后重新规划、理解个人相册、处理家庭机器人价值冲突,以及判断视频生成动作能否被机器人执行。
02 海外新产品 / 新业态
1. Poke 接入 Apple Messages:AI Agent 开始进入系统级消息入口
Poke 是一个面向普通用户的 AI Agent,原本支持 SMS、Telegram 和部分市场的 WhatsApp。它现在获准接入 Apple Messages for Business,成为首个能在 Apple 这一平台上运行的第三方 AI Agent。Apple Messages for Business 原本主要服务航空、零售、酒店等企业,让用户通过 iMessage 和商家沟通,现在第一次接入了一个独立 AI Agent。
产品入口变了。Poke 不要求用户打开一个新的 AI App,也不要求用户学习命令行或复杂 Agent 框架。用户像给朋友发消息一样,把任务发给 Poke。它可以处理日程、日历、健康、智能家居和照片编辑。这类产品把 Agent 从“工具页面”移到“聊天列表”,降低了第一次使用门槛。
但进入 Apple 生态不是简单多一个渠道。Poke 需要向 Apple 证明它有真人支持能力,必须清楚标识自己是 AI Agent,还要按 Apple 的界面规范处理按钮、链接预览和消息样式。也就是说,消息平台开始给 AI Agent 设置分发门槛:不是任何 bot 都能直接进入用户的 iMessage。
商业模式也变了。Poke 联合创始人表示,公司会按用户向 Apple 付费。这相当于 AI Agent 的分发成本从“买广告、做增长”变成“向系统消息入口交通行费”。Agent 如果想进入 iMessage、WhatsApp、Instagram DM、微信这类高频入口,未来都可能面对平台抽成、审核和能力限制。
这类产品的核心问题不是模型能不能回答,而是用户是否愿意把日常任务交给一个消息联系人。它要持续证明三件事:不打扰、不乱操作、不把隐私和账号弄丢。
2. Meta Creator Assistant:创作者后台开始从数据面板变成运营问答
Meta 在 Facebook 推出 AI creator assistant,面向美国、加拿大和印度创作者开放。它会基于创作者自己的内容风格、历史表现、社区反馈和目标,给出个性化建议。创作者可以问“什么时候发帖比较好”“评论区在说什么”“我的受众最近怎么变了”,也可以让它根据趋势帮忙想内容。
过去创作者工具大多是数据面板。平台展示浏览量、互动率、粉丝增长、评论、热门内容,但创作者要自己解读这些数据。Meta 这次把数据分析变成对话式产品:创作者不必逐项看图表,可以直接问问题。
它的优势来自平台内数据。第三方 AI 工具可以帮创作者想选题,但很难拿到 Facebook 内部表现数据、评论变化、受众结构和 Reels 分发表现。Meta 的助手不是单纯内容生成器,而是把平台数据、趋势推荐和创作建议放在同一个入口。
Meta 同时扩展 AI 翻译语言,包括阿拉伯语、印尼语、法语、泰语和越南语。Facebook 上每周已经有超过 5 亿用户观看 AI 翻译视频。创作者工具的下一步不是只帮人写文案,而是直接帮内容跨语言传播。保留语气、音色、口型同步之后,一个创作者的内容可以在更多市场被消费。
这类产品会把创作者运营拆成几个 AI 可接管环节:选题、发布时间、评论洞察、翻译、本地化、复盘。平台不只是给创作者流量,也开始把创作者的运营工具内置进去。
3. “No-AI Search”增长:不是所有用户都想把搜索变成聊天
DuckDuckGo 近期把 no-AI search 做成更容易访问的默认搜索体验,并推出 Chrome 和 Firefox 扩展。这个模式下,搜索结果没有 AI 答案、没有聊天提示,也会减少 AI 图片干扰。DuckDuckGo 称 no-AI search 页面访问量在 Google AI 搜索改版后明显增长。
这不是反 AI 产品,而是“可选择不使用 AI”的产品设计。Google 正在把搜索框变成 AI Mode 和 Agent 入口,DuckDuckGo 反向提供一个更传统、更干净的搜索体验。用户分化开始出现:有人希望 AI 直接总结答案,有人只想要链接、来源和更少干扰。
这类产品变化提醒 AI 产品不要默认“所有功能都要 AI 化”。AI 不是越多越好,关键是用户在当前任务里要什么。查事实、找原始网页、做严肃资料检索时,用户可能更希望减少模型改写;做旅行规划、购物比较、复杂问答时,AI 整理更有用。
搜索产品未来可能分层:AI Mode、No-AI Mode、研究模式、隐私模式、购物模式。真正的产品能力不是把 AI 永远放在最前面,而是让用户在不同任务中切换信息组织方式。
03 新技术 / 技术底座
1. TIDE:Agent 不该只解决用户说出口的问题
TIDE 研究的是 Agent 如何从上下文中主动发现隐藏问题。现在很多 AI 助手仍然是被动模式:用户提出一个问题,Agent 回答这个问题。但在真实工作空间里,很多问题用户还没意识到。文档里可能有冲突要求,代码库里可能有潜在风险,项目计划里可能有遗漏依赖。
TIDE 把这个任务定义为“从上下文中发现多个隐藏问题”。它不是一次性生成一堆泛泛建议,而是通过模板引导和迭代发现,每轮找到一小批问题,再根据已经发现的内容继续扩展覆盖面。模板相当于过去案例里沉淀下来的问题类型:看到哪些信号,要联想到哪类风险,应该找什么证据。
这个技术对应的是主动型 Agent。比如个人工作空间 Agent 看到邮件、日历和文档后,不只是等用户问“我今天要做什么”,而是主动指出会议材料缺失、客户回复未处理、两个截止日期冲突。代码 Agent 也不是只修用户指出的 bug,而是顺手发现配置冲突、依赖风险和未覆盖测试。
主动发现问题的难点在边界。Agent 如果天天提醒一堆不重要的问题,会变成噪音;如果只盯最明显的问题,又失去价值。TIDE 这类方法的产品意义在于:Agent 需要一套“找问题”的流程,而不是只会“回答问题”。
2. AdaPlanBench:Agent 做计划时,要能应对用户和世界不断补充的新约束
AdaPlanBench 评估的是 LLM Agent 在约束逐步暴露时重新规划的能力。现实任务很少一开始就把所有条件说清楚。用户可能先说“帮我安排晚餐”,后面才补充“孩子不能吃辣”“餐厅要离家 20 分钟内”“老人走路不方便”。世界约束也会变化:店关门、路堵、预算不够、时间冲突。
AdaPlanBench 用 307 个家庭任务构建评测,让 Agent 在多轮互动中不断接收新约束。只有当 Agent 提出的计划违反隐藏约束时,系统才会揭示更多条件,要求它重新规划。最好的模型准确率也只有 67.75%,并且随着约束增加表现下降。
这类评测很贴近日常 Agent 产品。订餐、旅行、日程、家务、护理、购物、家庭机器人任务,都需要一边执行一边修正计划。一个只会生成完美初始计划的 Agent 不够用,因为真实世界会不断打断它。
产品上要支持“计划可编辑”。Agent 给出计划后,用户要能逐步补充偏好,系统要能记住约束、解释为什么调整、避免重复犯错。Agent 不是一次性写方案,而是持续维护一个会变化的计划。
3. Camera Roll VQA:个人相册会成为个人 AI 的长期视觉记忆
Personal AI Agent for Camera Roll VQA 研究的是个人相册问答。用户可以问“我昨天吃的那道菜叫什么”“推荐我还没吃过的菜”“我去年去海边穿的是哪件衣服”。这类问题不是通用视觉问答,而是基于用户多年照片、地点、时间和生活习惯的私人视觉记忆。
论文构建了 camroll 数据集,包含 50 个用户、31476 张图片和 2500 个问答对。系统设计了 camroll-agent,带有层级记忆和少量工具,用来在大量个人照片中导航和检索。
个人相册和普通文档不一样。照片数量大,时间跨度长,很多信息不是文字描述,而是视觉细节:菜品、衣服、场景、朋友、宠物、路线、收据、白板、会议照片。用户提问时往往也不会精确描述文件名,只会说“上次去东京那家店”“去年生日那张照片”。
手机里的 Photos、Google Photos、iCloud 相册,都可能成为个人 AI 的核心数据源。产品问题不只是“能不能识别照片”,而是能不能建立长期视觉记忆:按时间、地点、人物、事件、物体、用户习惯组织内容。隐私边界同样严苛,因为相册是最私密的数据之一。
4. RobotValues:家用机器人不能只追求完成任务
RobotValues 评估家庭机器人在价值冲突场景里的选择。家庭机器人执行任务时,常常不只面对“怎么完成任务”,还要平衡隐私、自主性、效率、礼貌和安全。
比如用户让机器人整理房间,它可能看到私人信件;老人要求帮忙拿药,但药量可能不合适;孩子让机器人拿危险物品,完成任务和安全保护发生冲突。一个只追求任务成功的机器人,会在家庭场景里犯很真实的错误。
RobotValues 构建了 1 万个价值冲突场景。研究发现,视觉语言模型有默认偏好,比如更倾向安全和迁就,但对隐私相关行动选择不足;当明确要求模型优先某个与默认偏好冲突的价值时,模型约 80% 情况下仍无法覆盖默认动作。
家用机器人产品不能只用“任务完成率”做评估。它需要知道什么时候不该做,什么时候要问人,什么时候要保护隐私,什么时候效率不是第一目标。机器人进入家庭,价值选择会变成产品逻辑,而不是伦理附录。
5. Dream.exe:视频生成好看,不代表机器人能照着做
Dream.exe 用机器人操作任务评估视频生成模型。方法是:给模型一张场景图和一个任务描述,让它生成操作视频,再把视频里的动作转成机器人轨迹,在物理仿真中执行,最后看任务是否真的完成。
这解决了 AI 视频评测里的一个盲点。普通视频生成评测看画面质量、提示词对齐、人物一致性;机器人训练更关心动作能不能执行。一个视频看起来像人在拿杯子,但轨迹可能不符合物理,手和物体位置可能无法转换成机器人动作,执行时会失败。
论文发现,视觉质量并不能很好预测可执行性。有些视频看起来漂亮,但转成机器人动作后失败;有些视频不够精致,却包含更可执行的物理信息。
视频模型如果要进入机器人和仿真,就不能只追求“像电影”。它要生成动作、接触、轨迹、力学上更合理的过程。短期内,这类评测可以帮助机器人团队筛选哪些生成模型适合做合成数据,哪些只适合内容创作。
04 开发者生态 / 开源项目
1. CopilotKit:Agent 产品需要自己的前端栈
GitHub 今日趋势中,CopilotKit 的描述是“Frontend Stack for Agents & Generative UI”,支持 React 和 Angular,并提出 AG-UI Protocol。它解决的是 Agent 产品里的前端问题。
很多 Agent demo 仍停留在聊天框。用户输入一句话,模型返回一段文字。但真正的 Agent 产品需要更复杂的界面:任务状态、工具调用、确认按钮、表单、进度、错误恢复、人工接管、生成式 UI。只靠聊天气泡很难承载这些交互。
CopilotKit 这类前端栈的价值,是让开发者更容易把 Agent 嵌进应用。比如一个销售系统里,Agent 不只是回答“这个客户怎么样”,还要展示客户卡片、推荐下一步动作、生成邮件、等待用户确认后写回 CRM。前端要能承载这些动作,而不是只显示一段 Markdown。
Generative UI 会成为 Agent 产品的重要层。模型不只生成文本,也会根据任务生成按钮、表格、卡片、表单和可编辑页面。前端协议如果能标准化,Agent 应用开发会从“每家自己拼 UI”变成“按任务生成交互组件”。
2. Agent-Reach:Agent 需要低成本读取社交和内容平台
Agent-Reach 的描述是让 AI Agent “看到整个互联网”,可以读取和搜索 Twitter、Reddit、YouTube、GitHub、Bilibili、小红书等平台,并强调一个 CLI、零 API 费用。CLI 是命令行工具,适合开发者或 Agent 调用。
这类工具解决的是信息采集问题。很多研究型 Agent、增长 Agent、舆情 Agent、投资 Agent 都需要跨平台找信息。官方 API 贵、限流、封闭,网页结构又经常变化。Agent-Reach 这类项目把多个平台的读取方式封装成一个入口。
产品价值在内容研究、竞品监控、社媒趋势、创作者分析、投研资料收集。一个市场团队想知道某个品类最近在小红书和 YouTube 怎么被讨论,一个游戏公司想看 Reddit 和 Bilibili 的玩家反馈,一个开源项目想看 GitHub 和 X 的传播情况,都需要跨平台信息。
边界在平台规则和数据合规。零 API 费用听起来诱人,但平台反爬、隐私政策、版权和账号安全都可能成为问题。真正可商用的产品不能只解决“能抓到”,还要解决“能不能合法稳定地抓”。
3. MemPalace 与 Vibe-Trading:记忆和交易正在变成 Agent 项目高频主题
MemPalace 标榜自己是开源 AI memory system。Agent 记忆继续成为开发者关注点,因为长程任务、个人助手、代码仓库、CRM、客服都需要保存历史上下文。没有记忆,Agent 每次都像刚入职;记忆不可控,Agent 会把错误长期带下去。
Vibe-Trading 则把个人交易 Agent 做成开源项目。金融 Agent 这类方向要谨慎看,因为交易和投资建议直接涉及风险,但它说明开发者正在把 Agent 从研究、写作、代码扩展到真实资产决策。此类产品不能只看模型策略,还要看风控、权限、交易日志、回撤、人工确认和合规。
这两个项目放在一起看,说明 Agent 开源生态正在从“会调用工具”走向“能长期决策”。长期决策必须有记忆,也必须有边界。少一个都会出问题。
05 商业化落地 / 国内动态
1. 新华语典:权威内容机构开始做垂直资讯 Agent
新华网公告拟投入 11.22 亿元建设“新华语典”项目,项目由新华社主导,新华网负责研发运营,定位为权威时政资讯智能体。目标用户是党政机关、科研院所、高校、国有企事业单位干部职工,场景包括理论学习、政策研读、政务文稿、舆情研判。
这个产品不是面向大众的 AI 新闻助手,而是面向强合规、强权威需求的垂直资讯 Agent。它的价值不在“内容更多”,而在“内容可信、口径统一、场景明确”。普通大模型可以总结政策,但政务场景需要来源可控、表达合规、知识更新、输出可审查。
新华网已有 20000+ 政府用户、10000+ 企业用户、1500+ 高校院所合作资源。这个分发基础决定了新华语典不是从零找用户,而是接入既有政企客户网络。垂直 Agent 的起点往往不是模型能力,而是客户渠道、内容权威和场景适配。
它也说明内容机构的 AI 产品化路径在变化。过去媒体做 AI,可能是摘要、推荐、智能写作;现在开始做“专业内容 + 工作流 Agent”。资讯不只是被阅读,也会进入写材料、做研究、看舆情、形成报告的工作流程。
2. 林洋虚拟交易员 2.0:能源 Agent 不是聊天,而是预测、交易、调度和复盘闭环
林洋智维在 SNEC 展会上发布电力交易智能体“虚拟交易员 2.0”。产品基于蚂蚁数科 DTClaw 智能体平台和 EnergyTS3.0 能源时序大模型,为新能源电站、虚拟电厂、能源运营商提供交易决策。
这个 Agent 覆盖预测、策略、交易、调度、风控和复盘。它不是问答助手,而是进入电力市场运营链条:先预测电价和发电出力,再生成交易方案,再执行或辅助执行,再根据结果复盘。电力现货市场和虚拟电厂本身就需要连续决策,适合 Agent 介入。
官方披露的实测数据包括电价 / 出力预测准确率提升 5% 以上、交易收益提升 5% 以上、分析与策略生成速度提升 20 倍以上、人力效率提升 5 倍以上。这类数字需要在更多实际项目里继续验证,但它说明产品评价方式很清楚:预测准不准、收益提不提、策略生成快不快、人工是否减少。
林洋同日还发布面向新能源电站的 AI 运维智能体,采用现场私有部署,可对接电站 SCADA / RTU 系统,解析运行数据,形成辅助运维、辅助运营和人员培养能力。能源 AI 的产品形态正在从“后台报表”变成“现场系统里的工作代理”。
3. 算电协同进入产品化:算力调度和电力调度开始互相看见
SNEC 光伏展上,施耐德电气、华为、蚂蚁、阿里云、利星能等公司集中展示了算电协同方案。利星能联合阿里云发布“星河”分布式算电协同解决方案,面向分布式光储站点轻量化、模块化部署,已在江西鄱阳零碳工厂部署并跑通。
算电协同解决的是 AI 基础设施背后的一个实际问题:算力负载是动态的,电力系统响应速度往往更慢。算力侧希望按任务、成本、延迟灵活调度;电力侧需要稳定、安全、可预测。两边如果互相看不见,就会出现低电价地区缺算力,有算力地区电价高,任务能耗和成本算不清。
施耐德电气展示的是“从电网到芯片、从芯片到冷源”的一站式方案;利星能与阿里云的合作则把分布式光储和阿里云全栈 AI 技术连接起来。这里的产品不是一个 AI 助手,而是一套能源和算力的调度系统。
AI 产品越依赖长程 Agent、视频生成和大规模推理,底层算力成本越会进入业务模型。未来企业不只问“调用哪个模型”,还会问“这个任务在哪个算力节点跑、用什么电、成本多少、是否低碳”。算电协同会从能源行业话题,逐渐变成 AI 应用成本的一部分。
夜雨聆风