今天的AI圈很热闹。
模型在变快,全模态能力在补齐,Agent工具开始从"能对话"走向"能干活"。更有意思的是,行业里的钱和算力也在快速集中,中国大模型公司的估值、融资和生态热度都在继续抬升。
模型更新:更快、更全模态
商汤SenseNova-U1 开源了8步蒸馏 LoRA,把原本约100 NFE的推理流程压缩到8 NFE,H100上的推理时间从约23秒缩短到2秒。它也已经支持 ComfyUI,覆盖文生图、图像编辑和交错生成工作流。
字节跳动火山引擎也升级了 Doubao-Seed-2.0-lite。这是豆包大模型家族首款全模态理解模型,原生支持视频、图像、音频和文本理解,还能做跨模态联合推理。音频部分支持19种语种转写和多语种互译,Agent、Coding、GUI能力也同步增强。
一句话看,模型厂商现在不只拼参数和榜单了,开始拼"能不能便宜稳定地接进真实业务"。
产品更新:Agent正在接管更多日常工具
xAI 在 Grok Web 上线 Connectors 功能,支持接入 SharePoint、Outlook、OneDrive、Google Workspace、Notion、GitHub、Linear 等工具。它要解决的问题很直接:让AI能读邮件、改文档、查文件、做代码审查、更新任务,而不是让用户在一堆应用之间来回复制粘贴。
Grok Imagine API 也推出了 Quality Mode,面向企业开发者提供更高质量的图像生成和编辑能力,重点放在真实性、文本渲染和创意控制上。价格按提示词和输出分辨率计费,适合产品图、营销素材、内容创作等场景。
Perplexity Agent API 新增金融搜索功能,开发者可以通过一次工具调用,让智能体拿到授权金融数据、实时市场数据和带引用的网络信息。对于金融问答、投研助手、行情分析类应用,这类能力会很实用。
算力与融资:AI公司的竞争正在变重
Anthropic 与 SpaceX 达成算力合作,获得 Colossus 1 数据中心超过300兆瓦算力资源,其中包括22万块以上 NVIDIA GPU。这直接带来了 Claude Code Pro、Max 等计划五小时速率限制翻倍,并取消高峰时段限流。Claude Opus API 的速率限制也提升了。
中国市场同样热。DeepSeek 的估值被曝在数周内从200亿美元升至450亿美元,融资由国家大基金领投,腾讯也有意跟投。月之暗面则被曝完成约20亿美元融资,投后估值超过200亿美元,由美团龙珠领投。
这些消息放在一起看,AI竞争已经不是单纯产品竞争。算力、融资、生态和政策资源,都会决定下一阶段谁能跑得更久。
行业动态:AI进入交通、游戏和支付系统
Uber 宣布集成 OpenAI 技术,用于全球实时交通服务平台。新功能会帮助司机更智能地规划接单,也让乘客更快完成叫车流程。AI在这里不是聊天入口,而是嵌进供需匹配和实时调度。
Google DeepMind 则与 EVE Online 相关团队合作,在复杂、动态、玩家驱动的游戏环境中研究智能系统。游戏一直是AI研究的好试验场,而 EVE Online 这种高度复杂的经济与社群系统,很适合观察智能体如何在开放环境里行动。
PayPal 也启动AI转型,计划未来两到三年裁员约20%,同时把业务精简为三大板块。公司希望通过云原生架构和AI应用提升效率,预计节省至少15亿美元成本。这个信号很现实:AI不只是增长故事,也会重塑组织结构。
研究进展:多模态模型开始理解"空间功能"
Apple Machine Learning Research 推出了 SFI-Bench,用来评估多模态大模型的空间功能智能。
过去很多空间评测关注几何感知,比如物体在哪里、距离多远。但具身智能真正需要的是更高一层的理解:一个物体能做什么,人在这个空间里可能怎么行动,某个位置是否适合完成任务。
SFI-Bench 包含1700多个问题,数据来自多样化的第一人称室内扫描视频。这个方向值得关注,因为它更接近机器人、AR助手和空间智能体的真实需求。
开发者工具:AI编程进入工作流阶段
Warp 团队开源了15个内部使用的 Oz Skills 工作流工具,覆盖 Git/GitHub 协作、数据分析、Web质量审计、基础设施规范和通用生产力。重点不是多做几个API封装,而是把日常工作流沉淀成可复用工具。
OrcaRouter-Lite 也开源了。它是一个可自托管的 LLM 路由工具,支持 OpenAI、Anthropic、Google、Groq 等模型提供商,核心能力是 model="auto",自动选择成本最低且能力匹配的模型。对团队来说,这能减少手写模型选择逻辑的麻烦。
还有一个很值得开发者看的观点:随着 Claude 等编码代理越来越可靠,"感觉编码"和"代理工程"的边界正在变模糊。以前大家会强调必须逐行审查AI代码,现在很多人已经开始把编码代理当成半黑箱工具使用。效率提升是真的,风险也是真的。
今日观察
今天最明显的趋势是:AI正在从"模型能力展示"走向"真实工作流接管"。
连接器、金融搜索、编码技能、文件系统沙箱、模型路由、性能分析工具,这些都不华丽,但非常关键。因为企业真正需要的不是一个会聊天的窗口,而是一个能接进系统、理解上下文、完成任务、留下记录的执行层。
接下来,谁能把模型能力变成稳定、低成本、可审计的工作流,谁就更有机会拿下真实场景。
夜雨聆风