作者: AI 前线观察员

过去 24 小时,AI 巨头们的动作密集且极具针对性。字节跳动火山引擎正式开放了电影级视频模型的 API,MiniMax 让 Agent 学会了操作鼠标键盘,而 OpenAI 则被曝出正在用代号“Spud”的新模型对标 Anthropic。以下是本周值得关注的三大动态:
一、火山引擎 Seedance 2.0:电影级视频 API 全面开放
如果你在做短视频、短剧或营销素材,这是一个值得关注的降本信号。
* 核心动作:火山引擎正式上线 Seedance 2.0 系列 API 服务,企业和开发者现在可以直接调用这一 SOTA 级视频生成能力。
* 技术亮点:
* 多模态输入:支持文字、图片、音频、视频混合输入,不仅能“文生视频”,还能进行视频编辑、延长等复杂操作。
* 工业级可用:在复杂运动场景和物理准确性上表现更强,贾樟柯等导演已将其用于短片制作,企业反馈制作效率提升 80%–90%。
* 合规与成本:
* 安全机制:建立了严格的肖像与版权标准,提供上万预置虚拟人像,规避真人肖像风险。
* 价格参考:据测算,纯生视频约 1 元/秒(15 秒约 15 元),视频编辑类任务单价更低。
一句话点评:视频生成的工业化门槛正在被迅速踏平,创意行业的“AI 代工”时代正式开启。
二、MiniMax Agent 大升级:你的电脑有了“数字员工”
Agent(智能体)不再只是聊天,它开始真正“动手”了。
* Pocket 功能(Beta):打通了 飞书、微信、企业微信 等主流 IM。你现在可以在手机聊天里直接给桌面 Agent 发指令(比如“把我桌面的报告发给我”),Agent 在电脑端执行后把结果回传到聊天窗口。这解决了“人不在电脑前”的远程操控痛点。
* Computer Use 能力:这是本次升级的“黑科技”。Agent 现在能像人一样识别屏幕、点击鼠标、操作软件。无论是整理文件、操作没有 API 接口的内部系统,还是调整系统设置,它都能通过图形界面直接完成,实现了从“动口”到“动手”的跨越。
一句话点评:AI 正从“聊天框”钻进你的工作流缝隙,成为真正的生产力协作者。
三、OpenAI 反击战:代号 Spud 与 Frontier 平台
一份流出的内部备忘录揭示了 OpenAI 2026 年 Q2 的激进策略。
* 新模型 Spud:代号 Spud(推测为 GPT-5o/5.5)被定位为“推理旗舰”,专门对标 Anthropic 的 Claude Mythos。它基于 Blackwell 架构训练,重点提升复杂推理和意图识别的可靠性。
* 生态布局 Frontier:OpenAI 正在构建名为 Frontier 的 Agent 平台,旨在成为企业级智能体的默认基座,强调工作流编排和安全治理。
* 战略转向:OpenAI 正在减少对微软的单一依赖,加强与 Amazon Bedrock 的合作,以触达更多 AWS 企业客户。备忘录中还尖锐批评 Anthropic 存在算力瓶颈和营收数据“注水”问题。
一句话点评:巨头的竞争焦点已从“谁的模型大”转向“谁能更好地吃下企业级市场”。
趋势总结
1. 视频平民化:Seedance 2.0 的开放意味着高质量视频生成正在成为像云计算一样的基础设施。
2. Agent 实体化:MiniMax 的更新证明,AI 正在从“回答问题”转向“执行任务”,开始接管具体的图形界面操作。
3. 战场企业化:OpenAI 的动向表明,C 端的故事讲完了,B 端的落地能力(尤其是 Agent 平台)将是下一阶段的决胜点。
版权声明:本文整理自公开新闻,仅供行业交流,不构成投资建议。
夜雨聆风