25-260410 AI 科技日报 (阿里 HappyHorse 视频生成登顶,Claude Code 上线实时监控)

25-260410 AI 科技日报 (阿里 HappyHorse 视频生成登顶，Claude Code 上线实时监控)

共收录 38 条资讯

今日必看

1. 阿里 HappyHorse 视频生成登顶排行榜 — 文转视频、图转视频四种模式，无音频榜单第一 → 详情
2. Claude Code 上线 Monitor 实时监控 — 进程输出秒级推送，报错立刻修 → 详情
3. Meta 月烧 60 万亿 tokens — 人均 7.5 亿，AI 运营成本的真实面貌 → 详情
4. Agent 靠"外挂"才能干活 — 参数堆砌时代结束，记忆库、技能库、协议层才是正事 → 详情
5. 字节全双工语音模型 Seeduplex — 同时收发语音，实时交互体验上了一个台阶 → 详情

产品发布

今天产品端最热闹——阿里视频生成登顶、Claude Code 拿出实时监控、字节在语音和视频两条线同时发力。

阿里巴巴发布视频生成模型 HappyHorse-1.0

阿里巴巴-ATH 推出了最新的视频生成模型 HappyHorse-1.0，在 Artificial Analysis 视频竞技场的多个排行榜中杀出重围。不含音频排行榜妥妥第一，含音频的榜单里和字节跳动的 Dreamina Seedance 2.0 打成平手。支持文字转视频、图像转视频等四种花样，性能表现真心亮眼。

💡 视频生成赛道卷到这个程度，接下来的胜负手大概率在音频同步和可控性上。

🔗 @ArtificialAnlys · 视频生成阿里巴巴

Waypoint-1.5 发布，实时扩散世界模型更新

Overworld AI 推出了 Waypoint-1.5，这是它们实时扩散世界模型的升级版。设计得很贴心——能在普通消费级硬件上跑起来，代表了世界模型从实验室走向实战的新进展。对游戏、仿真和虚拟环境等领域都有看头。

🔗 @arankomatsuzaki · 世界模型扩散模型实时生成

Claude Code 新增 Monitor 工具，真正的实时反馈来了

Claude Code 推出了 Monitor 后台监控功能，能实时捕捉外部进程的 stdout 输出。不是轮询那一套，而是真正的实时推送——进程有输出立刻流式传入对话，Claude 能秒速响应和修复。比如跑测试脚本时，看到报错立刻修，省了等待和重复问询的麻烦，还能省 token。

💡 这个功能让 Claude Code 从"问答式助手"变成了"结对编程搭档"，体验差距很大。

🔗 @aigclink · Claude CodeMonitorAgent

Seedance 2.0 文本生成 VFX，几分钟秒出工作室级画质

Seedance 2.0 能把价值 6 万刀、需要数周工作的 VFX 镜头，压成一句文本提示就能几分钟搞定。现在全球上线（美国也包括），早期用户最高七折优惠。这玩意儿直接动摇了传统 VFX 的时间和成本。

🔗 @oggii_0 · VFX视频制作Seedance

Nowledge Mem 本地优先知识库，一次买断终身用

Nowledge Mem 主打隐私和数据自主——本地优先存储、非二进制导出、终身 license、无用户系统。通过 Cloudflare Tunnel 提供远程访问，让用户对自己的知识和上下文完全掌控。现在是内测折扣价，早鸟们有福了。

🔗 @wey_gu · 知识库本地存储隐私安全

GLM-5.1 模型接入 Droid 平台，开发者直接用

智谱清言的 GLM-5.1 已经在 Droid 平台上线了，开发者可以直接拿来用。

🔗 @EnoReyes · GLM智谱Droid

AI-Trader：Agent 发布交易信号的开源市集

AI-Trader 是一个有意思的开源市集，AI agents 可以发布交易信号、开展交易策略辩论。这是 Agent 经济和多 Agent 协作在金融领域的实践试验。

🔗 @hasantoxr · AI Agent交易多Agent

Claude Code 企业版本优化提及速度，3 倍性能提升

Anthropic 团队分享了在大型企业代码库中优化 @-mention 提及功能的经验，速度硬是翻了 3 倍。这对大规模代码协作和 AI 辅助编码的效率提升很有实际意义。

🔗 @bcherny · Claude Code企业应用性能优化

OpenCode 支持 GPT 和 Claude Opus 快速版本

OpenCode 编码助手平台现在支持 GPT 和 Claude Opus 的快速版本，编码效率蹭蹭往上涨。不过用 Opus 得掂量掂量成本。

🔗 @thdxr · OpenCode编码助手模型集成

Claude 推出企业级托管 Agent 服务

Anthropic 的 Claude 推出了企业级托管 Agent 服务，允许企业直接把 AI Agent 部署到生产环境。这标志着大模型应用从实验室阶段向真实商业场景的转变，企业可以通过托管服务降低部署成本和复杂度。

🔗 ai-bot.cn · ClaudeAgent企业应用

阿里通义开源全模态 RAG 框架 VimRAG

阿里通义开源了 VimRAG 框架，这是一个全模态知识库 RAG（检索增强生成）解决方案。支持跨模态的知识检索和生成，让开发者在构建企业级知识库时有了更灵活的选择。

🔗 ai-bot.cn · RAG多模态知识库

字节跳动推出全双工语音大模型 Seeduplex

字节跳动发布了原生全双工语音大模型 Seeduplex，支持同时发送和接收语音，让语音交互更自然流畅。对于语音助手、客服等实时互动场景来说是个大杀器。

💡 全双工是语音交互的关键门槛——之前的模型都是"你说完我再说"，Seeduplex 终于让机器学会了"插嘴"。

🔗 ai-bot.cn · 语音模型全双工语音交互

Meta 推出原生多模态大模型 Muse Spark

Meta 发布了 Muse Spark 多模态大模型，原生支持多种模态的输入和理解。社区已经开始挖掘各种实战应用场景，这是 Meta 在生成 AI 领域的重要产品布局。

🔗 ai-bot.cn · 多模态模型Meta

腾讯推出浏览器 AI 助手 QBotClaw

腾讯推出了国内首个浏览器 AI 助手 QBotClaw，具备网页理解和交互能力。这类工具让 AI 能直接在浏览器里执行指令，让它在日常网络操作中变得更好用。

🔗 ai-bot.cn · 浏览器AI 助手Agent

研究论文

今天值得注意的几篇：Agent 评估方法被质疑、FP4 推理瓶颈待突破、参数堆砌时代终结的综述。

微软论文：智能体基准测试的隐藏问题

微软的最新论文指出了一个尴尬的事实——所有智能体基准测试都存在同一个隐藏问题：怎么判断智能体是否真正成功？这涉及到评估方法的科学性和可靠性。这项研究对 AI 智能体的发展方向和评估方式提出了重要质疑，值得深思。

🔗 @omarsar0 · 智能体基准测试评估方法

Sakana AI：神经进化方法论，AI 应该被"育养"而非"训练"

Sakana AI 研究员 Sebastian Risi 在播客中讨论了神经进化（Neuroevolution）方法，主张 AI 应该被"育养"而不是"训练"。用进化手法构建神经网络，涉及持续学习和人工生命研究，代表了 AI 训练范式的新思路。这个视角挺有意思的。

🔗 @SakanaAILabs · 神经进化持续学习训练方法

4 位精度 Attention 计算成为 FP4 推理瓶颈

虽然 FP4 硬件已经到位，但 4 位精度 Attention 计算仍然制约了模型质量，阻碍了真正的端到端 FP4 推理部署。这是一个需要突破的技术难点，才能实现极低精度推理的实际应用。

🔗 @jeremyphoward · 量化推理FP4Attention

DMax：分布式 LLM 的并行解码加速方案

DMax 论文提出了针对分布式 LLM 的激进并行解码方法，目标是加速推理速度。对于提升大规模 AI 服务的响应延迟和吞吐量有实际价值。

🔗 @_akhaliq · 并行解码推理加速分布式

单细胞基础模型的自监督训练突破

新的排序型自监督训练目标被应用到单细胞基础模型中，仅通过 mRNA 表达排序就能实现高效预测。这对生命科学领域的机器学习应用以及生物学的深层理解和控制具有重要意义。

🔗 @teortaxesTex · 生命科学自监督学习基础模型

大模型参数堆砌时代已过，Agent 靠"外挂"才能干活

AI 的玩法从"靠体重解决问题"转向了"加外挂"。这篇论文综述指出，单纯加参数已经解决不了 Agent 面临的核心问题：选择性遗忘、长期记忆、工具调用、多 Agent 协作。所以业界现在都在搭建记忆库、技能库、协议层、执行沙箱——Auto-GPT、MemGPT、MCP、Claude Code 等工具的火爆，正是这个转变的实际写照。

💡 这篇综述解释了为什么最近半年 Agent 框架层出不穷——因为光靠模型本身确实不够用了。

🔗 @lijigang · AgentScaling law外部系统

3D 点云神经网络，分类和分割一把搞定

发布了一个用于 3D 点云数据分类和分割的神经网络模型，适用于 3D 视觉、点云处理等场景。

🔗 @tom_doerr · 神经网络3D点云

虚幻引擎实时渲染高斯点播，3D 创意的新玩法

在虚幻引擎上实现了实时、大规模的高斯点播（Gaussian Splatting）渲染技术，可用于游戏开发、实时 3D 内容创作等场景，打开了 3D 内容生产的新思路。

🔗 @tom_doerr · 高斯点播Unreal Engine3D

物理学史的另一种看法：长期程序合成任务

Francois Chollet 提出了一个有意思的角度：把物理学发展史看作是一个长期的程序合成任务。开普勒和牛顿等人在搜索可能的符号模型空间，找最简洁、最符合观测数据的方程。这对理解 AI 如何发现规律很有启发意义。

🔗 @fchollet · 程序合成符号回归物理模型

Stanford 发布通用验证框架 LLM-as-a-Verifier

Stanford AI Lab 发布了 LLM-as-a-Verifier 框架，这是一个通用的验证框架，在 Terminal-Bench 2 基准上达到了 86.4% 的业界领先成绩。通过使用 LLM 进行结果验证，提升了 AI 系统的可靠性。

🔗 StanfordAILab · 验证框架LLM基准测试

JEPA 世界模型+分层规划，机器人长期规划的新希望

研究表明 JEPA 世界模型与分层规划结合是机器人长期任务规划的重大进展。这解决了机器人在长时间视野下容易失败的经典问题，为具身 AI 的实际应用铺平了道路。

🔗 ylecun · 世界模型机器人规划

大内存模型架构设计引关注

研究者开发了全新的大内存模型（Large Memory Models）架构，专门为需要长上下文的任务设计。这类架构在处理长文本、多轮对话等场景时具有显著优势。

🔗 svpino · 内存模型长上下文架构设计

工具推荐

今天的工具偏实用：量化技术参考手册、反反爬框架、高精度 PDF 解析器。

LLM 量化技术深度解析，从业者的参考手册

技术博客详细阐述了 LLM 量化的核心原理，对于从业者理解模型压缩至关重要。即使在技术圈，对量化的理解也存在不少盲点。这份资源对想要优化模型效率、降低推理成本的开发者很有参考价值。

🔗 @algo_diver · 量化模型优化推理效率

GBrain：Karpathy LLM Wiki 的开源实现版本

基于 Andrej Karpathy 的 LLM 知识库思想，开发者在 OpenClaw 上实现了 GBrain，并扩展添加了完整的 Postgres pgvector 支持。这是一个私人观点版本的 LLM 学习体系。

🔗 @garrytan · LLM知识库pgvector

自适应爬虫框架，反反爬一把搞定

一个支持自适应爬虫的框架，内置反反爬绕过机制。对于需要爬取数据做 AI 训练或数据处理的场景很有用。

🔗 @tom_doerr · 爬虫反反爬数据采集

高精度 PDF 解析器，AI 就绪的数据提取

专门为 AI 应用优化的 PDF 解析工具，能够高精度提取和结构化 PDF 内容，转换成 AI 模型可直接使用的格式。

🔗 @tom_doerr · PDF 解析数据处理AI 工具链

5200+ OpenClaw AI 助手技能库精选合集

整理了一份包含 5200+ 个 OpenClaw AI 助手技能的精选库，涵盖各类常见使用场景，方便开发者快速查阅和复用。

🔗 @tom_doerr · OpenClaw技能库应用库

MiniMax 推出 MMX-CLI 全模态命令行工具

MiniMax 发布了 MMX-CLI 工具，让开发者能一行代码接入全模态模型。该工具简化了 AI Agent 与大模型的交互，已在淘宝闪购等商业场景落地，实现语音搜索等复杂操作。

🔗 aibase.com · AgentCLI 工具全模态

分布式 AI 培训课程上线，首讲开讲

有关分布式 AI 的新讲座系列正式发布，首讲介绍了去中心化 AI 的核心概念。该系列吸引了大量社区关注，反映出业界对分布式 AI 技术的持续热度。

🔗 iamtrask · 分布式去中心化教育

AI 应用开发的中间层秘诀：灵活性提升 10 倍

开发者分享了一个关键经验：在 AI 应用中添加一个中间层可以将灵活性提升 10 倍。这个简单的架构改进让应用更容易适配不同模型，降低了对特定模型的依赖。

🔗 svpino · 架构最佳实践应用开发

行业动态

Meta 的 token 消耗量让人倒吸一口凉气，创业和监管两条线也有新动向。

Meta 月均消耗 60.2 万亿 tokens

根据 The Information 报道，Meta 每月消耗 60.2 万亿 tokens，平均每名员工就要吃掉 7.5 亿 tokens。相比之下，SemiAnalysis 的员工人均月消耗量达 18.6 亿 tokens。这数据反映了不同公司在大模型训练和推理中的巨大差异，也暗示了 token 成本在 AI 运营中有多关键。

💡 人均 7.5 亿 tokens/月——如果你还在纠结 API 费用贵不贵，看看大厂的账单就释然了。

🔗 @dylan522p · token 消耗Meta成本分析

DeepMind 资深研究员创办新公司，探索 AI 新方向

在 DeepMind/Google Brain 工作近 12 年后，Andrew Dai 和团队联合创办了新公司，踏上创业之旅。这代表了 AI 研究人才从大公司向初创企业的流动，反映了 AI 领域创新机制的变化和新方向的探索。

🔗 @jhyuxm · 人才流动创业AI 研究

OpenAI 支持伊利诺州 AI 责任豁免法案

OpenAI 正支持伊利诺州的一项州级 AI 法案，该法案旨在为 AI 实验室在其模型造成严重伤害时提供法律责任豁免。这反映了 AI 公司在监管策略上的主动参与，但也引发了关于 AI 安全问责的讨论。

🔗 @EthanJPerez · 监管责任豁免AI 安全

新兴 AI 创业公司融资过千万，垂直应用成香饽饽

萌友智能的 ropet 产品完成了超千万美元融资。该产品聚焦特定应用场景，显示出投资者对垂直领域 AI 应用的持续看好。

🔗 ai-bot.cn · 融资创业AI 应用

关注我，每天获取 AI 最新资讯。