01 模型发布 / 更新
1.MiniMax M3: 前沿编码、100 万 token 上下文与原生多模态一体模型
MiniMax M3 是一个开源前沿模型,具备先进的编码与 AI 智能体能力。它支持 100 万 token 的超长上下文窗口,并采用名为 MSA (MiniMax Sparse Attention) 的新型稀疏注意力架构;该架构使模型在 100 万 token 上下文下的每 token 计算成本降至前代的 1/20,预填充速度提升 9 倍以上,解码速度提升 15 倍以上。在 SWE-Bench Pro 编码基准上,MiniMax M3 得分 59.0%,超越 GPT-5.5 和 Gemini 3.1 Pro,性能接近 Opus 4.7。该模型可通过 MiniMax Code Token Plan 和 API 服务使用。
2.xAI 发布 Composer 2.5
xAI 的最新编程模型 Composer 2.5 现已在 Grok Build 中可用,用户可通过/models菜单选择使用。这是一款快速、先进的模型,擅长处理长时间运行的任务和复杂指令。该模型面向 SuperGrok 和 X Premium + 用户开放。
3.Qwen3.7-Plus: 多模态智能体智能
Qwen Studio 提供涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具使用及制品生成的全面功能。
4. 使用 NVIDIA Cosmos 3 开发物理 AI 推理、世界与行动模型
NVIDIA Cosmos 3 是一款面向物理 AI 的前沿基础模型。它能够帮助机器人、自动驾驶车辆和智能空间理解真实世界、预测事件发展并生成适应特定环境与任务的行动。该模型融合了物理推理、世界理解与行动生成能力。
5.SenseNova 新模型解决 AI 图表生成难题
大多数 AI 模型在生成图表时存在数值错误 (如负值显示为正)、柱状图位置偏移、元素关系混乱等问题。SenseNova-U1-8B-MOT-Infographic (SenseNova-U1) 专为解决此类图表生成问题而设计,能够生成准确的图表,并支持实时调整设计和布局。项目在 HuggingFace 提供了模型,并在 GitHub 展示了效果案例。
6. 介绍 Mellum2:JetBrains 推出的 12B 混合专家模型
JetBrains 在 Hugging Face 发布博客,介绍其新发布的 Mellum2 模型。该模型采用混合专家架构,参数规模为 12B。
7.Nemotron 3 Ultra 本周即将发布
02 产品发布 / 更新
1.OpenBMB 发布 UltraData 两大开源数据集,登顶 HuggingFace 趋势榜
OpenBMB 联合清华 NLP 与 Modelbest 发布两个开源数据集:Ultra-FineWeb-L3 (预训练合成数据) 包含 600B+ tokens (超 400B 英文、200B + 中文),是迄今最大开源中文预训练合成数据集;UltraData-SFT-2605 (后训练 SFT 数据) 包含 15M + 样本,是中国首个开源且包含思考与非思考标注的大规模 SFT 数据集,覆盖数学、代码、知识和指令遵循。两者均基于 UltraData LO-L4 框架构建,并在 MiniCPM5-1B 训练中完成验证。数据集已在 HuggingFace 免费开放。
2.Auto Router 新增成本质量权衡参数
Auto Router 现在允许你调整其在成本与质量之间的权衡。新增cost_quality_tradeoff参数,范围 0 到 10:设为 0 时,它总是选择最强大的模型,无论价格如何;设为 10 时,最便宜的模型胜出。
3.OpenAI 前沿模型与 Codex 现在可在 AWS 上使用
OpenAI 的前沿模型与 Codex 现已在 AWS 全面可用。企业客户可通过其现有的 AWS 环境、控制与采购流程来使用 OpenAI 的 AI 技术,从而加速从评估到生产部署的过程。
4.Replit 用单个提示构建完整业务
你能用单个提示词免费构建一个真实的业务吗?从今天起,在 Replit 上,答案是肯定的。从一个提示词开始,获得一个网站、移动应用、幻灯片和发布视频。此外,还能解锁使用 @stripe @atlas,@QuickBooks,@mercury & @doolaHQ 运营业务的福利。
5. 腾讯混元发布智能体长期记忆插件 Hy-Memory
腾讯混元正式发布专为 OpenClaw 等长期协作智能体 (Agent) 设计的记忆插件 Hy-Memory。它基于 6 层记忆框架、System1/System2 双系统与三层进化链构建,旨在成为智能体的 “第二大脑”。该插件解决了记忆碎片化问题,实现了显著性能提升:记忆数量减少 70% 以上,单条记忆信息密度提升 45% 以上,在超长上下文场景中 token 消耗降低 35%,记忆更新速度提升 20%。
6.NVIDIA 发布工厂运营蓝图,为工厂提供自主智能管理智能体
NVIDIA 在 GTC Taipei 发布了 NVIDIA 工厂运营蓝图 (FOX),这是一个用于构建自主工厂管理智能体的参考设计。该蓝图基于 NVIDIA Nemoclaw、AI-Q Blueprint 和 NVIDIA Nemotron 开源模型构建,旨在为工厂提供一个统一的决策层,以连接实时机器信号、质量数据和操作警报,实现快速问题解决。蓝图针对 NVIDIA DGX Station 桌面 AI 超级计算机进行了优化。首批采用者包括富士康、和硕、研华和纬创。富士康利用 FOX 和 Nemoclaw 构建了 MoClaw 多智能体系统,预计将根源分析时间缩短 80%,劳动生产率提高 15%,机器故障率降低 10%。
7.ChatGPT 新增长文编辑与保存功能
长文写作需要更多空间。现在你可以在全屏模式下编辑更长的文章,并将其保存到你的资料库中,以便稍后继续。
8.Perplexity 发布 Search as Code 搜索架构
推出 Search as Code,我们为 AI 智能体打造的全新搜索架构。它直接编写 Python 代码调用我们的搜索栈,而非逐个循环调用。现已在 Perplexity Agent API 中提供,并成为 Computer 的默认选项。
03 行业动态
1.Anthropic 保密向 SEC 提交 S-1 草案
Anthropic PBC 今日向美国证券交易委员会提交了 S-1 表格草案,计划进行普通股的首次公开发行。这使其在 SEC 完成审核后拥有上市的选择权。IPO 的具体发行股数和价格尚未确定,将取决于市场条件等因素。公司近期完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资,估值达 9650 亿美元,并发布了 Claude Opus 4.8 模型。
2. 智谱:建议 A 股发行并在科创板上市
智谱计划向中国监管机构申请 A 股并在科创板上市;发行股份占发行后总股本的 2% 至 8%,预计全部为新股;原股东不发售。本次发行募资将全部投资人工智能通用大模型。大模型 Maas 一站式服务平台及补充流动资金。此外,公司拟将英文名称由 “Knowledge Atlas Technology Joint Stock Company Limited” 变更为 “Z.AI Co., Ltd.”。
3.Alphabet 将通过发行股票筹集 800 亿美元用于 AI 支出计划
Alphabet 正在通过发行股票等方式募集 800 亿美金资金,其中包括与 Berkshire Hathaway 的投资协议,以资助其雄心勃勃的 AI 支出计划。
4. 王兴:美团 AI Agent “小美” 与腾讯元宝即将深度合作,用户订单无缝连接
美团 26 年第一季度财报显示营收 910.39 亿元,净利润 68.27 亿元。财报电话会上,CEO 王兴透露其 AI Agent “小美” 将与腾讯元宝深度合作,用户在腾讯元宝提交服务需求,将被无缝连接至美团外卖点位,直达美团 AI 服务端。面向智能体的服务 (ToA) 正变得日益重要,美团已将 AI 助手 “小团” 于 App 核心位置,并拓展商家服务外延。
5. 英伟达和台积电将 AI 引入晶圆厂,推动半导体设计与制造发展
6.OpenAI 在密歇根州启动 Stargate 1GW 数据中心建设
OpenAI 在密歇根州启动了名为 Stargate 的 1GW 数据中心项目。作为 AI 基础设施建设的一部分,该项目旨在扩大人工智能技术的可及性、为当地创造就业机会并支持社区发展。
7.Meta 的 AI 被利用来劫持 Instagram 账号
Meta 的 AI 聊天机器人被发现存在安全漏洞,黑客可以通过请求该 AI 关联一个新的电子邮件地址,从而接管目标用户的 instagram 账号。该漏洞利用了 AI 智能体直接执行账户管理操作的能力。
04 技巧与观点
1. 作者分享使用 Codex App 开发的开源项目合集
作者分享了使用 Codex App 工具开发的一系列开源项目,包括 4 个 Chrome 插件 (快捷提示词、新标签页、AI Summarize (艺术鉴赏与音乐)) 和 5 个 AI Sft 项目 (知识库、阅读助手)。项目基于 GPT-image-2API+Nico 技术,并整合了 Read-fog、Hyperfll 等开源项目。
2. 使用 Claude Opus 4.8 将书籍转化为 AI 技能的教程
本文以《非暴力沟通》为例,提供了一个将书籍转化为可调用 AI 技能 (Skill) 的分步教程。作者使用 Claude Opus4.8 流程包含文本准备、全局上下文、文档结构化 (框架 / 多范式 / 反范式 / 作者声音),能一次性处理完整篇幅。流程的成本:全 100 万字约五百美元。结果:模型复刻作者写作风格,并能生成与原著一致的摘要。作者在生成的技能里标注了整书耗时约 45 分钟、消耗约 30 万 token 成本不到 20 元人民币。
3.Sam Altman 强调 AI 发展应以人为本
Sam Altman 在采访中表示,AI 不应被设计为脱离人类需求的目标,人类必须始终处于 AI 发展的中心。他批判了行业内 AI 大工业的言论,认为人们拥抱 AI 需在每一步保持对未来的控制权,以及如何利用自主主权。他指出,AI 的言论在于不能清晰解释人类如何约束 AI,而是来自在未来的角色及如何在 AI 时代继续拥有充实、有意义的生活。
4. 构建每周千美元预算上限的智能体教程
教程:如何构建一个每周预算上限为 1000 美元的智能体;包含模型拒绝列表与自定义数据保留。使用了提供的可堆叠构造器;启用 ZDR、模型与提供商限制、提示注入防御以及 DLL / 敏感信息检测,分层为静态规则与实时治理限制。
5.Gemini Omni 支持创建个人数字分身
官方:Google (Gemini)分享你自己添加到 Gemini 的视频创作中。以下是如何使用 Gemini Omni 创建一个外观和声音都像你的数字分身。
6.Google AI 展示并行智能体自动整理文件
从杂乱到清爽,观看 @antigravity 中的并行智能体对数百个零散数据进行分类和重命名,消除手动文件整理。
7. 开源与闭源模型在不同的增长曲线上
当模型智能的微小提升能直接转化为实际价值时,闭源模型正沿着陡峭增长曲线发展;开源模型则在特定场景下提供更高的边际智能来创造价值,而开源模型则在其他维度寻找增长点,两者形成差异化的竞争格局。
8. 微软研究聚焦:智能体评估与价值对齐
大规模评估智能体行为,验证代码的优劣于文档,并邀请全球研究人员共同解决价值对齐问题。深入了解最新研究焦点。━━━━━━━━━━━━━━━━━━━━━━
📌 数据来源:AI HOT Daily
夜雨聆风