AI 资讯日报 · 2026-06-13

模型发布/更新

MiniMax M3 开源模型发布：1M-token 上下文与 MSA 稀疏注意力 — X：MiniMax MiniMax 发布全新开源模型 M3，约 428B 总参数、23B 激活参数，具备前沿编码、智能体能力、原生图像视频输入、Computer Use 及 1M-token 上下文窗口。核心采用 MSA 稀疏注意力架构，使超长上下文实际可部署。M3 在 vLLM 获 Day-0 支持，已在 NVIDIA 和 AMD 硬件验证，开放 BF16/MXFP8 检查点，支持原生多模态输入、工具调用、推理解析和思考模式控制。权重与技术报告预计约 10 天后发布。来源
Kimi 发布并开源最新代码模型 Kimi-K2.7-Code — X：Kimi.ai 月之暗面发布并开源最新编码模型 Kimi-K2.7-Code，相比 K2.6 在 Kimi Code Bench v2 上提升 21.8%，Program Bench 提升 11%，MLS Bench Lite 提升 31.5%。核心改进是解决编码模型"过度思考"问题，推理 token 使用量降低 30%，长时编码任务的指令遵循和端到端成功率均提升。6x 高速模式即将推出，即日起可通过 Kimi API 和 Kimi Code 使用。来源
Google 发布 Gemini-SQL2：Gemini 3.1 Pro Text-to-SQL 在 BIRD 单模型排行榜上取得 80.04% 执行准确率 — MarkTechPost Google Research 发布 Gemini-SQL2，基于 Gemini 3.1 Pro 驱动的文本转 SQL 能力，在 BIRD 单模型排行榜上达到 80.04% 的执行准确率，达到新 SOTA。来源

产品发布/更新

字节豆包上线"任务模式"：支持定时执行与文件生成，"思考模式"升级为"专家模式" — IT之家 6月12日，字节跳动旗下 AI 应用豆包大范围上线"任务模式"，支持定时执行、零代码网页生成、一键 PPT 生成、数据可视化分析等全链路 Agent 执行。原"思考模式"升级为"专家模式"，调用豆包大模型 2.0 Pro 版本，强化深度推理能力。App 顶部模式切换改为"快速、专家、任务"。基础功能免费，高阶服务付费，专业版三档：标准版 68 元/月，加强版 200 元/月，专业版 500 元/月。来源
苹果 iOS 27 健康 App 大改：卡片布局、营养识别、围绝经期追踪 — IT之家苹果在 iOS 27 中优化健康 App，新增视觉智能营养识别，用户通过相机拍摄食物可获取加工程度、蛋白质、含糖量等信息及营养价值评级。经期追踪扩展支持围绝经期。Fitness+ 新增围绝经期和绝经期课程。GymKit 扩展至 iPhone，无需 Apple Watch 即可与健身设备配对同步数据。来源
olmo-eval：面向模型开发循环的评估工作台 — Hugging Face Blog olmo-eval 是基于 OLMES 标准构建的评估工作台，专为 LLM 持续开发中的反复评测场景设计。支持 agentic 和多轮评测作为一等用例，采用模块化架构，模型、工具、容器环境均可独立替换。与 Harbor 侧重发布不同，olmo-eval 聚焦开发阶段快速迭代。来源
OpenRouter 推出子智能体 Subagent 工具 — X：OpenRouter OpenRouter 发布新的服务器工具 Subagent，大模型在生成过程中可将聚焦的子任务委派给更小、更便宜、更快的模型执行，子智能体可以使用 OpenRouter 上的任何模型。来源
Gemini 3.5 Live Translate 近实时语音翻译发布 — X：Google AI for Developers 通过 Gemini Live API 中的 Gemini 3.5 Live Translate，开发者可为应用添加近实时语音翻译，支持连续语音到语音流和同步转录文本，让用户能以母语收听全球广播节目。来源
Telegram 重大更新：机器人支持富文本与 AI 群管理 — X：小互 Telegram 发布重大更新，机器人现支持富文本消息，包括表格、清单、嵌套引用块、行内插图、图片轮播、可折叠段落、脚注、数学公式等。单条消息最多 32768 字符。更新还引入 AI 协助管理群聊功能。来源
OpenAI 新文档智能体上线，导航更直观 — X：Greg Brockman OpenAI 在开发者文档网站上线了新的文档智能体，可帮助查找产品相关信息并直接跳转到对应文档，让交互更加直观。来源
苹果 iOS 27 版照片引入三项 AI 功能：空间重构、扩图、清理 — IT之家 iOS 27 版照片应用引入空间重构（拍摄后调整透视角度）、扩图（画面向外扩展最多 25%）、清理（移除更复杂的干扰物）三项 AI 功能，让普通用户获得专业级修图能力。来源
MiniMax M3 上线 Together AI，推理提速 125% — X：MiniMax MiniMax-M3 开源模型登陆 Together AI，推理优化带来高达 125% 的吞吐量提升。华为云也基于昇腾算力为 M3 提供 Tokens 支持，完成开源首发适配。来源

行业动态

美国政府指令 Anthropic 暂停访问 Fable 5 和 Mythos 5 — Anthropic 官方声明美国政府以国家安全为由，指令 Anthropic 暂停所有外国国民（含海外员工）对 Fable 5 和 Mythos 5 的访问。Anthropic 当日收到指令后立即向所有客户禁用这两个模型，其他模型不受影响。政府称发现一种越狱 Fable 5 的方法；Anthropic 审核认为该技术仅能识别少量已知微小漏洞，且其他公开模型（如 GPT-5.5）也能做到，坚持认为此次越狱不具普遍性，正与政府合作争取尽快恢复访问。此事件导致 Intelligence Frontier 图表首次出现倒退。来源
美国商务部叫停 Anthropic 最新模型 — Gary Marcus 在长达两年的 AI 监管不足之后，美国政府突然采取极端措施——美国商务部实质上关闭了 Anthropic 的最新模型。这一"核选项"式的决定标志着监管态度的急剧转变。来源
OpenAI 遭多州总检察长联合调查 — Bloomberg OpenAI 正被一个由多州总检察长组成的联盟调查，该联盟已向 OpenAI 索取涵盖广告业务、用户留存策略、消费者数据处理方式，以及未成年人保护政策、深度学习模型开发与公司管理制度等文件。此前佛罗里达州已起诉 OpenAI，指控 ChatGPT 在安全问题上误导宣传。来源
网传阿里合伙人周靖人拟离职，刚出任阿里首席科学家 6 天 — IT之家网传阿里合伙人周靖人拟离职，上周已提交离职申请。6 月 8 日，阿里刚宣布周靖人出任首席科学家并牵头成立阿里 AI 未来研究院，同时合并通义大模型事业部和未来生活实验室。周靖人是 Qwen 系列模型的关键人物，已在阿里工作十年。来源
Mistral AI 洽谈 200 亿欧元估值 D 轮融资 — IT之家欧洲 AI 初创 Mistral AI 正就 D 轮融资进行早期交涉，目标估值约 200 亿欧元，筹集约 30 亿欧元。该公司 2025 年 9 月 C 轮融资以 100 亿欧元投前估值筹集 17 亿欧元，ASML 领投。Mistral 已与空客、宝马等欧洲企业合作。来源
Meta AI 部门被工程师称为"摧残灵魂的集中营"，员工濒临反抗 — TechCrunch Meta 一个成立仅数月的 AI 部门（拥有 6500 名员工）正面临严重士气危机。一份新报告援引内部工程师的说法，将该部门描述为"摧残灵魂的集中营"，暗示员工已接近集体反抗的临界点。来源
谷歌起诉中国网络犯罪团伙 Outsider Enterprise：利用 AI 诈骗数十万受害者 — TechCrunch 谷歌起诉名为"Outsider Enterprise"的中国网络犯罪团伙，指控其利用 AI 技术实施诈骗，受害者达数十万人。该团伙在两周内发送了约 250 万条诈骗短信。来源
SpaceX 上市，马斯克成全球首位万亿美元富豪；华为发布 HarmonyOS 7 — IT之家 SpaceX 以每股 135 美元 IPO 募资 750 亿美元，开盘涨 11.11%。华为发布 HarmonyOS 7，进入 Agent 时代，小艺升级为 Agentic 自演进架构；开源 openPangu 2.0。网传 SpaceX 拟以市值 2.5% 收购 Cursor AI。来源

论文研究

《从 AGI 到 ASI》——Google DeepMind 论文 — X：Rohan Paul Google DeepMind 新论文提出从通用人工智能到超级智能的四条路径：持续扩展、算法范式革新、递归自我改进、多智能体集体智能。扩展可能遇到数据、算力、能源瓶颈；递归改进最不确定；多智能体路径最易被低估。ASI 可能不是单次跃迁，而是 AI 辅助创造更好 AI 的加速链。来源
Nature Medicine 研究：通用大语言模型在临床任务上已超越专用医疗 AI — X：Rohan Paul 《自然·医学》一项研究发现，通用大语言模型在经医生评审的临床任务上已超越专用医疗 AI 产品。在来自真实临床场景的 100 个脱敏医生问题中，盲审医生更偏好前沿模型（GPT-5.2、Gemini 3.1 Pro、Claude Opus 4.6），尤其在其回答的完整性和清晰度方面。来源

技巧与观点

Oran Ge 开源《人味儿写作心法.skill》解决 AI 写作缺人味 — X：Oran Ge Oran Ge 让 Claude Fable 5 打磨文案三遍，发现改稿越来越讲究却缺"人味儿"。他与 AI 讨论后得出结论：人写的文字背后有"存在感"——作者在具体位置付出过具体代价，而 AI 无法复现。为此他制作了《人味儿写作心法.skill》，专用于自写文章或口述后让 AI 改稿的场景，已开源免费发布在 GitHub。来源
Anthropic 首次公众调查：近半美国人盼 AI 治愈疾病，超六成担忧失业 — Anthropic 官方 Anthropic 对近 5.2 万美国人调查显示：48% 将治愈癌症等疾病列为首要期望，36% 希望 AI 帮助残障人士。64% 担忧 AI 导致失业，56% 担忧认知依赖，52% 担忧信息误导。超 70% 支持政府监管，仅 15% 信任 AI 公司决策。多数议题上观点不因党派或地域严重分裂。来源
小互开源公众号自动排版技能组合 — X：小互小互升级了公众号排版技能组合，实现一句话完成排版、封面生成并一键发送到公众号草稿箱。该工具已开源，提供 20 种主题颜色可选，可自动分析内容进行排版，支持非 Markdown 文件。用户只需在 Claude Code、Codex 或 OpenClaw 中提供文章链接或文档位置即可。来源
qiaomu-ai-prd：面向 AI 的 PRD 生成 Prompt — X：Vista 推文提出 AI Agent 开发中人类与 AI 对 PRD 的需求不同，为此发布了一个专门服务于 AI 的 PRD 文档生成 Prompt。开发者先使用该 Prompt 生成文档，再交给 AI 开发，可显著提升功能完整度和丰富性。安装指令为：npx skills add joeseesun/qiaomu-ai-prd。来源
OpenAI 推出面向新时代工作的新 Academy 课程 — OpenAI 官网 OpenAI 发布三门 Academy 课程，帮助用户掌握实用 AI 技能、创建可重复工作流，并在日常工作中应用 AI 智能体。来源
Hermes Agent 在 OpenRouter 上的使用指南：设置、模型与路由 — OpenRouter Hermes Agent 已通过 OpenRouter 处理超过 17 万亿 tokens。使用指南包括设置流程、选择支持 64K 上下文窗口的模型，以及调整路由策略以兼顾成本与可靠性。来源
如何在 OpenRouter 上获得最低成本的 LLM 推理 — OpenRouter 在 OpenRouter 上追加 :floor 可获取最便宜提供商，通过 max_price 设定花费上限，并可免费使用 20 多个零成本模型。来源
开发者开源一键开启国行 Mac Siri AI 工具 — X：Berry Xia 开发者 SkyBlue997 在 GitHub 开源 enableMacosAI 工具，通过修改系统地区伪装美区来开启国行 Mac 的 Siri AI，证明该 AI 能力早已内置，仅被等候名单屏蔽。来源
Cursor 团队构建始终运行的 Agent 舰队系统 — X：邵猛 Cursor 团队为训练 Composer 模型构建了始终运行的 Agent 舰队系统。主 Agent（Fleet Manager）通过 SSH 连接数百台子 Agent 机器，利用本地工具和磁盘文件实现状态共享与协调。核心是使用 Cursor 自身产品，通过 inbox 文件与 Skills 实现大规模 Agent 协同与自我管理。来源
NVIDIA 发布首个智能体 AI 基准 AgentPerf：GB300 NVL72 每兆瓦处理智能体数是 H200 的 20 倍 — X：Rohan Paul NVIDIA 首次在 AgentPerf 中评测智能体 AI，该基准测试每兆瓦可同时运行且保持响应性的编码智能体数量。GB300 NVL72 在最低服务层每兆瓦达 61.4K 并发智能体，H200 仅为 2.6K，20 倍提升。