模型发布/更新
MiniMax M3 开源模型发布:1M-token 上下文与 MSA 稀疏注意力 — X:MiniMax MiniMax 发布全新开源模型 M3,约 428B 总参数、23B 激活参数,具备前沿编码、智能体能力、原生图像视频输入、Computer Use 及 1M-token 上下文窗口。核心采用 MSA 稀疏注意力架构,使超长上下文实际可部署。M3 在 vLLM 获 Day-0 支持,已在 NVIDIA 和 AMD 硬件验证,开放 BF16/MXFP8 检查点,支持原生多模态输入、工具调用、推理解析和思考模式控制。权重与技术报告预计约 10 天后发布。 来源
Kimi 发布并开源最新代码模型 Kimi-K2.7-Code — X:Kimi.ai 月之暗面发布并开源最新编码模型 Kimi-K2.7-Code,相比 K2.6 在 Kimi Code Bench v2 上提升 21.8%,Program Bench 提升 11%,MLS Bench Lite 提升 31.5%。核心改进是解决编码模型"过度思考"问题,推理 token 使用量降低 30%,长时编码任务的指令遵循和端到端成功率均提升。6x 高速模式即将推出,即日起可通过 Kimi API 和 Kimi Code 使用。 来源
Google 发布 Gemini-SQL2:Gemini 3.1 Pro Text-to-SQL 在 BIRD 单模型排行榜上取得 80.04% 执行准确率 — MarkTechPost Google Research 发布 Gemini-SQL2,基于 Gemini 3.1 Pro 驱动的文本转 SQL 能力,在 BIRD 单模型排行榜上达到 80.04% 的执行准确率,达到新 SOTA。 来源
产品发布/更新
字节豆包上线"任务模式":支持定时执行与文件生成,"思考模式"升级为"专家模式" — IT之家 6月12日,字节跳动旗下 AI 应用豆包大范围上线"任务模式",支持定时执行、零代码网页生成、一键 PPT 生成、数据可视化分析等全链路 Agent 执行。原"思考模式"升级为"专家模式",调用豆包大模型 2.0 Pro 版本,强化深度推理能力。App 顶部模式切换改为"快速、专家、任务"。基础功能免费,高阶服务付费,专业版三档:标准版 68 元/月,加强版 200 元/月,专业版 500 元/月。 来源
苹果 iOS 27 健康 App 大改:卡片布局、营养识别、围绝经期追踪 — IT之家 苹果在 iOS 27 中优化健康 App,新增视觉智能营养识别,用户通过相机拍摄食物可获取加工程度、蛋白质、含糖量等信息及营养价值评级。经期追踪扩展支持围绝经期。Fitness+ 新增围绝经期和绝经期课程。GymKit 扩展至 iPhone,无需 Apple Watch 即可与健身设备配对同步数据。 来源
olmo-eval:面向模型开发循环的评估工作台 — Hugging Face Blog olmo-eval 是基于 OLMES 标准构建的评估工作台,专为 LLM 持续开发中的反复评测场景设计。支持 agentic 和多轮评测作为一等用例,采用模块化架构,模型、工具、容器环境均可独立替换。与 Harbor 侧重发布不同,olmo-eval 聚焦开发阶段快速迭代。 来源
OpenRouter 推出子智能体 Subagent 工具 — X:OpenRouter OpenRouter 发布新的服务器工具 Subagent,大模型在生成过程中可将聚焦的子任务委派给更小、更便宜、更快的模型执行,子智能体可以使用 OpenRouter 上的任何模型。 来源
Gemini 3.5 Live Translate 近实时语音翻译发布 — X:Google AI for Developers 通过 Gemini Live API 中的 Gemini 3.5 Live Translate,开发者可为应用添加近实时语音翻译,支持连续语音到语音流和同步转录文本,让用户能以母语收听全球广播节目。 来源
Telegram 重大更新:机器人支持富文本与 AI 群管理 — X:小互 Telegram 发布重大更新,机器人现支持富文本消息,包括表格、清单、嵌套引用块、行内插图、图片轮播、可折叠段落、脚注、数学公式等。单条消息最多 32768 字符。更新还引入 AI 协助管理群聊功能。 来源
OpenAI 新文档智能体上线,导航更直观 — X:Greg Brockman OpenAI 在开发者文档网站上线了新的文档智能体,可帮助查找产品相关信息并直接跳转到对应文档,让交互更加直观。 来源
苹果 iOS 27 版照片引入三项 AI 功能:空间重构、扩图、清理 — IT之家 iOS 27 版照片应用引入空间重构(拍摄后调整透视角度)、扩图(画面向外扩展最多 25%)、清理(移除更复杂的干扰物)三项 AI 功能,让普通用户获得专业级修图能力。 来源
MiniMax M3 上线 Together AI,推理提速 125% — X:MiniMax MiniMax-M3 开源模型登陆 Together AI,推理优化带来高达 125% 的吞吐量提升。华为云也基于昇腾算力为 M3 提供 Tokens 支持,完成开源首发适配。 来源
行业动态
美国政府指令 Anthropic 暂停访问 Fable 5 和 Mythos 5 — Anthropic 官方声明 美国政府以国家安全为由,指令 Anthropic 暂停所有外国国民(含海外员工)对 Fable 5 和 Mythos 5 的访问。Anthropic 当日收到指令后立即向所有客户禁用这两个模型,其他模型不受影响。政府称发现一种越狱 Fable 5 的方法;Anthropic 审核认为该技术仅能识别少量已知微小漏洞,且其他公开模型(如 GPT-5.5)也能做到,坚持认为此次越狱不具普遍性,正与政府合作争取尽快恢复访问。此事件导致 Intelligence Frontier 图表首次出现倒退。 来源
美国商务部叫停 Anthropic 最新模型 — Gary Marcus 在长达两年的 AI 监管不足之后,美国政府突然采取极端措施——美国商务部实质上关闭了 Anthropic 的最新模型。这一"核选项"式的决定标志着监管态度的急剧转变。 来源
OpenAI 遭多州总检察长联合调查 — Bloomberg OpenAI 正被一个由多州总检察长组成的联盟调查,该联盟已向 OpenAI 索取涵盖广告业务、用户留存策略、消费者数据处理方式,以及未成年人保护政策、深度学习模型开发与公司管理制度等文件。此前佛罗里达州已起诉 OpenAI,指控 ChatGPT 在安全问题上误导宣传。 来源
网传阿里合伙人周靖人拟离职,刚出任阿里首席科学家 6 天 — IT之家 网传阿里合伙人周靖人拟离职,上周已提交离职申请。6 月 8 日,阿里刚宣布周靖人出任首席科学家并牵头成立阿里 AI 未来研究院,同时合并通义大模型事业部和未来生活实验室。周靖人是 Qwen 系列模型的关键人物,已在阿里工作十年。 来源
Mistral AI 洽谈 200 亿欧元估值 D 轮融资 — IT之家 欧洲 AI 初创 Mistral AI 正就 D 轮融资进行早期交涉,目标估值约 200 亿欧元,筹集约 30 亿欧元。该公司 2025 年 9 月 C 轮融资以 100 亿欧元投前估值筹集 17 亿欧元,ASML 领投。Mistral 已与空客、宝马等欧洲企业合作。 来源
Meta AI 部门被工程师称为"摧残灵魂的集中营",员工濒临反抗 — TechCrunch Meta 一个成立仅数月的 AI 部门(拥有 6500 名员工)正面临严重士气危机。一份新报告援引内部工程师的说法,将该部门描述为"摧残灵魂的集中营",暗示员工已接近集体反抗的临界点。 来源
谷歌起诉中国网络犯罪团伙 Outsider Enterprise:利用 AI 诈骗数十万受害者 — TechCrunch 谷歌起诉名为"Outsider Enterprise"的中国网络犯罪团伙,指控其利用 AI 技术实施诈骗,受害者达数十万人。该团伙在两周内发送了约 250 万条诈骗短信。 来源
SpaceX 上市,马斯克成全球首位万亿美元富豪;华为发布 HarmonyOS 7 — IT之家 SpaceX 以每股 135 美元 IPO 募资 750 亿美元,开盘涨 11.11%。华为发布 HarmonyOS 7,进入 Agent 时代,小艺升级为 Agentic 自演进架构;开源 openPangu 2.0。网传 SpaceX 拟以市值 2.5% 收购 Cursor AI。 来源
论文研究
《从 AGI 到 ASI》——Google DeepMind 论文 — X:Rohan Paul Google DeepMind 新论文提出从通用人工智能到超级智能的四条路径:持续扩展、算法范式革新、递归自我改进、多智能体集体智能。扩展可能遇到数据、算力、能源瓶颈;递归改进最不确定;多智能体路径最易被低估。ASI 可能不是单次跃迁,而是 AI 辅助创造更好 AI 的加速链。 来源
Nature Medicine 研究:通用大语言模型在临床任务上已超越专用医疗 AI — X:Rohan Paul 《自然·医学》一项研究发现,通用大语言模型在经医生评审的临床任务上已超越专用医疗 AI 产品。在来自真实临床场景的 100 个脱敏医生问题中,盲审医生更偏好前沿模型(GPT-5.2、Gemini 3.1 Pro、Claude Opus 4.6),尤其在其回答的完整性和清晰度方面。 来源
技巧与观点
Oran Ge 开源《人味儿写作心法.skill》解决 AI 写作缺人味 — X:Oran Ge Oran Ge 让 Claude Fable 5 打磨文案三遍,发现改稿越来越讲究却缺"人味儿"。他与 AI 讨论后得出结论:人写的文字背后有"存在感"——作者在具体位置付出过具体代价,而 AI 无法复现。为此他制作了《人味儿写作心法.skill》,专用于自写文章或口述后让 AI 改稿的场景,已开源免费发布在 GitHub。 来源
Anthropic 首次公众调查:近半美国人盼 AI 治愈疾病,超六成担忧失业 — Anthropic 官方 Anthropic 对近 5.2 万美国人调查显示:48% 将治愈癌症等疾病列为首要期望,36% 希望 AI 帮助残障人士。64% 担忧 AI 导致失业,56% 担忧认知依赖,52% 担忧信息误导。超 70% 支持政府监管,仅 15% 信任 AI 公司决策。多数议题上观点不因党派或地域严重分裂。 来源
小互开源公众号自动排版技能组合 — X:小互 小互升级了公众号排版技能组合,实现一句话完成排版、封面生成并一键发送到公众号草稿箱。该工具已开源,提供 20 种主题颜色可选,可自动分析内容进行排版,支持非 Markdown 文件。用户只需在 Claude Code、Codex 或 OpenClaw 中提供文章链接或文档位置即可。 来源
qiaomu-ai-prd:面向 AI 的 PRD 生成 Prompt — X:Vista 推文提出 AI Agent 开发中人类与 AI 对 PRD 的需求不同,为此发布了一个专门服务于 AI 的 PRD 文档生成 Prompt。开发者先使用该 Prompt 生成文档,再交给 AI 开发,可显著提升功能完整度和丰富性。安装指令为:
npx skills add joeseesun/qiaomu-ai-prd。 来源OpenAI 推出面向新时代工作的新 Academy 课程 — OpenAI 官网 OpenAI 发布三门 Academy 课程,帮助用户掌握实用 AI 技能、创建可重复工作流,并在日常工作中应用 AI 智能体。 来源
Hermes Agent 在 OpenRouter 上的使用指南:设置、模型与路由 — OpenRouter Hermes Agent 已通过 OpenRouter 处理超过 17 万亿 tokens。使用指南包括设置流程、选择支持 64K 上下文窗口的模型,以及调整路由策略以兼顾成本与可靠性。 来源
如何在 OpenRouter 上获得最低成本的 LLM 推理 — OpenRouter 在 OpenRouter 上追加
:floor可获取最便宜提供商,通过max_price设定花费上限,并可免费使用 20 多个零成本模型。 来源开发者开源一键开启国行 Mac Siri AI 工具 — X:Berry Xia 开发者 SkyBlue997 在 GitHub 开源 enableMacosAI 工具,通过修改系统地区伪装美区来开启国行 Mac 的 Siri AI,证明该 AI 能力早已内置,仅被等候名单屏蔽。 来源
Cursor 团队构建始终运行的 Agent 舰队系统 — X:邵猛 Cursor 团队为训练 Composer 模型构建了始终运行的 Agent 舰队系统。主 Agent(Fleet Manager)通过 SSH 连接数百台子 Agent 机器,利用本地工具和磁盘文件实现状态共享与协调。核心是使用 Cursor 自身产品,通过 inbox 文件与 Skills 实现大规模 Agent 协同与自我管理。 来源
NVIDIA 发布首个智能体 AI 基准 AgentPerf:GB300 NVL72 每兆瓦处理智能体数是 H200 的 20 倍 — X:Rohan Paul NVIDIA 首次在 AgentPerf 中评测智能体 AI,该基准测试每兆瓦可同时运行且保持响应性的编码智能体数量。GB300 NVL72 在最低服务层每兆瓦达 61.4K 并发智能体,H200 仅为 2.6K,20 倍提升。
夜雨聆风