AI前沿资讯 6月9日:MiMo千tps推理、Siri AI发布

2026-06-09

摘要

本期覆盖 2026-06-08 至 2026-06-09 的 AI 技术动态，数据来源涵盖 GitHub Trending / HN / Reddit / X / Bluesky / Lobsters / arXiv / HF Papers / 知乎。核心主题：last30days-skill 以 3,558 stars/day 登顶 GitHub Trending、小米 MiMo UltraSpeed 在普通 GPU 上突破 1000 tps（HN 500 points）、WWDC 2026 正式发布 Gemini 驱动的 Siri AI、OpenAI Codex+ChatGPT 合并细节曝光。精选 10 条按影响力排序。

last30days-skill — 让 AI Agent 替你搜索 12 个社交平台的 Claude Code 技能

影响力 8.5/10GitHub Trending #1 · 3,558 stars/day · 总星 28,100+ · X 热议

是什么：

last30days-skill 是 mvanhorn 开发的 Claude Code 技能，它让 AI Agent 并行搜索 Reddit、X、YouTube、Hacker News、GitHub、Polymarket、TikTok、Instagram、Threads、Bluesky、Perplexity 等 12 个平台，按真实用户参与度（点赞、转发、评论、投注）打分，合成一份结构化简报。核心理念：搜索"人在说什么"而非"搜索引擎排什么"。Google 聚合编辑的选择，/last30days 搜索真实人群的讨论。项目采用 MIT 许可证，v3 引擎含 1,012 个通过的测试。

怎么用：

# Claude Code 全局安装（一键）
npx skills add mvanhorn/last30days-skill -g

# 使用方式：在 Claude Code 中直接输入
# /last30days Peter Steinberger
# /last30days "Claude Code vs Codex comparison"
# /last30days Rust AI agent frameworks

为什么重要：

现有搜索引擎无法覆盖 Reddit 评论或 X 帖子——ChatGPT 与 Reddit 有协议但不能搜 X，Gemini 有 YouTube 但不能搜 Reddit，Claude 原生一个都没有。last30days-skill 通过用户自己的 API key 和浏览器 session 打通了所有平台，实现跨围墙花园的社交信号聚合。28,100+ stars 和 738 stars/day 的增速说明"替代手动刷帖做研究"是开发者的刚需。社区实测反馈：过去手动开 10 个标签页花 90 分钟做的事，现在一句命令完成。

讨论现场：

来源：https://github.com/mvanhorn/last30days-skill

@itsjasonai："过去每次写内容前我要手动搜 Reddit 和 X——标签页一个接一个、帖子一篇接一篇，那部分要花 90 分钟。这个技能直接消灭了它。"
@yieldhunter95："今天 GitHub Trending 前十里有 5 个是 Claude 工具。第一名：mvanhorn/last30days-skill"
@itswilsoncharles："这一个技能替换了我的整个研究流程。给它一个主题，它抓取 Reddit、X 和全网，不是旧博客——是过去 30 天的真实对话。"

MiMo-V2.5-Pro-UltraSpeed — 全球首个 1000+ tokens/秒的万亿参数模型，运行在普通 GPU 上

影响力 8.3/10HN 500 points · 346 评论 · X 30.5K 浏览 · Decrypt/CNBC 报道

是什么：

小米 MiMo 团队联合 TileRT 系统组发布 MiMo-V2.5-Pro-UltraSpeed 高速推理模式，在 1 万亿参数 MoE 模型（42B 激活参数）上实现超 1000 tokens/秒的解码速度，峰值近 1200 tps。整个方案运行在单节点 8 张标准 GPU 上，不需要 Cerebras 晶圆级集成或 Groq 定制 SRAM 芯片。速度来自三重技术协同——FP4 混合精度量化（仅对 MoE Expert 层量化）、DFlash 块级并行推测解码（一次推测整个 token 块而非逐 token）、TileRT 持久化内核引擎。

怎么用：

# API 试用申请（6月9日-23日，限量审批）
# 访问 https://platform.xiaomimimo.com/ultraspeed 提交申请

# 免费 Chat 体验（限时，每日 10 次排队，每次 30 分钟）
# 访问 https://platform.xiaomimimo.com 直接对话

# 开源模型权重（FP4 量化版，HuggingFace）
# https://huggingface.co/Xiaomi/MiMo-V2.5-Pro-FP4-DFlash

# 标准版 MiMo-V2.5-Pro API 定价
# 输入 $0.435/M tokens | 输出 $0.870/M tokens（约 Claude Opus 的 1/29）

为什么重要：

在 MiMo Coding Bench 上，MiMo-V2.5-Pro 以 57.2 分逼近 Claude Opus 4.6 的 57.2 分（平手），但输出成本仅为 Opus 的 1/29（$0.87 vs $25/M tokens）。UltraSpeed 在此基础上将生成速度提升约 10 倍（从 43 tps 到 1000+ tps），定价仅 3 倍——即 30 倍性价比。速度快到足以支撑实时量化交易信号生成、并行推理路径探索等此前不可能的应用场景。FP4 量化权重已开源到 HuggingFace，TileRT 部分模块也已开源。

讨论现场：

来源：https://mimo.xiaomi.com/blog/mimo-tilert-1000tps

HN 热评："1T MoE model doing 1000+ tps on commodity GPUs. Not Cerebras, not Groq. FP4 + speculative decoding. This is what real inference efficiency looks like." — +XXX points
"3x the price for ~10x the speed on the same frontier-tier model. The economics of closed-source API pricing just got disrupted from an unexpected direction."
社区关注：Limited trial window（仅 2 周），需要申请审批，尚未公布全面开放时间表

Agent-Reach — 给你的 AI Agent 装上"眼睛"，一个 CLI 搜遍全网社交媒体

影响力 8.0/10GitHub Trending #5 · 679 stars/day · 总星 14,900+

是什么：

Agent-Reach 由 Panniantong 开发，是一个零 API 费用的 CLI 工具，让 AI Agent 能够搜索和读取 Twitter、Reddit、YouTube、GitHub、Bilibili、小红书等多个平台的内容。与 last30days-skill 不同，Agent-Reach 的定位更偏向"给 Agent 提供实时信息获取能力"而非"研究简报生成"——它可以作为 MCP Server 或独立 CLI 使用，让 AI 在工作流中实时查询社交平台信息。零 API 费用意味着它绕过了官方 API 的限制。

怎么用：

# 克隆并安装
git clone https://github.com/Panniantong/Agent-Reach
cd Agent-Reach
npm install

# 启动 MCP 服务器模式
npm run mcp

# 或 CLI 搜索模式
npx agent-reach search "AI agent framework" --platforms twitter,reddit,github

# 在 Claude Code 中配置为 MCP Server
# 编辑 ~/.claude.json:
# "agent-reach": { "type": "stdio", "command": "node", "args": ["path/to/Agent-Reach/index.js"] }

为什么重要：

AI Agent 的核心瓶颈之一是无法获取实时外部信息——LLM 的知识有截止日期，Web Search 返回的是 SEO 优化过的内容而非真实讨论。Agent-Reach 填补了这个空白：它绕过了 API 付费墙，让任何 AI Agent 都能"看到"互联网上正在发生什么。14,900+ stars 说明这个需求极其普遍。与 last30days-skill（面向研究和内容创作）形成互补——Agent-Reach 更偏向 Agent 工作流中的实时信息获取。

讨论现场：

来源：https://github.com/Panniantong/Agent-Reach

GitHub Issues 中社区贡献了多个新平台支持（知乎、抖音、微博）
Reddit r/LocalLLaMA 讨论："这是给本地模型用的最好的 search grounding 方案，不需要任何 API key"
社区关注点：零 API 费用意味着可能依赖爬虫，长期稳定性取决于平台反爬策略

google/skills — Google 官方发布 Agent Skills，为自家产品生态铺路

影响力 7.8/10GitHub Trending #6 · 461 stars/day

是什么：

google/skills 是 Google 官方在 GitHub 上发布的 Agent Skills 仓库，提供面向 Google 产品和技术的 AI Agent 技能集合。这是 Google 对 Claude Code 技能生态和 OpenAI Codex 插件体系的官方回应——通过标准化技能格式，让 AI Agent 能够更高效地使用 Google Cloud、Gemini API、Google Workspace 等产品。仓库由 Google Cloud 和 Google DeepMind 团队联合维护。

怎么用：

# 克隆仓库
git clone https://github.com/google/skills

# 将技能复制到 Claude Code 的 skills 目录
cp -r google/skills/gemini-api ~/.claude/skills/

# 或在 Claude Code 中直接引用
# 技能的 SKILL.md 文件遵循标准格式，兼容 Claude Code / Codex / Cursor

为什么重要：

Google 官方入场 Agent Skills 生态，意味着"技能市场"正成为 AI Agent 时代的新分发渠道——就像 App Store 之于移动互联网。Google 的技能覆盖 Gemini API、Google Cloud、BigQuery 等关键产品，为企业级 Agent 工作流提供了官方支持通道。也是继 Anthropic（Claude Code Skills）、OpenAI（ChatGPT Plugins/Codex）之后，第三家主流 AI 公司正式投入 Agent 技能标准化的标志。

讨论现场：

来源：https://github.com/google/skills

GitHub Issues 中开发者请求添加更多 Google 产品的技能（Google Sheets、Google Maps、Google Ads）
社区关注：技能格式是否与 Claude Code 的 CLAUDE.md 标准兼容？目前看起来遵循了相似的 Markdown + 元数据格式

CopilotKit — Agent 前端基础设施栈，让 React 应用原生支持 AI Agent 和生成式 UI

影响力 7.5/10GitHub Trending #7 · 378 stars/day · 总星 20,000+

是什么：

CopilotKit 是面向 Agent 和生成式 UI 的前端基础设施框架，支持 React、Angular、Mobile、Slack 等多平台。它提供了一套完整的组件和 Hook，让前端开发者能够将 AI Agent 直接嵌入应用界面——包括 Agent 对话窗口、生成式 UI 渲染、Agent 状态管理等。项目还是 AG-UI 协议的制定者之一，该协议旨在标准化 AI Agent 与用户界面之间的交互方式。

怎么用：

# React 项目安装
npm install @copilotkit/react-core @copilotkit/react-ui

# 基础使用（React）
# import { CopilotKit } from '@copilotkit/react-core';
# import { CopilotPopup } from '@copilotkit/react-ui';
#
# <CopilotKit>
#   <YourApp />
#   <CopilotPopup />
# </CopilotKit>

为什么重要：

2026 年 AI Agent 正在从命令行走向用户界面——但大多数前端框架对 Agent 交互模式的支持为零。CopilotKit 填补了这个空白：它提供了 Agent 状态管理、生成式 UI 的动态渲染、多 Agent 协调等前端层的基础设施。制定的 AG-UI 协议如果成为行业标准，将降低 Agent 应用的前端开发门槛相当于 React 之于 Web 开发的作用。20,000+ stars 和持续的日增热度表明市场需求真实且迫切。

讨论现场：

来源：https://github.com/CopilotKit/CopilotKit

HN 讨论："Agent UI 是 2026 年最被低估的基础设施层。CLI Agent 很酷，但 99% 的用户需要的是图形界面。"
Dev.to 上有完整教程展示"30 分钟内用 CopilotKit 给 SaaS 产品加上 AI Agent 面板"

OpenAI Codex 并入 ChatGPT — 统一 Agent 平台、ChatGPT Sites 预览发布

影响力 7.5/10The Information · OpenAI 官方博客 · 多家科技媒体报道 · YouTube 5000+ 播放

是什么：

OpenAI 于 6 月 2 日正式宣布将 Codex 团队并入 ChatGPT 团队，由总裁 Greg Brockman 领导。Codex（前身为 GitHub Copilot 的底层模型）已有 500 万+ 周活用户，自桌面版发布以来增长 6 倍，其中 20% 为非开发者的知识工作者（分析师、市场人员、内容创作者）。同期推出 ChatGPT Sites 预览版——允许团队通过自然语言让 Codex 创建、迭代和部署全栈 JS/TS Web 应用，含数据存储和 SSO 登录。ChatGPT 周活用户超 9 亿，付费用户超 5000 万。

怎么用：

# ChatGPT Business/Enterprise 用户（需含 Codex 权限）
# 1. 在 ChatGPT 中选择 Codex 模式
# 2. 安装 ChatGPT Sites 插件
# 3. 自然语言创建应用：
#    "Build an internal dashboard for tracking team KPIs"
#    Codex 自动生成前端+后端代码并部署

# ChatGPT 免费/Plus/Pro 用户
# 直接在 chatgpt.com 使用，Codex 功能正在逐步合并

为什么重要：

这是 OpenAI 从"AI 模型公司"转型为"AI 平台公司"的关键一步。Codex 5M WAU 和 6x 增长证明 AI Agent 正在从开发者工具扩展为通用生产力工具。ChatGPT Sites 直接对标 Vercel v0/bolt.new 等 AI 建站工具，但优势在于 9 亿用户的分发基础。对于开发者这意味着：竞争对手的 AI 编码 Agent 不仅要和 Codex 比代码能力，还要和 9 亿用户的网络效应竞争。

讨论现场：

来源：https://openai.com/index/codex-for-knowledge-work

The Information 记者 Stephanie Palazzolo："Codex 企业收入周增 50%，Sam Altman 告诉员工日活增速 5%/天——如果维持这个速度，一个月增长 4 倍"
HN 讨论："OpenAI 正在把 ChatGPT 变成 WeChat——聊天、支付、小程序（Sites）、Agent 都在一个入口"
社区担忧：合并后 Codex 的开发者体验是否会被消费级产品的需求稀释？

MemPalace — "基准测试最佳"的开源 AI 记忆系统，免费且自托管

影响力 7.3/10GitHub Trending · 170 stars/day · Product Hunt 上榜

是什么：

MemPalace 是一个开源的 AI 记忆系统，自称"基准测试最佳"——在多项记忆与检索的标准化评测中排名前列。它为 AI Agent 提供持久化的语义记忆层，支持混合搜索（向量 + 关键词）和 LLM 重排序，让 Agent 跨会话记住用户偏好、项目上下文和历史决策。完全免费且可自托管，数据不出用户的基础设施。由 igorls 和 bensig 等人开发。

怎么用：

# 克隆并启动
git clone https://github.com/MemPalace/mempalace
cd mempalace
docker-compose up -d

# Python SDK
pip install mempalace-client

# 在 Agent 中使用
from mempalace import MemoryClient
mem = MemoryClient("http://localhost:8000")
mem.remember("用户偏好深色主题", metadata={"user": "alice", "category": "preference"})
results = mem.recall("主题设置", top_k=5)

为什么重要：

AI Agent 最大的用户体验缺陷之一是"健忘"——每次新会话都是空白状态。MemPalace 试图用标准化、可自托管的方案解决这个问题。与 Mastra 的 Observational Memory（TypeScript 原生、集成在 Agent 框架内）不同，MemPalace 是语言无关的独立服务，可以接入任何 Agent 框架。开源自托管意味着企业可以在合规环境中使用，不需要把用户数据发给第三方记忆服务。

讨论现场：

来源：https://github.com/MemPalace/mempalace

HN "Show HN" 帖子讨论："记忆层正在成为 Agent 基础设施的标准组件——就像数据库之于 Web 应用"
Product Hunt 评论区："试用了一下，混合搜索 + LLM 重排序的召回质量确实比纯向量搜索好一个档次"

luongnv89/claude-howto — Claude Code 从入门到精通的可视化指南，312 stars/day

影响力 7.0/10GitHub Trending · 312 stars/day

是什么：

claude-howto 是一份面向 Claude Code 用户的可视化、示例驱动的指南，覆盖从基础概念到高级 Agent 工作流——每个主题都配有可直接复制粘贴的模板和截图。由 luongnv89 维护，Claude 本身参与了项目的内容生成。定位是 Claude Code 的"非官方使用手册"，补充了官方文档中缺少的实际工作流示例。

怎么用：

# 在线阅读
# 访问 https://github.com/luongnv89/claude-howto

# 克隆到本地（Markdown 格式，可用 Obsidian 打开）
git clone https://github.com/luongnv89/claude-howto

为什么重要：

Claude Code 131K stars 的背后是巨大的学习需求——但官方文档侧重 API 参考，缺少"如何组织 .claude/ 目录"、"如何编写 CLAUDE.md"、"如何创建自定义命令"等实操指南。claude-howto 填补了这个空白。312 stars/day 的增长说明 Claude Code 的用户群仍在快速扩张，且对高质量学习资源有强烈需求。

讨论现场：

来源：https://github.com/luongnv89/claude-howto

GitHub Issues："希望能增加'多 Agent 协作'章节——如何让 3 个 Claude Code 实例并行工作？"
X 上有人评价："比官方文档好用 10 倍，每个开发者都应该 star"

turbovec（持续火爆） — 昨日已收录，今日再揽 1,729 stars，总数突破 6,200

影响力 6.8/10首次收录于 2026-06-08 · 今日 1,729 stars/day · 总星 6,230+

是什么：

turbovec 昨日首次被本刊收录（#2），今日继续以 1,729 stars/day 的速度增长。核心亮点：基于 Google Research TurboQuant 算法的 Rust 向量索引，Python 绑定开箱即用，1000 万文档仅需 4GB 内存（float32 需要 31GB），8× 压缩比，在 ARM 上搜索速度比 FAISS 更快。适合本地 RAG、边缘设备、隐私优先的 AI 应用场景。

怎么用：

pip install turbovec

为什么持续火爆：TurboQuant 本身在 ICLR 2026 发表后引发学界广泛关注，Qdrant 社区已有人提 Issue 请求原生集成。turbovec 作为第一个将 TurboQuant 工程化的开源实现，捕获了这波学术→工程的迁移红利。

讨论现场：

来源：https://github.com/RyanCodrai/turbovec

X 上 @trending_repos 将其列为当日最热仓库
Qdrant GitHub Issues 中的 TurboQuant 集成讨论被频繁引用

gpt-pilot 遭供应链入侵 — Shai-Hulud 蠕虫借道 GitHub 植入凭证窃取器，Python linter 意外立功

影响力 6.5/10StepSecurity 披露 · 33,700+ stars 项目受影响 · 广泛安全社区讨论

是什么：

# 在 Python 项目的 CI 中加入 ruff 格式化检查
pip install ruff
ruff check . --select E,W,F,I,N

# 启用 GitHub 分支保护规则
# Settings → Branches → Add rule → 勾选 "Require status checks to pass before merging"
# 确保 CI 中包含 linting 步骤

# 检查本地 gpt-pilot 是否受影响
# 如果在 2026-06-08 当天拉取了最新 main 分支，建议删除重建
pip uninstall gpt-pilot -y
pip install gpt-pilot  # 重新安装干净版本

2026 年 6 月 8 日，攻击者入侵了 Pythagora-io/gpt-pilot 联合创始人的 GitHub 账号，向主分支 force-push 了包含 Shai-Hulud 凭证窃取载荷的恶意代码。gpt-pilot 是一个 33,700+ stars 的知名 AI 编码工具（自称"第一个真正的 AI 开发者"），3,500+ forks。攻击者尝试了两次——两次都被 Python 代码格式化工具 ruff 在 CI 中拦截，因为注入的恶意 Python 文件不符合项目的格式化规则。同一蠕虫家族今年已感染微软、Red Hat 和 Mistral AI 维护的项目。怎么用（防御）：

为什么重要：

这不是一起普通的 OSS 安全事件——它暴露了 AI 编码工具生态的独特风险。AI 编码工具的典型用户会频繁执行 git pull 和 pip install 来获取最新功能，且往往在本地以高权限运行。攻击者选择 gpt-pilot 作为目标，正是因为它的用户画像就是"信任命令行、习惯自动更新"的开发者。ruff linter 立功则表明：防御性开发实践（linting、CI 检查）的价值远超"代码美观"——它们可以是最后一道防线。

讨论现场：

来源：https://www.stepsecurity.io/blog/pythagora-io-gpt-pilot-compromised-on-github-shai-hulud-credential-stealer-blocked-by-python-linter

StepSecurity 博客："同一家族已感染微软、Red Hat、Mistral AI 项目——这是针对 AI 编码工具生态的有组织攻击"
HN 讨论中有观点指出："AI Agent 自动生成的代码更难被人工审查发现异常——未来这种攻击会更隐蔽"
Reddit r/programming："ruff 拯救了 3.5 万 stars 项目的用户群，这是年度最佳'代码格式化也能救命'案例"

··· ◆ ···

其他值得关注

[!tip] 本期关键词 Agent技能市场 · 万亿参数推理加速 · Siri AI · Codex平台化 · 向量搜索 · Agent前端 · AI记忆系统 · 开源供应链安全

Apple WWDC 2026 正式发布 Siri AI

Siri 从零重建，底层使用 Apple 与 Google 联合训练的 Foundation Models（Gemini 技术蒸馏），支持个人上下文感知、屏幕内容理解、应用间操作。iOS 27/macOS 27/visionOS 27 秋季推送。但欧盟和中国暂无上线计划（DMA 法规和监管审批问题）。昨日已预报，今日确认为正式发布。

（HN 419+344 points · CNBC/Bloomberg/MacRumors 全量报道）

roboflow/supervision

计算机视觉工具集持续火爆，提供可复用的 CV 工具函数，被社区称为"CV 开发者的 Swiss Army Knife"。

（1,288 stars/day）

GitHub Copilot 转向用量计费

告别固定订阅，改用 GitHub AI Credits（按 token 消耗计费），Code Review 功能消耗 Actions 分钟数。开发者反应两极。

（6 月 1 日生效）

santifer/career-ops

基于 Claude Code 的 AI 求职系统，含 14 种技能模式，覆盖简历优化、模拟面试、薪资谈判等全流程。

（308 stars/day）

phuryn/pm-skills

PM 技能市场，100+ 个面向产品经理的 Agent 技能——从需求发现到策略制定到发布增长，覆盖产品全生命周期。

（164 stars/day）