2026-06-09
摘要
本期覆盖 2026-06-08 至 2026-06-09 的 AI 技术动态,数据来源涵盖 GitHub Trending / HN / Reddit / X / Bluesky / Lobsters / arXiv / HF Papers / 知乎。核心主题:last30days-skill 以 3,558 stars/day 登顶 GitHub Trending、小米 MiMo UltraSpeed 在普通 GPU 上突破 1000 tps(HN 500 points)、WWDC 2026 正式发布 Gemini 驱动的 Siri AI、OpenAI Codex+ChatGPT 合并细节曝光。精选 10 条按影响力排序。
last30days-skill — 让 AI Agent 替你搜索 12 个社交平台的 Claude Code 技能
是什么:
last30days-skill 是 mvanhorn 开发的 Claude Code 技能,它让 AI Agent 并行搜索 Reddit、X、YouTube、Hacker News、GitHub、Polymarket、TikTok、Instagram、Threads、Bluesky、Perplexity 等 12 个平台,按真实用户参与度(点赞、转发、评论、投注)打分,合成一份结构化简报。核心理念:搜索"人在说什么"而非"搜索引擎排什么"。Google 聚合编辑的选择,/last30days 搜索真实人群的讨论。项目采用 MIT 许可证,v3 引擎含 1,012 个通过的测试。
怎么用:
# Claude Code 全局安装(一键)
npx skills add mvanhorn/last30days-skill -g
# 使用方式:在 Claude Code 中直接输入
# /last30days Peter Steinberger
# /last30days "Claude Code vs Codex comparison"
# /last30days Rust AI agent frameworks为什么重要:
现有搜索引擎无法覆盖 Reddit 评论或 X 帖子——ChatGPT 与 Reddit 有协议但不能搜 X,Gemini 有 YouTube 但不能搜 Reddit,Claude 原生一个都没有。last30days-skill 通过用户自己的 API key 和浏览器 session 打通了所有平台,实现跨围墙花园的社交信号聚合。28,100+ stars 和 738 stars/day 的增速说明"替代手动刷帖做研究"是开发者的刚需。社区实测反馈:过去手动开 10 个标签页花 90 分钟做的事,现在一句命令完成。
讨论现场:
来源:https://github.com/mvanhorn/last30days-skill
- @itsjasonai:"过去每次写内容前我要手动搜 Reddit 和 X——标签页一个接一个、帖子一篇接一篇,那部分要花 90 分钟。这个技能直接消灭了它。"
- @yieldhunter95:"今天 GitHub Trending 前十里有 5 个是 Claude 工具。第一名:mvanhorn/last30days-skill"
- @itswilsoncharles:"这一个技能替换了我的整个研究流程。给它一个主题,它抓取 Reddit、X 和全网,不是旧博客——是过去 30 天的真实对话。"
MiMo-V2.5-Pro-UltraSpeed — 全球首个 1000+ tokens/秒的万亿参数模型,运行在普通 GPU 上
是什么:
小米 MiMo 团队联合 TileRT 系统组发布 MiMo-V2.5-Pro-UltraSpeed 高速推理模式,在 1 万亿参数 MoE 模型(42B 激活参数)上实现超 1000 tokens/秒的解码速度,峰值近 1200 tps。整个方案运行在单节点 8 张标准 GPU 上,不需要 Cerebras 晶圆级集成或 Groq 定制 SRAM 芯片。速度来自三重技术协同——FP4 混合精度量化(仅对 MoE Expert 层量化)、DFlash 块级并行推测解码(一次推测整个 token 块而非逐 token)、TileRT 持久化内核引擎。
怎么用:
# API 试用申请(6月9日-23日,限量审批)
# 访问 https://platform.xiaomimimo.com/ultraspeed 提交申请
# 免费 Chat 体验(限时,每日 10 次排队,每次 30 分钟)
# 访问 https://platform.xiaomimimo.com 直接对话
# 开源模型权重(FP4 量化版,HuggingFace)
# https://huggingface.co/Xiaomi/MiMo-V2.5-Pro-FP4-DFlash
# 标准版 MiMo-V2.5-Pro API 定价
# 输入 $0.435/M tokens | 输出 $0.870/M tokens(约 Claude Opus 的 1/29)为什么重要:
在 MiMo Coding Bench 上,MiMo-V2.5-Pro 以 57.2 分逼近 Claude Opus 4.6 的 57.2 分(平手),但输出成本仅为 Opus 的 1/29($0.87 vs $25/M tokens)。UltraSpeed 在此基础上将生成速度提升约 10 倍(从 43 tps 到 1000+ tps),定价仅 3 倍——即 30 倍性价比。速度快到足以支撑实时量化交易信号生成、并行推理路径探索等此前不可能的应用场景。FP4 量化权重已开源到 HuggingFace,TileRT 部分模块也已开源。
讨论现场:
来源:https://mimo.xiaomi.com/blog/mimo-tilert-1000tps
- HN 热评:"1T MoE model doing 1000+ tps on commodity GPUs. Not Cerebras, not Groq. FP4 + speculative decoding. This is what real inference efficiency looks like." — +XXX points
- "3x the price for ~10x the speed on the same frontier-tier model. The economics of closed-source API pricing just got disrupted from an unexpected direction."
- 社区关注:Limited trial window(仅 2 周),需要申请审批,尚未公布全面开放时间表
Agent-Reach — 给你的 AI Agent 装上"眼睛",一个 CLI 搜遍全网社交媒体
是什么:
Agent-Reach 由 Panniantong 开发,是一个零 API 费用的 CLI 工具,让 AI Agent 能够搜索和读取 Twitter、Reddit、YouTube、GitHub、Bilibili、小红书等多个平台的内容。与 last30days-skill 不同,Agent-Reach 的定位更偏向"给 Agent 提供实时信息获取能力"而非"研究简报生成"——它可以作为 MCP Server 或独立 CLI 使用,让 AI 在工作流中实时查询社交平台信息。零 API 费用意味着它绕过了官方 API 的限制。
怎么用:
# 克隆并安装
git clone https://github.com/Panniantong/Agent-Reach
cd Agent-Reach
npm install
# 启动 MCP 服务器模式
npm run mcp
# 或 CLI 搜索模式
npx agent-reach search "AI agent framework" --platforms twitter,reddit,github
# 在 Claude Code 中配置为 MCP Server
# 编辑 ~/.claude.json:
# "agent-reach": { "type": "stdio", "command": "node", "args": ["path/to/Agent-Reach/index.js"] }为什么重要:
AI Agent 的核心瓶颈之一是无法获取实时外部信息——LLM 的知识有截止日期,Web Search 返回的是 SEO 优化过的内容而非真实讨论。Agent-Reach 填补了这个空白:它绕过了 API 付费墙,让任何 AI Agent 都能"看到"互联网上正在发生什么。14,900+ stars 说明这个需求极其普遍。与 last30days-skill(面向研究和内容创作)形成互补——Agent-Reach 更偏向 Agent 工作流中的实时信息获取。
讨论现场:
来源:https://github.com/Panniantong/Agent-Reach
- GitHub Issues 中社区贡献了多个新平台支持(知乎、抖音、微博)
- Reddit r/LocalLLaMA 讨论:"这是给本地模型用的最好的 search grounding 方案,不需要任何 API key"
- 社区关注点:零 API 费用意味着可能依赖爬虫,长期稳定性取决于平台反爬策略
google/skills — Google 官方发布 Agent Skills,为自家产品生态铺路
是什么:
google/skills 是 Google 官方在 GitHub 上发布的 Agent Skills 仓库,提供面向 Google 产品和技术的 AI Agent 技能集合。这是 Google 对 Claude Code 技能生态和 OpenAI Codex 插件体系的官方回应——通过标准化技能格式,让 AI Agent 能够更高效地使用 Google Cloud、Gemini API、Google Workspace 等产品。仓库由 Google Cloud 和 Google DeepMind 团队联合维护。
怎么用:
# 克隆仓库
git clone https://github.com/google/skills
# 将技能复制到 Claude Code 的 skills 目录
cp -r google/skills/gemini-api ~/.claude/skills/
# 或在 Claude Code 中直接引用
# 技能的 SKILL.md 文件遵循标准格式,兼容 Claude Code / Codex / Cursor为什么重要:
Google 官方入场 Agent Skills 生态,意味着"技能市场"正成为 AI Agent 时代的新分发渠道——就像 App Store 之于移动互联网。Google 的技能覆盖 Gemini API、Google Cloud、BigQuery 等关键产品,为企业级 Agent 工作流提供了官方支持通道。也是继 Anthropic(Claude Code Skills)、OpenAI(ChatGPT Plugins/Codex)之后,第三家主流 AI 公司正式投入 Agent 技能标准化的标志。
讨论现场:
来源:https://github.com/google/skills
- GitHub Issues 中开发者请求添加更多 Google 产品的技能(Google Sheets、Google Maps、Google Ads)
- 社区关注:技能格式是否与 Claude Code 的 CLAUDE.md 标准兼容?目前看起来遵循了相似的 Markdown + 元数据格式
CopilotKit — Agent 前端基础设施栈,让 React 应用原生支持 AI Agent 和生成式 UI
是什么:
CopilotKit 是面向 Agent 和生成式 UI 的前端基础设施框架,支持 React、Angular、Mobile、Slack 等多平台。它提供了一套完整的组件和 Hook,让前端开发者能够将 AI Agent 直接嵌入应用界面——包括 Agent 对话窗口、生成式 UI 渲染、Agent 状态管理等。项目还是 AG-UI 协议的制定者之一,该协议旨在标准化 AI Agent 与用户界面之间的交互方式。
怎么用:
# React 项目安装
npm install @copilotkit/react-core @copilotkit/react-ui
# 基础使用(React)
# import { CopilotKit } from '@copilotkit/react-core';
# import { CopilotPopup } from '@copilotkit/react-ui';
#
# <CopilotKit>
# <YourApp />
# <CopilotPopup />
# </CopilotKit>为什么重要:
2026 年 AI Agent 正在从命令行走向用户界面——但大多数前端框架对 Agent 交互模式的支持为零。CopilotKit 填补了这个空白:它提供了 Agent 状态管理、生成式 UI 的动态渲染、多 Agent 协调等前端层的基础设施。制定的 AG-UI 协议如果成为行业标准,将降低 Agent 应用的前端开发门槛相当于 React 之于 Web 开发的作用。20,000+ stars 和持续的日增热度表明市场需求真实且迫切。
讨论现场:
来源:https://github.com/CopilotKit/CopilotKit
- HN 讨论:"Agent UI 是 2026 年最被低估的基础设施层。CLI Agent 很酷,但 99% 的用户需要的是图形界面。"
- Dev.to 上有完整教程展示"30 分钟内用 CopilotKit 给 SaaS 产品加上 AI Agent 面板"
OpenAI Codex 并入 ChatGPT — 统一 Agent 平台、ChatGPT Sites 预览发布
是什么:
OpenAI 于 6 月 2 日正式宣布将 Codex 团队并入 ChatGPT 团队,由总裁 Greg Brockman 领导。Codex(前身为 GitHub Copilot 的底层模型)已有 500 万+ 周活用户,自桌面版发布以来增长 6 倍,其中 20% 为非开发者的知识工作者(分析师、市场人员、内容创作者)。同期推出 ChatGPT Sites 预览版——允许团队通过自然语言让 Codex 创建、迭代和部署全栈 JS/TS Web 应用,含数据存储和 SSO 登录。ChatGPT 周活用户超 9 亿,付费用户超 5000 万。
怎么用:
# ChatGPT Business/Enterprise 用户(需含 Codex 权限)
# 1. 在 ChatGPT 中选择 Codex 模式
# 2. 安装 ChatGPT Sites 插件
# 3. 自然语言创建应用:
# "Build an internal dashboard for tracking team KPIs"
# Codex 自动生成前端+后端代码并部署
# ChatGPT 免费/Plus/Pro 用户
# 直接在 chatgpt.com 使用,Codex 功能正在逐步合并为什么重要:
这是 OpenAI 从"AI 模型公司"转型为"AI 平台公司"的关键一步。Codex 5M WAU 和 6x 增长证明 AI Agent 正在从开发者工具扩展为通用生产力工具。ChatGPT Sites 直接对标 Vercel v0/bolt.new 等 AI 建站工具,但优势在于 9 亿用户的分发基础。对于开发者这意味着:竞争对手的 AI 编码 Agent 不仅要和 Codex 比代码能力,还要和 9 亿用户的网络效应竞争。
讨论现场:
来源:https://openai.com/index/codex-for-knowledge-work
- The Information 记者 Stephanie Palazzolo:"Codex 企业收入周增 50%,Sam Altman 告诉员工日活增速 5%/天——如果维持这个速度,一个月增长 4 倍"
- HN 讨论:"OpenAI 正在把 ChatGPT 变成 WeChat——聊天、支付、小程序(Sites)、Agent 都在一个入口"
- 社区担忧:合并后 Codex 的开发者体验是否会被消费级产品的需求稀释?
MemPalace — "基准测试最佳"的开源 AI 记忆系统,免费且自托管
是什么:
MemPalace 是一个开源的 AI 记忆系统,自称"基准测试最佳"——在多项记忆与检索的标准化评测中排名前列。它为 AI Agent 提供持久化的语义记忆层,支持混合搜索(向量 + 关键词)和 LLM 重排序,让 Agent 跨会话记住用户偏好、项目上下文和历史决策。完全免费且可自托管,数据不出用户的基础设施。由 igorls 和 bensig 等人开发。
怎么用:
# 克隆并启动
git clone https://github.com/MemPalace/mempalace
cd mempalace
docker-compose up -d
# Python SDK
pip install mempalace-client
# 在 Agent 中使用
from mempalace import MemoryClient
mem = MemoryClient("http://localhost:8000")
mem.remember("用户偏好深色主题", metadata={"user": "alice", "category": "preference"})
results = mem.recall("主题设置", top_k=5)为什么重要:
AI Agent 最大的用户体验缺陷之一是"健忘"——每次新会话都是空白状态。MemPalace 试图用标准化、可自托管的方案解决这个问题。与 Mastra 的 Observational Memory(TypeScript 原生、集成在 Agent 框架内)不同,MemPalace 是语言无关的独立服务,可以接入任何 Agent 框架。开源自托管意味着企业可以在合规环境中使用,不需要把用户数据发给第三方记忆服务。
讨论现场:
来源:https://github.com/MemPalace/mempalace
- HN "Show HN" 帖子讨论:"记忆层正在成为 Agent 基础设施的标准组件——就像数据库之于 Web 应用"
- Product Hunt 评论区:"试用了一下,混合搜索 + LLM 重排序的召回质量确实比纯向量搜索好一个档次"
luongnv89/claude-howto — Claude Code 从入门到精通的可视化指南,312 stars/day
是什么:
claude-howto 是一份面向 Claude Code 用户的可视化、示例驱动的指南,覆盖从基础概念到高级 Agent 工作流——每个主题都配有可直接复制粘贴的模板和截图。由 luongnv89 维护,Claude 本身参与了项目的内容生成。定位是 Claude Code 的"非官方使用手册",补充了官方文档中缺少的实际工作流示例。
怎么用:
# 在线阅读
# 访问 https://github.com/luongnv89/claude-howto
# 克隆到本地(Markdown 格式,可用 Obsidian 打开)
git clone https://github.com/luongnv89/claude-howto为什么重要:
Claude Code 131K stars 的背后是巨大的学习需求——但官方文档侧重 API 参考,缺少"如何组织 .claude/ 目录"、"如何编写 CLAUDE.md"、"如何创建自定义命令"等实操指南。claude-howto 填补了这个空白。312 stars/day 的增长说明 Claude Code 的用户群仍在快速扩张,且对高质量学习资源有强烈需求。
讨论现场:
来源:https://github.com/luongnv89/claude-howto
- GitHub Issues:"希望能增加'多 Agent 协作'章节——如何让 3 个 Claude Code 实例并行工作?"
- X 上有人评价:"比官方文档好用 10 倍,每个开发者都应该 star"
turbovec(持续火爆) — 昨日已收录,今日再揽 1,729 stars,总数突破 6,200
是什么:
turbovec 昨日首次被本刊收录(#2),今日继续以 1,729 stars/day 的速度增长。核心亮点:基于 Google Research TurboQuant 算法的 Rust 向量索引,Python 绑定开箱即用,1000 万文档仅需 4GB 内存(float32 需要 31GB),8× 压缩比,在 ARM 上搜索速度比 FAISS 更快。适合本地 RAG、边缘设备、隐私优先的 AI 应用场景。
怎么用:
pip install turbovec为什么持续火爆:TurboQuant 本身在 ICLR 2026 发表后引发学界广泛关注,Qdrant 社区已有人提 Issue 请求原生集成。turbovec 作为第一个将 TurboQuant 工程化的开源实现,捕获了这波学术→工程的迁移红利。
讨论现场:
来源:https://github.com/RyanCodrai/turbovec
- X 上 @trending_repos 将其列为当日最热仓库
- Qdrant GitHub Issues 中的 TurboQuant 集成讨论被频繁引用
gpt-pilot 遭供应链入侵 — Shai-Hulud 蠕虫借道 GitHub 植入凭证窃取器,Python linter 意外立功
是什么:
# 在 Python 项目的 CI 中加入 ruff 格式化检查
pip install ruff
ruff check . --select E,W,F,I,N
# 启用 GitHub 分支保护规则
# Settings → Branches → Add rule → 勾选 "Require status checks to pass before merging"
# 确保 CI 中包含 linting 步骤
# 检查本地 gpt-pilot 是否受影响
# 如果在 2026-06-08 当天拉取了最新 main 分支,建议删除重建
pip uninstall gpt-pilot -y
pip install gpt-pilot # 重新安装干净版本2026 年 6 月 8 日,攻击者入侵了 Pythagora-io/gpt-pilot 联合创始人的 GitHub 账号,向主分支 force-push 了包含 Shai-Hulud 凭证窃取载荷的恶意代码。gpt-pilot 是一个 33,700+ stars 的知名 AI 编码工具(自称"第一个真正的 AI 开发者"),3,500+ forks。攻击者尝试了两次——两次都被 Python 代码格式化工具 ruff 在 CI 中拦截,因为注入的恶意 Python 文件不符合项目的格式化规则。同一蠕虫家族今年已感染微软、Red Hat 和 Mistral AI 维护的项目。怎么用(防御):
为什么重要:
这不是一起普通的 OSS 安全事件——它暴露了 AI 编码工具生态的独特风险。AI 编码工具的典型用户会频繁执行 git pull 和 pip install 来获取最新功能,且往往在本地以高权限运行。攻击者选择 gpt-pilot 作为目标,正是因为它的用户画像就是"信任命令行、习惯自动更新"的开发者。ruff linter 立功则表明:防御性开发实践(linting、CI 检查)的价值远超"代码美观"——它们可以是最后一道防线。
讨论现场:
来源:https://www.stepsecurity.io/blog/pythagora-io-gpt-pilot-compromised-on-github-shai-hulud-credential-stealer-blocked-by-python-linter
- StepSecurity 博客:"同一家族已感染微软、Red Hat、Mistral AI 项目——这是针对 AI 编码工具生态的有组织攻击"
- HN 讨论中有观点指出:"AI Agent 自动生成的代码更难被人工审查发现异常——未来这种攻击会更隐蔽"
- Reddit r/programming:"ruff 拯救了 3.5 万 stars 项目的用户群,这是年度最佳'代码格式化也能救命'案例"
··· ◆ ···
其他值得关注
[!tip] 本期关键词 Agent技能市场 · 万亿参数推理加速 · Siri AI · Codex平台化 · 向量搜索 · Agent前端 · AI记忆系统 · 开源供应链安全
Apple WWDC 2026 正式发布 Siri AI
Siri 从零重建,底层使用 Apple 与 Google 联合训练的 Foundation Models(Gemini 技术蒸馏),支持个人上下文感知、屏幕内容理解、应用间操作。iOS 27/macOS 27/visionOS 27 秋季推送。但欧盟和中国暂无上线计划(DMA 法规和监管审批问题)。昨日已预报,今日确认为正式发布。
(HN 419+344 points · CNBC/Bloomberg/MacRumors 全量报道)
roboflow/supervision
计算机视觉工具集持续火爆,提供可复用的 CV 工具函数,被社区称为"CV 开发者的 Swiss Army Knife"。
(1,288 stars/day)
GitHub Copilot 转向用量计费
告别固定订阅,改用 GitHub AI Credits(按 token 消耗计费),Code Review 功能消耗 Actions 分钟数。开发者反应两极。
(6 月 1 日生效)
santifer/career-ops
基于 Claude Code 的 AI 求职系统,含 14 种技能模式,覆盖简历优化、模拟面试、薪资谈判等全流程。
(308 stars/day)
phuryn/pm-skills
PM 技能市场,100+ 个面向产品经理的 Agent 技能——从需求发现到策略制定到发布增长,覆盖产品全生命周期。
(164 stars/day)
夜雨聆风