AI 源计划|本周 GitHub 最火的 8 个 AI 项目
帮普通人看懂 GitHub 上正在发生什么。
本周 GitHub Trending 的 AI 板块被"Agent 基建"彻底占领了。全站涨 Star 最快的 15 个项目里,10 个和 AI/Agent 直接相关,合计一周新增超 7 万 Star。
一句话总结本周信号:Agent 的"毛坯房"时代结束了,"精装修"时代开始了。 大家不再是做一个 Agent 框架就完事——给 Agent 装记忆、装代码地图、装软件操控能力、装开发方法论,才是当下的主战场。
本周 GitHub AI 项目热度榜
排名 | 项目 | 总 Star | 本周新增 | 一句话 |
1 | openhuman | 25.5K | +17,399 | 完全本地的个人 AI 超级智能体,隐私优先 |
2 | codegraph | 15.9K | +10,749 | AI 编程助手的"代码地图",省 35% 成本 |
3 | academic-research-skills | 18.9K | +10,737 | Claude 的学术研究全流程技能包 |
4 | superpowers | 203K | +10,688 | AI 编程助手的开发方法论框架,支持 8 种工具 |
5 | CloakBrowser | 18.6K | +7,769 | 反检测浏览器,通过所有机器人检测 |
6 | RuView | 63.7K | +7,636 | WiFi 信号变空间感知,55KB AI 模型 |
7 | agentmemory | 16.3K | +7,000 | AI 编程 Agent 的持久化记忆系统 |
8 | CLI-Anything | 39.5K | +4,587 | 给所有软件加上 CLI,让 Agent 能操控一切 |
数据来源:GitHub Trending(2026 年 5 月 16 日 - 22 日)
以上 8 个项目,每一个都值得你点进去看看。但如果你想深入了解"到底发生了什么",下面是其中 4 个项目的核心解读。
深潜 01 | openhuman — 你的 AI 应该住在你家,不住在别人服务器上
tinyhumansai/openhuman ⭐ 25.5K | 本周 +17,399 | Rust
它是什么
openhuman 是本周 GitHub 全站涨 Star 最猛的项目,没有之一。它是一个完全本地运行的个人 AI 超级智能体——用 Rust 写的桌面应用,核心承诺只有一句话:你的数据永远不出你的设备。
它不只是一个聊天窗口。它有自己的"脸"——一个桌面吉祥物,能说话、能对周围环境做出反应,甚至能以真实参与者身份加入 Google Meet 会议,在你停止输入后继续在后台思考。
为什么突然火了
三个原因叠加到了临界点:
第一,隐私焦虑到了临界点。 越来越多人意识到,自己每天和 AI 说的每句话——工作烦恼、健康问题、私人想法——全都存在某个大厂的服务器上。openhuman 用本地 SQLite 存储一切,数据本地加密,完全属于用户自己。
第二,它的集成能力远超"本地 AI"的预期。 这不是那种"本地跑个小模型、功能阉割"的玩具。openhuman 有 118+ 第三方 OAuth 集成——Gmail、Notion、GitHub、Slack、Stripe、Calendar、Jira、Linear,一键连接。更关键的是它的 Auto-fetch 机制:每 20 分钟自动遍历所有活跃连接,把新数据拉到本地。 连接一次账户,20 分钟后 Agent 就拥有了你邮箱、日历、代码仓库、文档、消息的完整上下文。
第三,它的记忆系统设计得很聪明。 所有数据被规范化为 ≤3k token 的 Markdown 块,经过评分后折叠进层级摘要树,存储在本地 SQLite 中。更绝的是——同样的内容会自动生成 Obsidian 兼容的 .md 文件,你可以在 Obsidian 里浏览和编辑你的 AI 记忆。灵感直接来自 Karpathy 的 obsidian-wiki 工作流。
此外它还有一个叫 TokenJuice 的智能压缩层:每个工具调用、抓取结果、邮件内容、搜索结果都会经过 token 压缩处理后才进入 LLM——HTML 转 Markdown、长 URL 缩短、冗余输出去重并总结。成本和延迟可降低多达 80%。
技术亮点一览
特性 | 说明 |
技术栈 | Rust 64% + TypeScript 32%,基于 Tauri 框架 |
存储 | 本地 SQLite,本地加密 |
集成 | 118+ OAuth 连接器,20 分钟自动同步 |
记忆 | 层级摘要树 + Obsidian Wiki 导出 |
模型 | 支持云端多模型路由 + Ollama 本地模型 |
语音 | STT 输入 + ElevenLabs TTS 输出 + 口型同步 |
Token 优化 | TokenJuice 压缩,成本降低 80% |
开源协议 | GPL-3.0 |
版本 | 已发布 35 个版本,最新 v0.54.0 |
怎么上手
macOS / Linux 一行命令:
curl -fsSL https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.sh | bashWindows 一行命令:
irm https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.ps1 | iex对普通人意味着什么
你不需要把所有秘密交给云端了。openhuman 证明了一件事:个人 AI 可以既强大又私密。 当一个本地 AI 能连接你的全部数字生活、拥有持久记忆、还能自主思考——它就不只是一个"工具"了,它更像一个真正了解你、但不会出卖你的助手。
你愿意把所有秘密交给云端,还是放在自己硬盘上?这个项目的爆火,说明越来越多的人选了后者。
深潜 02 | CodeGraph — 给 AI 编程助手装上"代码地图"
colbymchenry/codegraph ⭐ 15.9K | 本周 +10,749 | TypeScript
它是什么
如果你用过 Claude Code、Cursor、Codex CLI 这类 AI 编程工具,你一定遇到过这个问题:AI 读你的代码像读天书,改一行崩一片。
原因很简单——AI 看代码的方式是"逐文件扫描",就像一个新来的实习生,拿着手电筒一间一间地看仓库,既慢又容易漏。CodeGraph 的解决方案很暴力也很优雅——在本地给你的代码库建一张"知识图谱":哪些函数调用了谁、哪些模块依赖了谁、改一个符号会影响哪些地方。AI 不用再逐文件翻,一次工具调用就能拿到入口点、相关符号和代码片段。
实测数据太硬了
项目在 7 个真实开源代码库上跑了基准测试,结果:
代码库 | 语言 | 文件数 | 成本节省 | Token 减少 | 工具调用减少 |
VS Code | TypeScript | ~10K | 35% | 73% | 72% |
Excalidraw | TypeScript | ~600 | 47% | 73% | 86% |
Django | Python | ~2.7K | 34% | 64% | 81% |
Tokio | Rust | ~700 | 52% | 81% | 89% |
OkHttp | Java | ~640 | 17% | 41% | 64% |
Gin | Go | ~150 | 22% | 23% | 19% |
Alamofire | Swift | ~100 | 38% | 59% | 77% |
平均 | 35% | 59% | 70% |
拿 VS Code 举例:没有 CodeGraph 时,AI 回答一个架构问题要花 $0.64、读 140 万 token、调用 23 次工具。有了 CodeGraph 之后,只要 $0.42、39 万 token、7 次工具调用。 不是快了一点,是快了一个量级。
规律很明显:项目越大,收益越大。 小型项目(150 文件)收益有限,但万级文件的大型仓库,工具调用直接砍掉 70-89%。
技术原理(4 个阶段)
- 提取
:用 tree-sitter 把源代码解析成 AST(抽象语法树),提取函数、类、方法,以及调用、导入、继承、实现关系 - 存储
:所有数据存入本地 SQLite 数据库,配备 FTS5 全文搜索引擎 - 解析
:建立引用关系——函数调用→定义、导入→源文件、类继承、框架路由模式 - 自动同步
:监听操作系统原生文件事件(FSEvents/inotify/ReadDirectoryChangesW),2 秒防抖后增量更新
整个过程 100% 本地运行,无 API 密钥,无数据外传。
支持范围
- 19 种编程语言
:TypeScript、JavaScript、Python、Go、Rust、Java、C#、PHP、Ruby、C、C++、Swift、Kotlin、Dart、Lua、Svelte 等 - 14 个 Web 框架感知
:Django、Flask、FastAPI、Express、NestJS、Laravel、Rails、Spring、Gin、Axum、ASP.NET、Vapor、React Router、SvelteKit - 5 个 AI 编程助手
:Claude Code、Cursor、Codex CLI、OpenCode、Hermes Agent - 8 个 MCP 工具
:search、context、callers、callees、impact、node、files、status
怎么上手
# 安装(无需 Node.js)curl -fsSL https://raw.githubusercontent.com/colbymchenry/codegraph/main/install.sh | sh# 进入你的项目目录,一行初始化cd your-projectcodegraph init -i # 交互式安装,自动配置你的 AI 编程助手对普通人意味着什么
如果你是程序员,用 AI 写代码已经不是新鲜事了。但 AI 写出来的代码"有时对有时错"的根本原因,经常不是模型不够聪明,而是它根本看不懂你的项目结构。 CodeGraph 就是那个"翻译层"——它让 AI 从一个只会逐行读文件的"实习生",变成一个理解项目全貌的"熟手"。
不是模型不够强,是它之前看不懂你的代码。现在有人解决了这个问题。
深潜 03 | RuView — 你家的路由器,可能比摄像头更懂你
ruvnet/RuView ⭐ 63.7K | 本周 +7,636 | Rust
它是什么
RuView 做了一件听起来像科幻的事:用 WiFi 信号实现空间感知,不需要摄像头。
你家的 WiFi 信号每时每刻都在穿过房间。当人走动、呼吸、甚至心跳时,这些信号会被轻微"扰动"。RuView 就是把这些扰动提取出来,转换成你能用的信息——房间里有没有人、人在哪、呼吸是否正常、有没有跌倒。
核心用的是 WiFi 的 Channel State Information(CSI,信道状态信息),硬件只需要几个便宜的 ESP32 芯片。
它能做到什么
能力 | 怎么做到的 | 精度/延迟 |
呼吸率检测 | 相位信号的 0.1-0.5 Hz 带通滤波 | 6-30 BPM,实时 |
心率检测 | 0.8-2.0 Hz 带通滤波 | 40-120 BPM,实时 |
存在检测 | HuggingFace 预训练模型 | 验证集 100% 准确率 |
跌倒检测 | 相位加速度阈值 + 3 帧去抖 | < 200 ms |
17 关键点姿态估计 | WiFi CSI → Transformer + 图神经网络 | Pi 5 上 8.4ms |
穿墙感知 | 菲涅耳区几何 + 多径建模 | 最远约 5 米 |
多人计数 | 自适应 P95 归一化 + 运行时去重因子 | 实时 |
睡眠质量监测 | 过夜监测 + 睡眠阶段分类 | 含呼吸暂停筛查 |
环境映射 | RF 指纹识别房间、检测家具移动 | 实时 |
最让人震惊的数字:55KB
RuView 的核心 AI 模型只有 55 KB。不是一个压缩包,是整个模型:
组件 | 参数量 | 大小 |
Transformer 骨干 | ~28,000 | 28 KB |
嵌入投射头 | ~25,000 | 25 KB |
每房间 MicroLoRA 适配器 | ~1,800 | 2 KB |
总计 | ~55,000 | 55 KB |
整个模型跑在一块 $8 的 ESP32 芯片上。它的 CSI 嵌入用 4 位量化后只有 8 KB,在 M4 Pro 上跑出 164,183 emb/s 的速度。55 KB 的模型做到了 17 关键点人体姿态估计——这在传统 CV 领域通常需要几百 MB 的模型。
105 个边缘模块,覆盖你想不到的场景
项目不只是一个"技术 demo",它提供了 105 个即插即用的边缘模块:
- 健康(14 个)
:跌倒检测、婴儿哭声检测、心律失常、睡眠呼吸暂停、癫痫检测、步态分析、咳嗽检测…… - 安全(14 个)
:入侵检测、枪声检测、玻璃破碎、尾随检测、武器检测…… - 建筑(11 个)
:会议室占用、能源审计、HVAC 存在检测、电梯计数…… - 零售(7 个)
:客流热图、队列长度、货架互动、翻台率…… - AI(15 个)
:联邦学习、本地 RAG、异常检测、时序预测…… - 极端场景(研究类)
:搜救(穿透 30 厘米混凝土)、消防、甚至"猎鬼"模块
硬件成本
方案 | 你需要什么 | 花多少钱 |
Docker 模拟(零成本体验) | 一台电脑 | $0 |
ESP32 网格(推荐入门) | 3-6 个 ESP32-S3 + WiFi 路由器 | ~$54 |
完整系统 | ESP32-S3 + Cognitum Seed | ~$140 |
零成本体验:
dockerpullruvnet/wifi-densepose:latestdockerrun-p3000:3000ruvnet/wifi-densepose:latest# 打开 http://localhost:3000对普通人意味着什么
不想在家里装摄像头?WiFi 信号就能知道你在家的哪个房间。 对养老看护来说,这意味着不需要给老人身上戴任何设备、不需要装摄像头,家里就知道老人有没有摔倒、呼吸是否正常。对有婴儿的家庭来说,这意味着不需要额外的婴儿监控器。
当 AI 能"看见"你而不需要真的"看见"你——空间感知的范式就变了。
未来你家的路由器不只是上网工具,它可能是你最忠实的守护者。
深潜 04 | CLI-Anything — 当 AI 能操作所有软件,"会用电脑"就不再是技能了
HKUDS/CLI-Anything ⭐ 39.5K | 本周 +4,587 | Python
它是什么
CLI-Anything 的野心可以用它的 slogan 概括:
"Today's Software Serves Humans . Tomorrow's Users Will Be Agents ."
它做的事情很简单也很疯狂:给世界上所有软件加上命令行接口(CLI),让 AI Agent 能像人一样操作它们。 一条命令就能为 GIMP、Blender、LibreOffice、OBS Studio 甚至 Zoom 生成完整的 CLI 工具。
关键不是"做个壳"——每个 CLI 都调用真实软件。 CLI-Anything-LibreOffice 真的会启动 LibreOffice 来生成 PDF,CLI-Anything-Blender 真的会调用 Blender 来渲染 3D 场景。项目原话:"Zero compromises, zero toy implementations."
已覆盖 40+ 软件,2,330 个测试全通过
领域 | 软件 | 测试数 | 领域 | 软件 | 测试数 |
图像编辑 | GIMP | 107 | 视频编辑 | Kdenlive | 155 |
3D 建模 | Blender | 208 | 直播录制 | OBS Studio | 153 |
矢量图形 | Inkscape | 202 | AI 图像生成 | ComfyUI | 70 |
音频制作 | Audacity | 161 | 本地 LLM | Ollama | 98 |
办公套件 | LibreOffice | 158 | 游戏引擎 | s&box | 244 |
邮件营销 | Mailchimp | 303 | 地理空间 | QGIS | 22 |
知识管理 | Mubu | 96 | 工作流 | n8n | 55 |
总计:1,732 个单元测试 + 579 个端到端测试 + 19 个 Node.js 测试 = 2,330 个测试全部通过。
全自动 7 阶段流水线
你不需要写一行代码。AI Agent 自己走完全流程:
- 分析
— 扫描源代码,将 GUI 操作映射到 API - 设计
— 规划命令组、状态模型、输出格式 - 实现
— 使用 Click 框架构建 CLI,含 REPL、JSON 输出、undo/redo - 测试规划
— 创建 TEST.md,包含单元测试和 E2E 测试计划 - 编写测试
— 实现全面的测试套件 - 文档
— 自动生成 SKILL.md(AI Agent 的"使用说明书") - 发布
— 创建 setup.py,安装到 PATH
CLI-Hub:Agent 的"应用商店"
项目还做了一个包管理器——CLI-Hub。AI Agent 可以自主浏览完整目录、发现需要的工具、自动安装。你只要说"帮我用 Blender 渲染一个 3D 场景",Agent 自己知道去哪里找 CLI-Anything-Blender 并使用它。
# 人类安装 CLI-Hubpip install cli-anything-hub# 然后一句话搞定"Find appropriate CLI software in CLI-Hub and complete the task: 渲染一个太空站模型"Agent 自己浏览目录 → 安装 CLI-Anything-Blender → 生成场景 → 渲染。人全程不需要碰键盘。
真实演示
项目提供了几个让人印象深刻的 Agent 实操 demo:
- FreeCAD
:Agent 逐步构建了一个好奇号火星车模型,带预览和轨迹回放 - Blender
:Agent 构建了一架轨道中继无人机,使用实时预览循环 - Draw.io
:Agent 从零画了一张完整的 HTTPS 握手生命周期图 - Slay the Spire II
:Agent 用 CLI 进行实时游戏策略决策(没错,AI 用 CLI 打游戏)
对普通人意味着什么
当 AI 能操作所有软件的时候,"会用电脑"这件事就不再是一个技能了。 你不需要学会 Photoshop 的 300 个快捷键,不需要记住 Blender 的 50 种建模方式。你只需要告诉 AI 你想做什么,它自己去调用对应的工具完成。
这不是取代人类创意——而是把"技术门槛"从创意过程中彻底移除。你有好的设计想法但不会操作软件?Agent 替你操作。你有好的视频构思但不会剪辑?Agent 替你剪。
当 AI 能操作所有软件的时候,"会用电脑"这件事就不再是一个技能了。
我的判断:本周 GitHub 告诉我们什么
信号一:Agent 基建大爆发——"路"比"车"更重要
本周涨 Star 最快的项目里,绝大多数不是 Agent 本身,而是让 Agent 能用的"基础设施"——代码地图(CodeGraph)、软件操控(CLI-Anything)、持久记忆(openhuman 的 Memory Tree、agentmemory)、开发方法论(superpowers)。
2024 年大家在做"Agent 能不能用"的问题;2026 年大家在做"Agent 怎么用好"的问题。基建比应用跑得快,这通常是技术范式进入爆发期的信号。 类比一下:2008 年大家在做"手机 App 能不能做",2010 年大家在做"App 基础设施"(推送、支付、地图),然后移动互联网彻底爆发。Agent 正在走同样的路。
信号二:本地化 / 隐私优先正在成为主流
openhuman 和 RuView 代表了同一种趋势的两个维度——把 AI 拉回本地。openhuman 是"我的数据不出设备",RuView 是"我的感知不靠摄像头"。当这两个方向的项目同时爆火,说明"隐私优先"不再是少数极客的诉求,而是大众的刚需。
信号三:AI 正在从"生成内容"走向"操作世界"
CLI-Anything 代表了一个关键转变:AI 不只是生成文字和图片了,它开始直接操作软件、改变物理世界。Agent 用 Blender 建模、用 Audacity 处理音频、用 LibreOffice 排版——这已经不是"聊天机器人"了,这是"数字工人"。
对普通人的行动建议
你是谁 | 建议关注什么 | 为什么 |
程序员 | 立刻试试 CodeGraph | 用 AI 写代码的体验能提升一个台阶 |
研究者 / 学生 | academic-research-skills | 防幻觉引用 + 全流程研究自动化 |
关注隐私的人 | 跟踪 openhuman | 还在 Early Beta,但方向绝对正确 |
智能家居爱好者 | 试试 RuView 的 Docker 模拟 | 零成本体验"WiFi 空间感知" |
内容创作者 | 关注 CLI-Anything | "不会操作专业软件"不再是障碍 |
所有 AI 用户 | 关注 agentmemory | Agent 的记忆问题是所有人都会遇到的 |
数据来源:GitHub Trending(2026 年 5 月 16 日 - 22 日),各项目 README 及基准测试数据本内容基于 GitHub 公开数据分析,仅供参考
夜雨聆风