6月3日GitHub热榜 AI Agent工具集体爆发七个项目日涨都过千星

今天的 GitHub 热榜被 AI Agent 生态彻底占领。从上下文压缩到记忆引擎，从终端 Agent 到性能优化系统，几乎每个上榜项目都在回答同一个问题——怎么让 AI 干活干得更好。7 个项目日涨星全部破千，来看看都有谁。

1 MarkItDown —— 微软的万能文档转换器连续霸榜

总星标 141,815 | 今日新增 3,618 | Python

项目地址：https://github.com/microsoft/markitdown

微软这个项目已经连续多天霸占热榜第一了，今天又涨了 3600 多星，累计已经突破 14 万。

MarkItDown 做的事情非常直白：把你手头的任何文件转成干净的 Markdown。听起来简单，但当你需要把一堆 PDF、Word、Excel、PPT、图片甚至音频批量喂给大模型的时候，格式转换是最让人抓狂的一环。MarkItDown 把这个环节一步到位地解决了。

核心能力：

格式覆盖极广：PDF、Word、Excel、PPT、HTML、图片（OCR）、音频（转录）、ZIP（递归处理）、CSV、JSON、XML 全部支持

用法极简：命令行一行搞定 markitdown path-to-file.pdf > output.md，也可以作为 Python 库直接调用

为 LLM 而生：输出的 Markdown 格式对大模型友好，天然适配 RAG 和 Agent 场景

可扩展架构：支持自定义转换插件，按需扩展新格式

一句话评价：给 AI 喂文档的"标准预处理器"，14 万星不是虚的。

2 Hermes WebUI —— 让 AI Agent 记住你是谁的 Web 界面

总星标 12,765 | 今日新增 1,722 | Python

项目地址：https://github.com/nesquena/hermes-webui

大多数 AI 工具每次对话都从零开始，不记得你是谁、之前做过什么、项目有哪些约定。Hermes 不一样——它是一个自托管的长期记忆 Agent，而 Hermes WebUI 就是它的浏览器界面。

这个 WebUI 和 Hermes CLI 完全对等，终端里能做的事，浏览器里一样能做。三栏布局、暗色主题、流式响应、文件浏览器，开箱即用。

核心亮点：

持久记忆：用户画像、Agent 笔记、技能系统自动保存，跨会话自动召回

自托管定时任务：支持 cron 调度，离线也能自动执行任务并把结果推送到 Telegram、Discord、Slack 等 10+ 平台

自我进化的技能系统：Hermes 会从使用经验中自动提炼和保存可复用的技能，不需要你安装插件

全平台支持：接入 OpenAI、Anthropic、Google、DeepSeek 等多家模型，不绑定任何一家

能调度其他 Agent：可以派 Claude Code 或 Codex 去干重活，结果自动汇入记忆

一句话评价：别的 AI 工具每次见面都当你是陌生人，Hermes 记得你所有的习惯和偏好。

3 ECC —— 让你的 AI Agent 性能翻倍的操作系统

总星标 204,552 | 今日新增 1,533 | JavaScript

项目地址：https://github.com/affaan-m/ECC

20 万星的怪物级项目。ECC 不是一个简单的配置文件集合，而是一套完整的 Agent 性能优化系统——技能、本能、记忆、安全扫描、持续学习全都包了。

它横跨 Claude Code、Codex、Cursor、OpenCode、Gemini、Zed、GitHub Copilot 等 7 大编程 Agent 平台，一套系统统一管理。经过 10 个月的密集实战迭代，目前包含 63 个专业子 Agent、249 个技能和 79 个命令。

核心能力：

跨平台统一：一套配置打通 Claude Code、Cursor、Codex 等所有主流 Agent，不用给每个工具单独调优

Token 优化：模型选择策略、系统提示词瘦身、后台进程管理，减少不必要的 Token 消耗

记忆持久化：Hook 机制自动在会话间保存和加载上下文，Agent 不会每次都失忆

持续学习：自动从历史会话中提炼模式，生成可复用的技能

安全扫描：内置 AgentShield 安全扫描，1282 条测试、102 条规则

一句话评价：给你的 AI 编程助手装上涡轮增压器，从"能用"变成"好用"。

4 Headroom —— 一刀砍掉 60-95% 的 Token 消耗

总星标 7,511 | 今日新增 1,265 | Python

项目地址：https://github.com/chopratejas/headroom

Agent 时代最贵的资源是什么？Token。Headroom 做的就是在数据到达 LLM 之前先压缩一遍——工具输出、日志、RAG 结果、文件内容、对话历史，全都压。

实测效果：10,144 个 Token 压缩到 1,260 个，答案质量不变。省钱又提速，何乐不为。

四种使用方式：

Python/TS 库：compress(messages) 一行代码内联到你的应用

代理模式：headroom proxy --port 8787，零代码改动拦截压缩

Agent 包装：headroom wrap claude|codex|cursor 一条命令搞定

MCP 服务器：提供 headroom_compress、headroom_retrieve 等工具，任何 MCP 客户端可用

6 种压缩算法按内容类型自动路由：JSON 走 SmartCrusher、代码走 AST 压缩、文本走 Kompress 模型。数据全程留在本地，原始内容不删除，LLM 需要时可随时取回。

一句话评价：给 Agent 的输入管道加个"脱水机"，账单立刻好看一大截。

5 Scrapling —— 反爬对抗时代的全自动爬虫

总星标 59,504 | 今日新增 1,182 | Python

项目地址：https://github.com/D4Vinci/Scrapling

如果你还在用 requests + BeautifulSoup 手动拼爬虫，可以考虑升级了。Scrapling 是一个自适应的爬虫框架，从单次请求到大规模采集全覆盖。

它解决的核心问题是：网站越来越难爬了。反指纹、JS 渲染、验证码、动态加载——传统方案一个个手动处理效率太低。Scrapling 把这些全自动化了。

核心能力：

反检测：自动处理浏览器指纹识别、JavaScript 渲染、验证码等反爬手段

自适应选择器：网页结构变了，它能自动调整元素定位策略，不用你重写选择器

高性能：内置连接池和并发控制，支持同步和异步两种 API

智能解析：CSS 选择器、XPath、文本搜索多种定位方式，还支持 Session 管理和 Cookie 持久化

一句话评价：爬虫界的"自动挡变速箱"，让你专注于数据而不是对抗反爬。

6 VoxCPM —— 不需要分词器的多语言语音合成

总星标 25,330 | 今日新增 783 | Python

项目地址：https://github.com/OpenBMB/VoxCPM

来自清华 OpenBMB 团队的语音合成项目。VoxCPM2 最大的技术突破是 Tokenizer-Free——跳过分词器，直接在原始音频上建模。

跳过分词器意味着什么？更自然的韵律、更精细的风格控制、更好的多语言混合效果。传统 TTS 的"机器味"很大一部分来自分词器对音频的粗糙切割，VoxCPM2 绕过了这个瓶颈。

核心能力：

声音克隆：给一段参考音频，就能生成同样音色的语音

风格可控：语速、情感、语调都能精细调节

多语言支持：中英日等多语种混合生成，切换自然

创意语音设计：用文字描述你想要的声音风格，模型自动生成

提供 WebUI 和 API 两种使用方式，支持接入 OpenAI 兼容客户端。

一句话评价：TTS 赛道的"去分词器"革命，让机器说话终于不再像机器。

7 SuperMemory —— AI 时代的记忆引擎

总星标 24,832 | 今日新增 680 | TypeScript

项目地址：https://github.com/supermemoryai/supermemory

你有没有这种体验？跟 AI 聊了半小时的项目需求，关掉窗口再打开，它什么都不记得了。SuperMemory 就是来解决这个问题的。

它是一个记忆和上下文引擎，在 LongMemEval、LoCoMo、ConvoMem 三大 AI 记忆基准测试中排名第一。不只是简单的向量存储，而是一套完整的记忆系统。

核心能力：

自动记忆：从对话中自动提取事实，处理时间变化、矛盾信息和过期内容

用户画像：自动维护用户上下文，稳定事实加近期活动，单次调用约 50ms

混合搜索：RAG 和记忆在同一个查询中完成，知识库文档和个性化上下文一起返回

多模态提取：PDF、图片（OCR）、视频（转录）、代码（AST 感知分块），上传即用

丰富的连接器：Google Drive、Gmail、Notion、OneDrive、GitHub 自动同步

提供 npm 和 pip 双端 SDK，支持 MCP 协议一键接入 Claude、Cursor 等工具。

一句话评价：让 AI 拥有长期记忆的基础设施，不再每次对话都是初次见面。

今日趋势总结

正在从锦上添花变成必备功能

趋势	说明
Agent 基础设施全面爆发	从压缩（Headroom）到记忆（SuperMemory），开发者正在疯狂补齐 Agent 生态的基础设施短板
跨平台统一管理成刚需	ECC 的 20 万星说明一个问题——Agent 工具太多了，开发者迫切需要一套统一的管理和优化方案
记忆能力成为新战场	Hermes 和 SuperMemory 同时上榜，"让 AI 记

微软基础工具持续强势	MarkItDown 连续多日霸榜，文档预处理这个看似不起眼的环节，恰恰是 AI 落地最卡脖子的地方
TTS 技术路线革新	VoxCPM2 的 Tokenizer-Free 路线可能开辟语音合成新范式

互动话题

今天这七个项目几乎全是围绕"让 AI Agent 更好用"展开的。你现在日常用的 AI 编程工具是什么？有没有碰到过 Agent 频繁"失忆"或者 Token 消耗太快的痛点？欢迎在评论区聊聊你的经历和解决方案。

如果觉得有用，别忘了点赞、在看、转发三连，让更多人看到

关注我，每天为你精选 GitHub 热门开源项目，不错过技术圈的每一个新动向。

1 MarkItDown —— 微软的万能文档转换器 连续霸榜

2 Hermes WebUI —— 让 AI Agent 记住你是谁的 Web 界面

3 ECC —— 让你的 AI Agent 性能翻倍的操作系统

4 Headroom —— 一刀砍掉 60-95% 的 Token 消耗

5 Scrapling —— 反爬对抗时代的全自动爬虫

6 VoxCPM —— 不需要分词器的多语言语音合成

7 SuperMemory —— AI 时代的记忆引擎

今日趋势总结

互动话题

1 MarkItDown —— 微软的万能文档转换器连续霸榜