
今天的 GitHub 热榜被 AI Agent 生态彻底占领。从上下文压缩到记忆引擎,从终端 Agent 到性能优化系统,几乎每个上榜项目都在回答同一个问题——怎么让 AI 干活干得更好。7 个项目日涨星全部破千,来看看都有谁。
1 MarkItDown —— 微软的万能文档转换器 连续霸榜
总星标 141,815 | 今日新增 3,618 | Python
项目地址:https://github.com/microsoft/markitdown
微软这个项目已经连续多天霸占热榜第一了,今天又涨了 3600 多星,累计已经突破 14 万。
MarkItDown 做的事情非常直白:把你手头的任何文件转成干净的 Markdown。听起来简单,但当你需要把一堆 PDF、Word、Excel、PPT、图片甚至音频批量喂给大模型的时候,格式转换是最让人抓狂的一环。MarkItDown 把这个环节一步到位地解决了。
核心能力:
- 格式覆盖极广:PDF、Word、Excel、PPT、HTML、图片(OCR)、音频(转录)、ZIP(递归处理)、CSV、JSON、XML 全部支持
- 用法极简:命令行一行搞定
markitdown path-to-file.pdf > output.md,也可以作为 Python 库直接调用
- 为 LLM 而生:输出的 Markdown 格式对大模型友好,天然适配 RAG 和 Agent 场景
- 可扩展架构:支持自定义转换插件,按需扩展新格式
一句话评价:给 AI 喂文档的"标准预处理器",14 万星不是虚的。
2 Hermes WebUI —— 让 AI Agent 记住你是谁的 Web 界面
总星标 12,765 | 今日新增 1,722 | Python
项目地址:https://github.com/nesquena/hermes-webui
大多数 AI 工具每次对话都从零开始,不记得你是谁、之前做过什么、项目有哪些约定。Hermes 不一样——它是一个自托管的长期记忆 Agent,而 Hermes WebUI 就是它的浏览器界面。
这个 WebUI 和 Hermes CLI 完全对等,终端里能做的事,浏览器里一样能做。三栏布局、暗色主题、流式响应、文件浏览器,开箱即用。
核心亮点:
- 持久记忆:用户画像、Agent 笔记、技能系统自动保存,跨会话自动召回
- 自托管定时任务:支持 cron 调度,离线也能自动执行任务并把结果推送到 Telegram、Discord、Slack 等 10+ 平台
- 自我进化的技能系统:Hermes 会从使用经验中自动提炼和保存可复用的技能,不需要你安装插件
- 全平台支持:接入 OpenAI、Anthropic、Google、DeepSeek 等多家模型,不绑定任何一家
- 能调度其他 Agent:可以派 Claude Code 或 Codex 去干重活,结果自动汇入记忆
一句话评价:别的 AI 工具每次见面都当你是陌生人,Hermes 记得你所有的习惯和偏好。
3 ECC —— 让你的 AI Agent 性能翻倍的操作系统
总星标 204,552 | 今日新增 1,533 | JavaScript
项目地址:https://github.com/affaan-m/ECC
20 万星的怪物级项目。ECC 不是一个简单的配置文件集合,而是一套完整的 Agent 性能优化系统——技能、本能、记忆、安全扫描、持续学习全都包了。
它横跨 Claude Code、Codex、Cursor、OpenCode、Gemini、Zed、GitHub Copilot 等 7 大编程 Agent 平台,一套系统统一管理。经过 10 个月的密集实战迭代,目前包含 63 个专业子 Agent、249 个技能和 79 个命令。
核心能力:
- 跨平台统一:一套配置打通 Claude Code、Cursor、Codex 等所有主流 Agent,不用给每个工具单独调优
- Token 优化:模型选择策略、系统提示词瘦身、后台进程管理,减少不必要的 Token 消耗
- 记忆持久化:Hook 机制自动在会话间保存和加载上下文,Agent 不会每次都失忆
- 持续学习:自动从历史会话中提炼模式,生成可复用的技能
- 安全扫描:内置 AgentShield 安全扫描,1282 条测试、102 条规则
一句话评价:给你的 AI 编程助手装上涡轮增压器,从"能用"变成"好用"。
4 Headroom —— 一刀砍掉 60-95% 的 Token 消耗
总星标 7,511 | 今日新增 1,265 | Python
项目地址:https://github.com/chopratejas/headroom
Agent 时代最贵的资源是什么?Token。Headroom 做的就是在数据到达 LLM 之前先压缩一遍——工具输出、日志、RAG 结果、文件内容、对话历史,全都压。
实测效果:10,144 个 Token 压缩到 1,260 个,答案质量不变。省钱又提速,何乐不为。
四种使用方式:
- Python/TS 库:
compress(messages)一行代码内联到你的应用
- 代理模式:
headroom proxy --port 8787,零代码改动拦截压缩
- Agent 包装:
headroom wrap claude|codex|cursor一条命令搞定
- MCP 服务器:提供
headroom_compress、headroom_retrieve等工具,任何 MCP 客户端可用
6 种压缩算法按内容类型自动路由:JSON 走 SmartCrusher、代码走 AST 压缩、文本走 Kompress 模型。数据全程留在本地,原始内容不删除,LLM 需要时可随时取回。
一句话评价:给 Agent 的输入管道加个"脱水机",账单立刻好看一大截。
5 Scrapling —— 反爬对抗时代的全自动爬虫
总星标 59,504 | 今日新增 1,182 | Python
项目地址:https://github.com/D4Vinci/Scrapling
如果你还在用 requests + BeautifulSoup 手动拼爬虫,可以考虑升级了。Scrapling 是一个自适应的爬虫框架,从单次请求到大规模采集全覆盖。
它解决的核心问题是:网站越来越难爬了。反指纹、JS 渲染、验证码、动态加载——传统方案一个个手动处理效率太低。Scrapling 把这些全自动化了。
核心能力:
- 反检测:自动处理浏览器指纹识别、JavaScript 渲染、验证码等反爬手段
- 自适应选择器:网页结构变了,它能自动调整元素定位策略,不用你重写选择器
- 高性能:内置连接池和并发控制,支持同步和异步两种 API
- 智能解析:CSS 选择器、XPath、文本搜索多种定位方式,还支持 Session 管理和 Cookie 持久化
一句话评价:爬虫界的"自动挡变速箱",让你专注于数据而不是对抗反爬。
6 VoxCPM —— 不需要分词器的多语言语音合成
总星标 25,330 | 今日新增 783 | Python
项目地址:https://github.com/OpenBMB/VoxCPM
来自清华 OpenBMB 团队的语音合成项目。VoxCPM2 最大的技术突破是 Tokenizer-Free——跳过分词器,直接在原始音频上建模。
跳过分词器意味着什么?更自然的韵律、更精细的风格控制、更好的多语言混合效果。传统 TTS 的"机器味"很大一部分来自分词器对音频的粗糙切割,VoxCPM2 绕过了这个瓶颈。
核心能力:
- 声音克隆:给一段参考音频,就能生成同样音色的语音
- 风格可控:语速、情感、语调都能精细调节
- 多语言支持:中英日等多语种混合生成,切换自然
- 创意语音设计:用文字描述你想要的声音风格,模型自动生成
提供 WebUI 和 API 两种使用方式,支持接入 OpenAI 兼容客户端。
一句话评价:TTS 赛道的"去分词器"革命,让机器说话终于不再像机器。
7 SuperMemory —— AI 时代的记忆引擎
总星标 24,832 | 今日新增 680 | TypeScript
项目地址:https://github.com/supermemoryai/supermemory
你有没有这种体验?跟 AI 聊了半小时的项目需求,关掉窗口再打开,它什么都不记得了。SuperMemory 就是来解决这个问题的。
它是一个记忆和上下文引擎,在 LongMemEval、LoCoMo、ConvoMem 三大 AI 记忆基准测试中排名第一。不只是简单的向量存储,而是一套完整的记忆系统。
核心能力:
- 自动记忆:从对话中自动提取事实,处理时间变化、矛盾信息和过期内容
- 用户画像:自动维护用户上下文,稳定事实加近期活动,单次调用约 50ms
- 混合搜索:RAG 和记忆在同一个查询中完成,知识库文档和个性化上下文一起返回
- 多模态提取:PDF、图片(OCR)、视频(转录)、代码(AST 感知分块),上传即用
- 丰富的连接器:Google Drive、Gmail、Notion、OneDrive、GitHub 自动同步
提供 npm 和 pip 双端 SDK,支持 MCP 协议一键接入 Claude、Cursor 等工具。
一句话评价:让 AI 拥有长期记忆的基础设施,不再每次对话都是初次见面。
今日趋势总结

| Agent 基础设施全面爆发 | |
| 跨平台统一管理成刚需 | |
| 记忆能力成为新战场 | |
| 微软基础工具持续强势 | |
| TTS 技术路线革新 |
互动话题
今天这七个项目几乎全是围绕"让 AI Agent 更好用"展开的。你现在日常用的 AI 编程工具是什么?有没有碰到过 Agent 频繁"失忆"或者 Token 消耗太快的痛点?欢迎在评论区聊聊你的经历和解决方案。
如果觉得有用,别忘了点赞、在看、转发三连,让更多人看到
关注我,每天为你精选 GitHub 热门开源项目,不错过技术圈的每一个新动向。
夜雨聆风