乐于分享
好东西不私藏

GitHub AI 热榜 | 5月18日:微软亲自下场教Agent,情报界GitHub和全CLI化来了

GitHub AI 热榜 | 5月18日:微软亲自下场教Agent,情报界GitHub和全CLI化来了

今天的 GitHub AI 热榜,Skills 框架依然占据半壁江山,CodeGraph 连续第二天霸榜。但真正让我兴奋的,是榜单中三个指向不同方向的新面孔:微软终于亲自下场教你怎么从零构建 AI Agent;一个被称为“情报界 GitHub”的项目,把全球 60+ 实时数据流变成了一张 AI 可交互的暗网地图;港大团队用一个 7 阶段自动化流水线,让世界上所有软件都变成 Agent 能直接操控的 CLI 工具。


三巨头速览(常态化的 Skills 生态)

🥇 CodeGraph+857⭐→ Claude Code 的预建代码知识图谱,让 Agent 少做 94% 的重复搜索,速度提升 82%。连续两天登顶。(昨天我们完整拆解过

🥈 scientific-agent-skills+762⭐→ 为 Agent 装上“科学家大脑”的 135 个科研技能包,连续多日在榜。(往期有详解)

🥉 微软 AI Agents for Beginners+485⭐→ 微软官方出品的零基础 AI Agent 开发课程,12 节课覆盖从概念到生产部署的完整链路。今天重点之一。

想看 CodeGraph 和 scientific-agent-skills 的完整解读,直接翻前两天的推送。今天的聚光灯打在三个各具特色的新项目上。


今日新星:第3、4、5名深度解读

🥉 微软 AI Agents for Beginners — 5 万星 Agent 入门课的“正确打开方式”

⭐ +485(总 Star 已破 5 万) | microsoft/ai-agents-for-beginners

在满世界都在教你“调用 API 搭 Agent”的今天,微软亲自下场了。

这个项目是微软官方出品的一套 AI Agent 零基础课程,目前 GitHub Star 已超过 5 万,配有完整的文章、视频、代码和中文翻译。12 节课覆盖了从概念入门、设计模式、工具调用、RAG、多 Agent 协作、元认知,到生产部署、协议标准、浏览器操控的完整链路

但有一个有意思的现象:转发这门课的开发者不少,真正看完的极少。大多数人点个星标,然后继续回去写自己的代码

这门课到底讲什么?

课程的架构是“三段式递进”:先建立概念基础,再拆解核心设计模式(工具调用、Agentic RAG、多 Agent 协作),最后进入工程化与前沿(元认知、MCP 协议、生产部署)

其中最有价值的是“设计模式”模块——它不讲“用哪个框架”,而是讲“Agent 在面对一个问题时,应该怎么思考、怎么规划、怎么调用工具”。这是一种可迁移的思维框架,不管你用 LangChain、AutoGen 还是 Semantic Kernel,都能用上

测试工程师的意外收获

一位测试工程师在学完课程后分享了一个很有启发性的视角:传统测试面对的是“确定性行为”——输入 A 应该输出 B。但 Agent 面对同一个问题,有时候查订单表,有时候查物流表,有时候还反问用户。“正确行为”的标准都定不下来

这门课的第 4、5、8 课恰好给出了解决这个问题的工具:

  • 第 4 课(工具调用):拆解了 Agent 调用 API、数据库、代码时的故障模式清单——选错工具、传错参数、工具超时处理等

  • 第 5 课(Agentic RAG):揭示了 Agent 在检索和推理之间的交互逻辑——什么条件下会发起二次检索?检索结果与已有知识冲突时谁优先?

  • 第 8 课(多 Agent 协作):展示了 Agent 间的通信机制,可以把每个 Agent 当作一个微服务来做契约测试

一句话价值:这可能是目前最系统、最权威、最“零基础友好”的 AI Agent 入门路径。不仅是开发者的必修课,也是测试工程师和产品经理理解“AI 时代软件怎么测、怎么管”的最佳起点。

适合谁:所有想系统学习 AI Agent 开发的初学者;需要评估 Agent 系统质量的测试工程师;以及想理解 Agent 技术边界的非技术角色。

📌 课程配有中文翻译,访问 GitHub 仓库即可开始。12 节课,每节配有图文教程、视频讲解和可运行代码。


🏅 Shadowbroker — 开源情报界的 GitHub,一键掌握全球动向
⭐ +333BigBodyCobain/Shadowbroker

有没有想过,像电影里的顶级特工一样,在布满卫星影像的屏幕上实时追踪全球的飞机、船只、地震和冲突地带?

Shadowbroker 把这个幻想变成了开源现实。

这是一个免费的 OSINT(开源情报)工具,能把全球范围内的飞机位置、船舶航行、GPS 干扰区域和冲突地带,全部叠加在一张交互式卫星地图上实时展示

它不仅“看着酷”,更是一个正经的情报分析平台

Shadowbroker 聚合了 60+ 个公共情报数据流,覆盖多个领域:企业/私人飞机的位置追踪、间谍卫星轨道、地震事件、冲突地区实时态势等。它不是把数据丢在地图上就完了——它是一个本地优先的交互式地理空间情报仪表盘,面向分析师、研究者和调查人员设计

最让人兴奋的是它的 AI Agent 集成能力。Shadowbroker 内置了 HMAC 签名的 Agent 命令通道,支持 OpenClaw 和任何遵循该协议的 Agent(Claude、GPT、LangChain、自定义 Agent)自动运行研究任务。你可以让 AI 帮你盯着某个区域,一旦出现异常信号就自动分析关联事件并生成报告。

一个有趣的插曲:项目名字的由来

项目的名字来源于《质量效应 2》中的角色“Shadow Broker”(影子经纪人)。创始人最初的想法很简单:“能用赛博朋克风格的 UI 追踪 Elon Musk 的行踪,那也太酷了。”由于名字敏感,项目在 GitHub 上的页面曾被短暂删除,目前正在与 GitHub 运营团队沟通恢复中

一句话价值:它是目前最全面的开源全球态势感知平台,也是 AI Agent 进入情报分析领域的最佳试验场。

适合谁:安全分析师、调查记者、地缘政治研究者、航运/航空行业从业者,以及对“用 AI 看懂世界”感兴趣的每个人。

⚠️ 项目涉及大量实时数据流,部署有一定复杂度。建议先在本地环境跑通 Demo,再逐步扩展到生产部署。


🏅 CLI-Anything — 一行命令,让全世界所有软件变成 Agent 原生工具

⭐ +238(总 Star 已超 28,000) | HKUDS/CLI-Anything

这是今天三个项目里,最让我感到“未来已来”的一个。

香港大学数据科学实验室的团队发现了一个关键瓶颈:AI Agent 很擅长推理,但调不动真正的专业软件。想让 Claude 帮你用 Blender 渲个图、用 GIMP 批处理图片、用 LibreOffice 出一份 PDF,目前只有两条路——要么搞 UI 自动化截图点击(脆、慢、动不动就挂),要么为每个软件手写 Python 封装(贵、重复造轮子)

CLI-Anything 给出了第三条路:把任意软件的源码丢给它,它自动生成一套完整的命令行接口。

7 阶段全自动流水线

它的工作方式非常优雅:你把一个软件的代码仓库(本地路径或 GitHub 链接)交给它,它跑一条 7 阶段流水线,吐出一个带 Click、REPL、--json输出的完整 Python CLI,并自动写好测试、发布到 PATH

七个阶段分别是:分析源码 → 设计命令组 → 实现 CLI → 规划测试 → 写测试 → 写文档 → 打包发布,全过程自动运行,中间不需要人工干预

用 Claude Code 的话,两行命令就能开始:先安装插件,然后 /cli-anything:cli-anything ./软件目录,或直接丢 GitHub 仓库地址

几个关键设计决策

CLI-Anything 有几个选择非常硬核,让它区别于其他“给 AI 补工具”的方案:

  1. 不做替代实现,直接调用真实软件。生成的 CLI 不是用 Pillow 重新实现一个 GIMP,而是调用 GIMP 真正的 Script-Fu 后端;不是自己渲 3D,而是启动一个 blender --background进程。依赖缺了不降级、不 fallback,测试直接失败——这意味着生成的能力和原生软件完全对齐。

  2. 每个 CLI 自带 SKILL.md。装进 Python 包里,REPL 启动时横幅会直接打出这个文件的绝对路径,Agent 一看就知道去哪读使用指南。pip install完不需要再配置任何东西

  3. 所有命令天生支持 --json。REPL 模式给人看,JSON 模式给 Agent 看,互不打扰

  4. CLI-Hub 元技能。装一个 cli-anything-hub元技能后,Agent 可以自己浏览官方注册表,看 20 多个现成的 CLI,按任务需要自己 pip install,装完再去读那个 CLI 的 SKILL.md。你只要说“用 CLI-Hub 里合适的工具完成 X”,剩下的它自己搞定

已经跑通了哪些软件?

目前专业验证过的软件有 16+ 个,每个都带真实后端和完整测试,合计 2130 个测试,100% 通过率

  • 创作类:Blender(208 测试)、GIMP(107)、Inkscape(202)、Krita、Audacity(161)

  • 办公类:LibreOffice(158)、Zotero、Mubu(96)

  • 视频/直播:OBS Studio(153)、Kdenlive(155)、Shotcut(154)

  • 游戏:Godot Engine(24)、Slay the Spire II

  • 图表Draw.io(138)、Mermaid(10)

  • AI 生态:ComfyUI(70)、Ollama(98)、NotebookLM(21)

  • 通信:Zoom(22)

测试分三层验证:unit test、用真实后端跑的 E2E test、subprocess.run 调用装好的命令验证

局限性也很坦诚

README 里自己列了三条限制:一是依赖前沿模型(建议 Claude Opus 4.6、Sonnet 4.6、GPT-5.4 这一档),小模型生成的 CLI 质量会明显下降;二是依赖开源源码,只有二进制的闭源软件效果差很多;三是往往需要多轮 /refine迭代才能覆盖所有常用路径

一句话价值:这是打通“AI 能想”与“AI 能做”之间最后一公里的基础设施级项目。它的意义不在于今天能生成多少 CLI,而在于定义了一种让所有软件变成 Agent 原生工具的标准路径。

适合谁:所有需要让 AI Agent 操作专业软件的开发者、内容创作者、运维工程师;以及任何对“人机交互的下一个范式”感兴趣的技术前瞻者。


今天的信号:Agent 生态正在长出“躯干”

把微软的入门教程、Shadowbroker 和 CLI-Anything 放在一起看,会发现一个清晰的图景:

  • AI Agents for Beginners解决的是“人怎么入门”——让更多人能进入 Agent 开发的世界,是生态的入口和底座。

  • Shadowbroker解决的是“Agent 怎么感知世界”——把全球实时数据变成 Agent 可查询、可分析的情报来源,是 Agent 的“感官系统”。

  • CLI-Anything解决的是“Agent 怎么操控世界”——让所有软件变成 Agent 原生工具,是 Agent 的“手和脚”。

这三件事,恰好构成了一个完整 Agent 生态的三层:学习入口 → 感官系统 → 行动系统。加上已经在榜单上固化下来的 Skills 框架(Agent 的“思维方式”)和 agentmemory(Agent 的“记忆系统”),一个完整的 Agent 技术栈正在我们眼前快速成型。

这是 GitHub AI 热榜连续更新的第 N 天,感谢你的持续关注。如果觉得今天的内容有帮助,欢迎转发给身边对 AI Agent 感兴趣的朋友。

你最想看以上哪个项目的深度实战拆解?留言告诉我,下期立刻安排。

GitHub AI 热榜 | 5月17日:Skills 热潮稍息,CodeGraph 给 Agent 装上了“代码地图”
GitHub AI 热榜 | 5月16日:Skills 生态正式确立,NotebookLM 与 n8n 的 AI 桥梁也已通车
GitHub AI 热榜 | 5月15日:Y Combinator 总裁的“软件工厂”开源了
GitHub AI 热榜 | 5月14日:Skills 热潮延续,Agent 学会了“看屏幕”和“做科研”
GitHub AI 热榜 | 5月13日:TypeScript 之神的技能包来了,Agent 终于学会“过脑子”