GitHub AI 热榜 | 5月18日:微软亲自下场教Agent,情报界GitHub和全CLI化来了
今天的 GitHub AI 热榜,Skills 框架依然占据半壁江山,CodeGraph 连续第二天霸榜。但真正让我兴奋的,是榜单中三个指向不同方向的新面孔:微软终于亲自下场教你怎么从零构建 AI Agent;一个被称为“情报界 GitHub”的项目,把全球 60+ 实时数据流变成了一张 AI 可交互的暗网地图;港大团队用一个 7 阶段自动化流水线,让世界上所有软件都变成 Agent 能直接操控的 CLI 工具。
🥇 CodeGraph+857⭐→ Claude Code 的预建代码知识图谱,让 Agent 少做 94% 的重复搜索,速度提升 82%。连续两天登顶。(昨天我们完整拆解过)
🥈 scientific-agent-skills+762⭐→ 为 Agent 装上“科学家大脑”的 135 个科研技能包,连续多日在榜。(往期有详解)
🥉 微软 AI Agents for Beginners+485⭐→ 微软官方出品的零基础 AI Agent 开发课程,12 节课覆盖从概念到生产部署的完整链路。今天重点之一。
想看 CodeGraph 和 scientific-agent-skills 的完整解读,直接翻前两天的推送。今天的聚光灯打在三个各具特色的新项目上。
🥉 微软 AI Agents for Beginners — 5 万星 Agent 入门课的“正确打开方式”
⭐ +485(总 Star 已破 5 万) | microsoft/ai-agents-for-beginners

在满世界都在教你“调用 API 搭 Agent”的今天,微软亲自下场了。
这个项目是微软官方出品的一套 AI Agent 零基础课程,目前 GitHub Star 已超过 5 万,配有完整的文章、视频、代码和中文翻译。12 节课覆盖了从概念入门、设计模式、工具调用、RAG、多 Agent 协作、元认知,到生产部署、协议标准、浏览器操控的完整链路。
但有一个有意思的现象:转发这门课的开发者不少,真正看完的极少。大多数人点个星标,然后继续回去写自己的代码。
这门课到底讲什么?
课程的架构是“三段式递进”:先建立概念基础,再拆解核心设计模式(工具调用、Agentic RAG、多 Agent 协作),最后进入工程化与前沿(元认知、MCP 协议、生产部署)。
其中最有价值的是“设计模式”模块——它不讲“用哪个框架”,而是讲“Agent 在面对一个问题时,应该怎么思考、怎么规划、怎么调用工具”。这是一种可迁移的思维框架,不管你用 LangChain、AutoGen 还是 Semantic Kernel,都能用上。
测试工程师的意外收获
一位测试工程师在学完课程后分享了一个很有启发性的视角:传统测试面对的是“确定性行为”——输入 A 应该输出 B。但 Agent 面对同一个问题,有时候查订单表,有时候查物流表,有时候还反问用户。“正确行为”的标准都定不下来。
这门课的第 4、5、8 课恰好给出了解决这个问题的工具:
-
第 4 课(工具调用):拆解了 Agent 调用 API、数据库、代码时的故障模式清单——选错工具、传错参数、工具超时处理等
-
第 5 课(Agentic RAG):揭示了 Agent 在检索和推理之间的交互逻辑——什么条件下会发起二次检索?检索结果与已有知识冲突时谁优先?
-
第 8 课(多 Agent 协作):展示了 Agent 间的通信机制,可以把每个 Agent 当作一个微服务来做契约测试
一句话价值:这可能是目前最系统、最权威、最“零基础友好”的 AI Agent 入门路径。不仅是开发者的必修课,也是测试工程师和产品经理理解“AI 时代软件怎么测、怎么管”的最佳起点。
适合谁:所有想系统学习 AI Agent 开发的初学者;需要评估 Agent 系统质量的测试工程师;以及想理解 Agent 技术边界的非技术角色。
📌 课程配有中文翻译,访问 GitHub 仓库即可开始。12 节课,每节配有图文教程、视频讲解和可运行代码。

有没有想过,像电影里的顶级特工一样,在布满卫星影像的屏幕上实时追踪全球的飞机、船只、地震和冲突地带?
Shadowbroker 把这个幻想变成了开源现实。
这是一个免费的 OSINT(开源情报)工具,能把全球范围内的飞机位置、船舶航行、GPS 干扰区域和冲突地带,全部叠加在一张交互式卫星地图上实时展示。
它不仅“看着酷”,更是一个正经的情报分析平台
Shadowbroker 聚合了 60+ 个公共情报数据流,覆盖多个领域:企业/私人飞机的位置追踪、间谍卫星轨道、地震事件、冲突地区实时态势等。它不是把数据丢在地图上就完了——它是一个本地优先的交互式地理空间情报仪表盘,面向分析师、研究者和调查人员设计。
最让人兴奋的是它的 AI Agent 集成能力。Shadowbroker 内置了 HMAC 签名的 Agent 命令通道,支持 OpenClaw 和任何遵循该协议的 Agent(Claude、GPT、LangChain、自定义 Agent)自动运行研究任务。你可以让 AI 帮你盯着某个区域,一旦出现异常信号就自动分析关联事件并生成报告。
一个有趣的插曲:项目名字的由来
项目的名字来源于《质量效应 2》中的角色“Shadow Broker”(影子经纪人)。创始人最初的想法很简单:“能用赛博朋克风格的 UI 追踪 Elon Musk 的行踪,那也太酷了。”由于名字敏感,项目在 GitHub 上的页面曾被短暂删除,目前正在与 GitHub 运营团队沟通恢复中。
一句话价值:它是目前最全面的开源全球态势感知平台,也是 AI Agent 进入情报分析领域的最佳试验场。
适合谁:安全分析师、调查记者、地缘政治研究者、航运/航空行业从业者,以及对“用 AI 看懂世界”感兴趣的每个人。
⚠️ 项目涉及大量实时数据流,部署有一定复杂度。建议先在本地环境跑通 Demo,再逐步扩展到生产部署。
⭐ +238(总 Star 已超 28,000) | HKUDS/CLI-Anything

这是今天三个项目里,最让我感到“未来已来”的一个。
香港大学数据科学实验室的团队发现了一个关键瓶颈:AI Agent 很擅长推理,但调不动真正的专业软件。想让 Claude 帮你用 Blender 渲个图、用 GIMP 批处理图片、用 LibreOffice 出一份 PDF,目前只有两条路——要么搞 UI 自动化截图点击(脆、慢、动不动就挂),要么为每个软件手写 Python 封装(贵、重复造轮子)。
CLI-Anything 给出了第三条路:把任意软件的源码丢给它,它自动生成一套完整的命令行接口。
7 阶段全自动流水线
它的工作方式非常优雅:你把一个软件的代码仓库(本地路径或 GitHub 链接)交给它,它跑一条 7 阶段流水线,吐出一个带 Click、REPL、--json输出的完整 Python CLI,并自动写好测试、发布到 PATH。
七个阶段分别是:分析源码 → 设计命令组 → 实现 CLI → 规划测试 → 写测试 → 写文档 → 打包发布,全过程自动运行,中间不需要人工干预。
用 Claude Code 的话,两行命令就能开始:先安装插件,然后 /cli-anything:cli-anything ./软件目录,或直接丢 GitHub 仓库地址。
几个关键设计决策
CLI-Anything 有几个选择非常硬核,让它区别于其他“给 AI 补工具”的方案:
-
不做替代实现,直接调用真实软件。生成的 CLI 不是用 Pillow 重新实现一个 GIMP,而是调用 GIMP 真正的 Script-Fu 后端;不是自己渲 3D,而是启动一个
blender --background进程。依赖缺了不降级、不 fallback,测试直接失败——这意味着生成的能力和原生软件完全对齐。 -
每个 CLI 自带 SKILL.md。装进 Python 包里,REPL 启动时横幅会直接打出这个文件的绝对路径,Agent 一看就知道去哪读使用指南。
pip install完不需要再配置任何东西。 -
所有命令天生支持
--json。REPL 模式给人看,JSON 模式给 Agent 看,互不打扰。 -
CLI-Hub 元技能。装一个
cli-anything-hub元技能后,Agent 可以自己浏览官方注册表,看 20 多个现成的 CLI,按任务需要自己pip install,装完再去读那个 CLI 的 SKILL.md。你只要说“用 CLI-Hub 里合适的工具完成 X”,剩下的它自己搞定。
已经跑通了哪些软件?
目前专业验证过的软件有 16+ 个,每个都带真实后端和完整测试,合计 2130 个测试,100% 通过率:
-
创作类:Blender(208 测试)、GIMP(107)、Inkscape(202)、Krita、Audacity(161)
-
办公类:LibreOffice(158)、Zotero、Mubu(96)
-
视频/直播:OBS Studio(153)、Kdenlive(155)、Shotcut(154)
-
游戏:Godot Engine(24)、Slay the Spire II
-
图表:Draw.io(138)、Mermaid(10)
-
AI 生态:ComfyUI(70)、Ollama(98)、NotebookLM(21)
-
通信:Zoom(22)
测试分三层验证:unit test、用真实后端跑的 E2E test、subprocess.run 调用装好的命令验证。
局限性也很坦诚
README 里自己列了三条限制:一是依赖前沿模型(建议 Claude Opus 4.6、Sonnet 4.6、GPT-5.4 这一档),小模型生成的 CLI 质量会明显下降;二是依赖开源源码,只有二进制的闭源软件效果差很多;三是往往需要多轮 /refine迭代才能覆盖所有常用路径。
一句话价值:这是打通“AI 能想”与“AI 能做”之间最后一公里的基础设施级项目。它的意义不在于今天能生成多少 CLI,而在于定义了一种让所有软件变成 Agent 原生工具的标准路径。
适合谁:所有需要让 AI Agent 操作专业软件的开发者、内容创作者、运维工程师;以及任何对“人机交互的下一个范式”感兴趣的技术前瞻者。
把微软的入门教程、Shadowbroker 和 CLI-Anything 放在一起看,会发现一个清晰的图景:
-
AI Agents for Beginners解决的是“人怎么入门”——让更多人能进入 Agent 开发的世界,是生态的入口和底座。
-
Shadowbroker解决的是“Agent 怎么感知世界”——把全球实时数据变成 Agent 可查询、可分析的情报来源,是 Agent 的“感官系统”。
-
CLI-Anything解决的是“Agent 怎么操控世界”——让所有软件变成 Agent 原生工具,是 Agent 的“手和脚”。
这三件事,恰好构成了一个完整 Agent 生态的三层:学习入口 → 感官系统 → 行动系统。加上已经在榜单上固化下来的 Skills 框架(Agent 的“思维方式”)和 agentmemory(Agent 的“记忆系统”),一个完整的 Agent 技术栈正在我们眼前快速成型。
这是 GitHub AI 热榜连续更新的第 N 天,感谢你的持续关注。如果觉得今天的内容有帮助,欢迎转发给身边对 AI Agent 感兴趣的朋友。
你最想看以上哪个项目的深度实战拆解?留言告诉我,下期立刻安排。
夜雨聆风