GitHub AI 热榜 | 5月19日:Skills 生态一周回顾,Agent 的＂学术大脑＂＂工程宪法＂＂零成本投研＂齐上阵

今天的 GitHub AI 热榜虽然被 Skills 框架继续霸占，但出现了三个指向完全不同方向的新面孔：一个把整条学术论文流水线压缩成 4 个 Claude Code 命令，一个用 12 条原则给"生产级 AI Agent"下了史上最清晰的定义，还有一个让散户实现了完全零成本、全自动的 AI 股票分析。今天只讲它们三个。

三巨头速览（Skills 生态常态化）

🥇 academic-research-skills+1,439⭐

今天最热的新项目。学术研究全流程 Claude Code Skills，4 个模块 32 个 Agent 协同，从选题到定稿一条龙。今日重点之一。

🥈 tech-leads-club/agent-skills+1,244⭐→ 安全验证的 Agent Skill 注册表，连续多日在榜。（往期有提及）

🥉 CLI-Anything+1,049⭐→ 让所有软件变成 Agent 原生的 CLI 统一接口，连续多日在榜。（昨天我们完整拆解过）

想看 CLI-Anything 和 scientific-agent-skills 的完整解读，直接翻前两天的推送。今天的聚光灯全部打在第 1、第 7 和第 9 名。

今日新星：第 1、7、9 名深度解读

🥇 academic-research-skills — 4 个技能包，32 个 Agent，一条完整的论文流水线

⭐ +1,439(总 Star 已超 6,400) | Imbad0202/academic-research-skills

这几天 Skills 框架霸榜，Agent 的技能包从工程扩展到了科研。但这个项目与其它 Skills 有一个根本性区别——它不帮你写论文，它只帮你做那些你最不想做的苦力活。

项目作者在 README 第一段就把立场摆得很清楚：

"AI is your copilot, not the pilot. This tool won't write your paper for you. It handles the grunt work — hunting down references, formatting citations, verifying data, checking logical consistency — so you can focus on the parts that actually require your brain: defining the question, choosing the method, interpreting what the data means, and writing the sentence after 'I argue that.'"

这是目前 AI 学术工具里最清醒的定位声明。不像市面上那些承诺"一键生成论文"的产品，ARS 的设计假设是：研究者本人是核心，AI 是增强器，不是替代品。

为什么坚持 Human-in-the-Loop？

作者引用了 Lu et al.（2026, Nature651:914-919）的一项关键研究：The AI Scientist——第一个通过顶会盲审的全自动 AI 研究系统，在 ICLR 2025 workshop 拿下 6.33/10 分（workshop 平均仅 4.87），听起来很震撼。但论文的 Limitations 章节列出了一串全自动 AI 科研绕不开的失败模式：实现 bug、幻觉结果、走捷径、把 bug 当 insight、编造方法论、框架锁死、引用幻觉（最致命的一条）。

ARS 的核心信念是：人类研究员 + AI 增强，比单独任何一方都更能躲过这些雷。为此，它在流水线的 Stage 2.5 和 Stage 4.5 设置了两道不可跳过的完整性闸门，运行一份 7 项 AI 失败模式强制检查清单。

更硬核的是引用核验机制。AI 写论文最忌讳引用幻觉——不只是编造不存在的文章，还包括标题相似但作者年份全错、DOI 真实但内容对不上等更隐蔽的情况。ARS 在 Deep Research 阶段就让每一篇文献都过 Semantic Scholar API 的存在性确认，并用 Levenshtein 相似度算法做模糊匹配，阈值设在 0.70 以上才算通过。

Zhao et al.（2026-05）对 arXiv、bioRxiv、SSRN 和 PMC 上 250 万篇论文中的 1.11 亿条引用做了全量审计，保守估计 2025 年一年就产生了 146,932 条幻觉引用。ARS v3.7.1 为此加入了信任链溯源标记，v3.7.3 加了三层引用锚点定位基础设施。

4 个模块，32 个 Agent 各司其职

ARS 由四个专业化 Skill 组成：

模块	Agent 数	核心功能
Deep Research	13 个	文献调研、研究问题构建、方法论设计、PRISMA 系统综述
Academic Paper	12 个	大纲设计、论证构建、草稿撰写、Style Calibration、LaTeX 加固、图表可视化
Academic Paper Reviewer	7 个	EIC + 3 动态评审 + Devil's Advocate，0-100 打分，R&R 追溯矩阵
Academic Pipeline	编排器	10 阶段全流程编排，自适应检查点，Material Passport，跨模型完整性验证

Deep Research 团队里有苏格拉底导师 Agent，通过对话引导研究者理清思路；有魔鬼代言人 Agent，专门挑刺防止思维定式；还有文献溯源 Agent，调用 Semantic Scholar API 验证每一篇引用的真实性。

Academic Paper 团队的 Style Calibration（风格校准）功能——AI 会学习你过往作品的写作风格，让输出更像你自己写的，而不是千篇一律的 AI 味。Writing Quality Check 专门抓那些一看就是机器生成的语言模式。输出格式支持 Markdown、DOCX、LaTeX，最终可编译成 APA 7.0 或 IEEE 格式的 PDF。

Academic Paper Reviewer 团队模拟真实学术期刊的评审流程：主编（EIC）带领三位领域审稿人，外加一个 Devil's Advocate，从方法论、学科视角、跨学科价值等多个维度打分。80 分以上接受，65-79 小修，50-64 大修，50 以下拒稿。审稿团队还会输出详细的修改路线图。

Academic Pipeline是流程编排器，把前三个团队串成一条 10 阶段流水线。你可以在任意阶段插入——已经有了初稿就从 Stage 2.5 开始，收到了审稿意见就从 Stage 4 切入。费用参考也很透明：一篇 1.5 万字的论文，全程跑下来大约 4-6 美元。

一句话价值：这可能是目前开源界最系统、最诚实的 AI 学术研究辅助工具。它不是帮你"水论文"的，而是帮你把精力从苦力活里解放出来、专注于真正需要脑子的部分。

适合谁：在读研究生、博士生、需要发表论文的科研工作者。Claude Code 用户尤其友好——两行命令 30 秒装好。

⚠️ 重要提醒：正如项目作者反复强调的，学术诚信是研究者的底线。ARS 的设计哲学是"AI 增强人类"，不是"AI 替代人类"。请务必遵循你所在机构和目标期刊的 AI 使用政策，论文的核心论点、方法论选择和数据分析结论必须来自你自己的专业判断。

🏅 12-factor-agents — 给"生产级 AI Agent"下定义的第一份工程宪法

⭐ +399| humanlayer/12-factor-agents

如果说 agent-skills 是教 Agent 怎么干活，那这个项目就是回答一个更根本的问题：什么样的 AI 软件才配得上"生产级"三个字？

这个项目由 HumanLayer 创始人 Dex 发起。Dex 本人是 YC F24 校友，他的 HumanLayer 是一家做人机协同 API 的公司——让 AI Agent 在执行关键操作时能向人类请求批准。他试遍了市面上所有 Agent 框架，跟大量 YC 内外的技术创始人深度交流过，然后发现了一个尴尬的事实：

市场上标榜自己是"AI Agent"的产品，大多根本不怎么 agentic。它们的核心逻辑是确定性代码，只是在几个关键节点上撒了一点 LLM 步骤来制造"魔法感"。真正的优秀 Agent，不是在框架里塞一个 prompt + 一堆工具然后让它无限循环，而是由大量常规软件工程和恰到好处的 AI 调用组成。

Dex 把这个发现提炼成了 12 条原则，致敬 Heroku 在 2011 年提出的 12-Factor App方法论——那份影响了整整一代云原生开发者的"部署宪法"。

12 条原则速览

这 12 条原则的核心主张是：Agent 也是软件。它的本质是有向图（Directed Graph），LLM 只是图中的决策节点，不是全部：

自然语言到工具调用：用自然语言描述工具，而非硬编码 API 集成
拥有你的提示词和上下文窗口：把 prompt 和 context 当成核心资产来管理
上下文工程：在 Agent 开始工作前，预先收集所有可能需要的上下文
统一执行状态和业务状态：Agent 的状态管理要像传统软件的事务一样可靠
小而聚焦的 Agent：一个 Agent 只做好一件事，而非一个"万能 Agent"包打天下
工具是 Agent 的 API 契约：工具定义要像 REST API 接口一样严格
可观测性优先：Agent 的每一步推理和工具调用都要可追踪、可审计
人在回路：关键决策点必须有人的批准机制
幂等性与重试：Agent 操作要能安全重试，不产生副作用
小模型也能派大用场：不所有任务都需要最大的模型
测试 Agent 就像测试软件：单元测试、集成测试、回归测试全部适用
持续交付：Agent 的 prompt 和工具定义要像代码一样走 CI/CD 流程

不止是理论：背后有真实战斗伤痕

这不是一篇纸上谈兵的宣言。HumanLayer 的初始方案叫 RPI（Research-Plan-Implement），大约一年前发布，被上万人下载，从小型创业公司到财富 500 强企业都在用。但实际落地过程中暴露了一大堆问题——工程师不看生成的代码、计划文档太复杂根本审不过来、prompt 里需要塞"魔法词"才能让 Agent 表现出预期的交互行为。

他们后来把 RPI 进化成了 CRISPY（Context-Research-Iterate-Structure-Plan-sYnthesize）——一个七阶段框架，把原来 85+ 条指令的巨型 prompt 拆成多个不超过 40 条指令的小阶段，并在每个阶段之间插入显式的人机对齐检查点。最终实现了可复现的 2-3 倍生产力提升，同时保持了代码质量。

这种"从第一性原理推倒重来"的做法，恰好呼应了前阵子 Karpathy 在 No Priors 播客里的表态："我大概从去年 12 月起就没亲手敲过一行代码了。"并不是说程序员要失业，而是说开发者的角色正在从"代码执行者"变成"架构决策者"。12-factor-agents 就是给这个新角色准备的工程手册。

一句话价值：这是目前最系统、最实战导向的"生产级 LLM 应用"设计原则文档。如果你的团队正在把 AI 功能推到真实用户手里，这是必读。

适合谁：技术创始人、Tech Lead、MLOps 工程师、产品经理，以及任何正在纠结"我的 AI 功能到底能不能上生产"的人。全文免费公开在 GitHub 上。

🏅 daily_stock_analysis — 散户零成本，每天自动收到 AI 股票决策仪表盘

⭐ +310| ZhuLinsen/daily_stock_analysis

前两周的热榜里，港大的 AI-Trader 连续多天在榜，说明开发者对"用 AI 搞投资"的需求非常刚性。今天这个项目，把这件事的门槛降到了零——零成本定时运行，全自动推送到你的微信/飞书/Telegram。

项目的 README 第一行就用了"纯白嫖"三个字，坦诚得可爱。

它的工作流非常直接：

多数据源行情聚合：同时拉取 A 股、港股、美股、ETF 的行情数据、K 线、技术指标、资金流、筹码分布、新闻、公告和基本面信息
LLM 决策引擎：把聚合后的数据喂给 LLM（支持 Anspire、AIHubMix、Gemini、DeepSeek、通义千问、Claude、Ollama 本地模型等），让模型生成一份"决策仪表盘"
多渠道推送：自动推送到企业微信、飞书、Telegram、Discord、Slack 或邮箱
定时运行：通过 GitHub Actions、Docker 或本地定时任务，每天自动跑

决策仪表盘包含核心结论、评分、趋势判断、买卖点位、风险警报、催化因素和操作检查清单，覆盖 15 种内置策略（均线、缠论、波浪、趋势、热点、事件、成长、预期等），还支持 Agent 多轮追问——你可以跟 AI 就某只股票进行深入讨论。

技术栈覆盖了几乎所有主流的免费或低价数据源：TickFlow、AkShare、Tushare、Pytdx、Baostock、YFinance、Longbridge 等行情数据，以及 Anspire、SerpAPI、Tavily、Bocha、Brave 等新闻搜索源。LLM 方面支持 Anspire、AIHubMix、Gemini、OpenAI 兼容接口、DeepSeek、通义千问、Claude、Ollama 本地模型等。

这个项目不追求替代专业量化交易系统——它追求的是让普通散户每天花 0 元、0 分钟，就能拿到一份 AI 生成的、有数据支撑的股票参考报告。它是帮你做信息整理和初步判断的工具，最终的买卖决策权在你手里。

一句话价值：AI 股票分析的"平民化终点"——零成本、全自动、多渠道推送，让你每天打开手机就能看到 AI 帮你整理好的市场概览。

适合谁：所有对 A 股/港股/美股感兴趣的散户投资者。不想每天花几小时盯盘、但又想有一个系统化的信息参考来源的人。

⚠️ 重要提醒：投资有风险，入市需谨慎。AI 生成的决策仪表盘仅供参考，不构成任何投资建议。股市的涨跌受千万种因素影响，AI 模型无法预测未来。请务必基于自己的研究和风险承受能力做出投资决策，切忌盲目跟单。

今天的信号：Agent 生态的"方法论层"正在成型

把今天的三个项目放在一起看，会发现它们指向 Agent 生态的三个不同层级：

学术研究 Skills：定义了 Agent 在一个垂直领域"怎么干活"——流程化、可复用、可验证
12-factor-agents：定义了 Agent 软件"怎么才算靠谱"——可靠性、可维护性、可交付给真实客户
daily_stock_analysis：把前面两者落地到了一个具体的、人人都有需求的场景里——而且零成本

这三层正好对应着 Agent 生态的"术"（具体技能）、"法"（工程原则）、"用"（落地场景）。加上前两周热榜上固化下来的 Skills 框架和 agentmemory，一个完整的 Agent 技术栈正在成型：有技能、有记忆、有原则、有落地场景。

这是 GitHub AI 热榜连续更新的第 N 天，感谢你的持续关注。如果觉得今天的内容有帮助，欢迎转发给身边在读研、在推 AI 产品上生产、或者在做投资分析的朋友。

你最想看以上哪个项目的深度实战拆解？留言告诉我，下期立刻安排。

GitHub AI 热榜 | 5月18日：微软亲自下场教Agent，情报界GitHub和全软件CLI化来了

GitHub AI 热榜 | 5月17日：Skills 热潮稍息，CodeGraph 给 Agent 装上了“代码地图”

GitHub AI 热榜 | 5月16日：Skills 生态正式确立，NotebookLM 与 n8n 的 AI 桥梁也已通车

GitHub AI 热榜 | 5月15日：Y Combinator 总裁的“软件工厂”开源了

GitHub AI 热榜 | 5月14日：Skills 热潮延续，Agent 学会了“看屏幕”和“做科研”