今天的 GitHub AI 热榜虽然被 Skills 框架继续霸占,但出现了三个指向完全不同方向的新面孔:一个把整条学术论文流水线压缩成 4 个 Claude Code 命令,一个用 12 条原则给"生产级 AI Agent"下了史上最清晰的定义,还有一个让散户实现了完全零成本、全自动的 AI 股票分析。今天只讲它们三个。
🥇 academic-research-skills+1,439⭐
今天最热的新项目。学术研究全流程 Claude Code Skills,4 个模块 32 个 Agent 协同,从选题到定稿一条龙。今日重点之一。
🥈 tech-leads-club/agent-skills+1,244⭐→ 安全验证的 Agent Skill 注册表,连续多日在榜。(往期有提及)
🥉 CLI-Anything+1,049⭐→ 让所有软件变成 Agent 原生的 CLI 统一接口,连续多日在榜。(昨天我们完整拆解过)
想看 CLI-Anything 和 scientific-agent-skills 的完整解读,直接翻前两天的推送。今天的聚光灯全部打在第 1、第 7 和第 9 名。
🥇 academic-research-skills — 4 个技能包,32 个 Agent,一条完整的论文流水线
⭐ +1,439(总 Star 已超 6,400) | Imbad0202/academic-research-skills

这几天 Skills 框架霸榜,Agent 的技能包从工程扩展到了科研。但这个项目与其它 Skills 有一个根本性区别——它不帮你写论文,它只帮你做那些你最不想做的苦力活。
项目作者在 README 第一段就把立场摆得很清楚:
"AI is your copilot, not the pilot. This tool won't write your paper for you. It handles the grunt work — hunting down references, formatting citations, verifying data, checking logical consistency — so you can focus on the parts that actually require your brain: defining the question, choosing the method, interpreting what the data means, and writing the sentence after 'I argue that.'"
这是目前 AI 学术工具里最清醒的定位声明。不像市面上那些承诺"一键生成论文"的产品,ARS 的设计假设是:研究者本人是核心,AI 是增强器,不是替代品。
为什么坚持 Human-in-the-Loop?
作者引用了 Lu et al.(2026, Nature651:914-919)的一项关键研究:The AI Scientist——第一个通过顶会盲审的全自动 AI 研究系统,在 ICLR 2025 workshop 拿下 6.33/10 分(workshop 平均仅 4.87),听起来很震撼。但论文的 Limitations 章节列出了一串全自动 AI 科研绕不开的失败模式:实现 bug、幻觉结果、走捷径、把 bug 当 insight、编造方法论、框架锁死、引用幻觉(最致命的一条)。
ARS 的核心信念是:人类研究员 + AI 增强,比单独任何一方都更能躲过这些雷。为此,它在流水线的 Stage 2.5 和 Stage 4.5 设置了两道不可跳过的完整性闸门,运行一份 7 项 AI 失败模式强制检查清单。
更硬核的是引用核验机制。AI 写论文最忌讳引用幻觉——不只是编造不存在的文章,还包括标题相似但作者年份全错、DOI 真实但内容对不上等更隐蔽的情况。ARS 在 Deep Research 阶段就让每一篇文献都过 Semantic Scholar API 的存在性确认,并用 Levenshtein 相似度算法做模糊匹配,阈值设在 0.70 以上才算通过。
Zhao et al.(2026-05)对 arXiv、bioRxiv、SSRN 和 PMC 上 250 万篇论文中的 1.11 亿条引用做了全量审计,保守估计 2025 年一年就产生了 146,932 条幻觉引用。ARS v3.7.1 为此加入了信任链溯源标记,v3.7.3 加了三层引用锚点定位基础设施。
4 个模块,32 个 Agent 各司其职
ARS 由四个专业化 Skill 组成:
| Deep Research | ||
| Academic Paper | ||
| Academic Paper Reviewer | ||
| Academic Pipeline |
Deep Research 团队里有苏格拉底导师 Agent,通过对话引导研究者理清思路;有魔鬼代言人 Agent,专门挑刺防止思维定式;还有文献溯源 Agent,调用 Semantic Scholar API 验证每一篇引用的真实性。
Academic Paper 团队的 Style Calibration(风格校准)功能——AI 会学习你过往作品的写作风格,让输出更像你自己写的,而不是千篇一律的 AI 味。Writing Quality Check 专门抓那些一看就是机器生成的语言模式。输出格式支持 Markdown、DOCX、LaTeX,最终可编译成 APA 7.0 或 IEEE 格式的 PDF。
Academic Paper Reviewer 团队模拟真实学术期刊的评审流程:主编(EIC)带领三位领域审稿人,外加一个 Devil's Advocate,从方法论、学科视角、跨学科价值等多个维度打分。80 分以上接受,65-79 小修,50-64 大修,50 以下拒稿。审稿团队还会输出详细的修改路线图。
Academic Pipeline是流程编排器,把前三个团队串成一条 10 阶段流水线。你可以在任意阶段插入——已经有了初稿就从 Stage 2.5 开始,收到了审稿意见就从 Stage 4 切入。费用参考也很透明:一篇 1.5 万字的论文,全程跑下来大约 4-6 美元。
一句话价值:这可能是目前开源界最系统、最诚实的 AI 学术研究辅助工具。它不是帮你"水论文"的,而是帮你把精力从苦力活里解放出来、专注于真正需要脑子的部分。
适合谁:在读研究生、博士生、需要发表论文的科研工作者。Claude Code 用户尤其友好——两行命令 30 秒装好。
⚠️ 重要提醒:正如项目作者反复强调的,学术诚信是研究者的底线。ARS 的设计哲学是"AI 增强人类",不是"AI 替代人类"。请务必遵循你所在机构和目标期刊的 AI 使用政策,论文的核心论点、方法论选择和数据分析结论必须来自你自己的专业判断。
⭐ +399| humanlayer/12-factor-agents
如果说 agent-skills 是教 Agent 怎么干活,那这个项目就是回答一个更根本的问题:什么样的 AI 软件才配得上"生产级"三个字?
这个项目由 HumanLayer 创始人 Dex 发起。Dex 本人是 YC F24 校友,他的 HumanLayer 是一家做人机协同 API 的公司——让 AI Agent 在执行关键操作时能向人类请求批准。他试遍了市面上所有 Agent 框架,跟大量 YC 内外的技术创始人深度交流过,然后发现了一个尴尬的事实:
市场上标榜自己是"AI Agent"的产品,大多根本不怎么 agentic。它们的核心逻辑是确定性代码,只是在几个关键节点上撒了一点 LLM 步骤来制造"魔法感"。真正的优秀 Agent,不是在框架里塞一个 prompt + 一堆工具然后让它无限循环,而是由大量常规软件工程和恰到好处的 AI 调用组成。
Dex 把这个发现提炼成了 12 条原则,致敬 Heroku 在 2011 年提出的 12-Factor App方法论——那份影响了整整一代云原生开发者的"部署宪法"。
12 条原则速览
这 12 条原则的核心主张是:Agent 也是软件。它的本质是有向图(Directed Graph),LLM 只是图中的决策节点,不是全部:
自然语言到工具调用:用自然语言描述工具,而非硬编码 API 集成
拥有你的提示词和上下文窗口:把 prompt 和 context 当成核心资产来管理
上下文工程:在 Agent 开始工作前,预先收集所有可能需要的上下文
统一执行状态和业务状态:Agent 的状态管理要像传统软件的事务一样可靠
小而聚焦的 Agent:一个 Agent 只做好一件事,而非一个"万能 Agent"包打天下
工具是 Agent 的 API 契约:工具定义要像 REST API 接口一样严格
可观测性优先:Agent 的每一步推理和工具调用都要可追踪、可审计
人在回路:关键决策点必须有人的批准机制
幂等性与重试:Agent 操作要能安全重试,不产生副作用
小模型也能派大用场:不所有任务都需要最大的模型
测试 Agent 就像测试软件:单元测试、集成测试、回归测试全部适用
持续交付:Agent 的 prompt 和工具定义要像代码一样走 CI/CD 流程
不止是理论:背后有真实战斗伤痕
这不是一篇纸上谈兵的宣言。HumanLayer 的初始方案叫 RPI(Research-Plan-Implement),大约一年前发布,被上万人下载,从小型创业公司到财富 500 强企业都在用。但实际落地过程中暴露了一大堆问题——工程师不看生成的代码、计划文档太复杂根本审不过来、prompt 里需要塞"魔法词"才能让 Agent 表现出预期的交互行为。
他们后来把 RPI 进化成了 CRISPY(Context-Research-Iterate-Structure-Plan-sYnthesize)——一个七阶段框架,把原来 85+ 条指令的巨型 prompt 拆成多个不超过 40 条指令的小阶段,并在每个阶段之间插入显式的人机对齐检查点。最终实现了可复现的 2-3 倍生产力提升,同时保持了代码质量。
这种"从第一性原理推倒重来"的做法,恰好呼应了前阵子 Karpathy 在 No Priors 播客里的表态:"我大概从去年 12 月起就没亲手敲过一行代码了。"并不是说程序员要失业,而是说开发者的角色正在从"代码执行者"变成"架构决策者"。12-factor-agents 就是给这个新角色准备的工程手册。
一句话价值:这是目前最系统、最实战导向的"生产级 LLM 应用"设计原则文档。如果你的团队正在把 AI 功能推到真实用户手里,这是必读。
适合谁:技术创始人、Tech Lead、MLOps 工程师、产品经理,以及任何正在纠结"我的 AI 功能到底能不能上生产"的人。全文免费公开在 GitHub 上。
⭐ +310| ZhuLinsen/daily_stock_analysis

前两周的热榜里,港大的 AI-Trader 连续多天在榜,说明开发者对"用 AI 搞投资"的需求非常刚性。今天这个项目,把这件事的门槛降到了零——零成本定时运行,全自动推送到你的微信/飞书/Telegram。
项目的 README 第一行就用了"纯白嫖"三个字,坦诚得可爱。
它的工作流非常直接:
多数据源行情聚合:同时拉取 A 股、港股、美股、ETF 的行情数据、K 线、技术指标、资金流、筹码分布、新闻、公告和基本面信息
LLM 决策引擎:把聚合后的数据喂给 LLM(支持 Anspire、AIHubMix、Gemini、DeepSeek、通义千问、Claude、Ollama 本地模型等),让模型生成一份"决策仪表盘"
多渠道推送:自动推送到企业微信、飞书、Telegram、Discord、Slack 或邮箱
定时运行:通过 GitHub Actions、Docker 或本地定时任务,每天自动跑
决策仪表盘包含核心结论、评分、趋势判断、买卖点位、风险警报、催化因素和操作检查清单,覆盖 15 种内置策略(均线、缠论、波浪、趋势、热点、事件、成长、预期等),还支持 Agent 多轮追问——你可以跟 AI 就某只股票进行深入讨论。
技术栈覆盖了几乎所有主流的免费或低价数据源:TickFlow、AkShare、Tushare、Pytdx、Baostock、YFinance、Longbridge 等行情数据,以及 Anspire、SerpAPI、Tavily、Bocha、Brave 等新闻搜索源。LLM 方面支持 Anspire、AIHubMix、Gemini、OpenAI 兼容接口、DeepSeek、通义千问、Claude、Ollama 本地模型等。
这个项目不追求替代专业量化交易系统——它追求的是让普通散户每天花 0 元、0 分钟,就能拿到一份 AI 生成的、有数据支撑的股票参考报告。它是帮你做信息整理和初步判断的工具,最终的买卖决策权在你手里。
一句话价值:AI 股票分析的"平民化终点"——零成本、全自动、多渠道推送,让你每天打开手机就能看到 AI 帮你整理好的市场概览。
适合谁:所有对 A 股/港股/美股感兴趣的散户投资者。不想每天花几小时盯盘、但又想有一个系统化的信息参考来源的人。
⚠️ 重要提醒:投资有风险,入市需谨慎。AI 生成的决策仪表盘仅供参考,不构成任何投资建议。股市的涨跌受千万种因素影响,AI 模型无法预测未来。请务必基于自己的研究和风险承受能力做出投资决策,切忌盲目跟单。
把今天的三个项目放在一起看,会发现它们指向 Agent 生态的三个不同层级:
学术研究 Skills:定义了 Agent 在一个垂直领域"怎么干活"——流程化、可复用、可验证
12-factor-agents:定义了 Agent 软件"怎么才算靠谱"——可靠性、可维护性、可交付给真实客户
daily_stock_analysis:把前面两者落地到了一个具体的、人人都有需求的场景里——而且零成本
这三层正好对应着 Agent 生态的"术"(具体技能)、"法"(工程原则)、"用"(落地场景)。加上前两周热榜上固化下来的 Skills 框架和 agentmemory,一个完整的 Agent 技术栈正在成型:有技能、有记忆、有原则、有落地场景。
这是 GitHub AI 热榜连续更新的第 N 天,感谢你的持续关注。如果觉得今天的内容有帮助,欢迎转发给身边在读研、在推 AI 产品上生产、或者在做投资分析的朋友。
你最想看以上哪个项目的深度实战拆解?留言告诉我,下期立刻安排。
GitHub AI 热榜 | 5月18日:微软亲自下场教Agent,情报界GitHub和全软件CLI化来了
GitHub AI 热榜 | 5月17日:Skills 热潮稍息,CodeGraph 给 Agent 装上了“代码地图”
GitHub AI 热榜 | 5月16日:Skills 生态正式确立,NotebookLM 与 n8n 的 AI 桥梁也已通车
夜雨聆风