今天的 GitHub Trending 很有意思,三个项目分别切中了 AI 落地的三个关键环节:把非结构化文档喂给大模型、用规范让 AI 编码更可控、以及让 AI 理解物理世界。无论你是做 RAG 应用、管理代码质量,还是研究机器人,都值得瞄一眼。

TOP1 · PaddlePaddle/PaddleOCR
文档解析界的瑞士军刀,直接对接 LLM
榜单动态:141 stars today · 累计 79,882 star
PaddleOCR 是百度出品的开源 OCR 工具包,能把任意 PDF 或图片中的文字提取成结构化数据,方便喂给大模型做 RAG。支持 100+ 语言,除了基础 OCR,还包含文档解析、表格识别、关键信息抽取(KIE)等能力,Python 生态,CPU/GPU/NPU 都能跑。
为什么会上 Trending:近 8 万 star 的经典项目今天仍有 141 个新 star,说明文档智能解析在 RAG 和 AI 应用场景下需求依然旺盛,尤其是中文 OCR 领域几乎没有对手。
适用场景: 把扫描的合同/发票转成 JSON 喂给 LLM 做自动化审核;搭建企业内部知识库,自动解析 PDF 说明书和报告;为跨国业务做多语言文档翻译与信息提取
推荐给做 RAG 应用、文档自动化或需要处理大量扫描件的后端/数据工程师。
仓库地址(长按复制到浏览器打开)
https://github.com/PaddlePaddle/PaddleOCR

TOP1 · github/spec-kit
GitHub 官方出品,让 AI 编码不再瞎编
榜单动态:321 stars today · 累计 108,583 star
Spec Kit 是 GitHub 推出的开源工具包,帮你实践「规范驱动开发」(Spec-Driven Development)。核心思路是先写产品需求文档(PRD)和功能规范,再让 AI 编码工具(如 Copilot)照着规范生成代码,避免 vibe coding 带来的不可控。包含 CLI 工具、模板和与 AI 代理的集成方案。
为什么会上 Trending:今日新增 321 star,总 star 数突破 10 万。作为 GitHub 官方项目,它精准回应了开发者对 AI 编码「可控性」的焦虑——不是让 AI 自由发挥,而是用规范约束它。
适用场景: 团队引入 AI 编码助手时,先用 Spec Kit 制定编码规范;给 Copilot 或 Claude Code 提供 PRD 模板,让生成代码更符合业务预期;在代码审查前,用规范自动校验 AI 生成代码的质量
适合技术负责人、架构师和正在用 AI 编码工具写生产代码的开发者。
仓库地址(长按复制到浏览器打开)
https://github.com/github/spec-kit

TOP1 · NVIDIA/cosmos
NVIDIA 开源的世界模型,让 AI 理解物理规则
榜单动态:133 stars today · 累计 9,006 star
NVIDIA Cosmos 是一个开放的世界模型平台,包含预训练模型、数据集和工具,目标是让开发者构建能理解物理世界的 AI——比如机器人导航、自动驾驶、智能基础设施等。模型支持视频生成、推理和场景理解,基于 Jupyter Notebook 提供交互式体验。
为什么会上 Trending:NVIDIA 出品 + 世界模型概念正热,今天 133 个新 star。Cosmos 3 系列模型刚刚发布,支持从文本/视频生成物理一致的场景,对机器人领域尤其有吸引力。
适用场景: 为机器人训练生成逼真的物理环境模拟数据;在自动驾驶场景中,用世界模型预测车辆周围物体的运动轨迹;做智能安防时,让 AI 理解监控画面中的物理行为(如摔倒、碰撞)
推荐给机器人开发者、自动驾驶工程师以及做物理仿真研究的 AI 研究员。
仓库地址(长按复制到浏览器打开)
https://github.com/NVIDIA/cosmos
如果今天这三个项目有一个让你觉得「嗯,有点意思」,不妨点个在看,转发给写代码的同事——有趣软件探索叔叔叔叔,每天帮你筛 GitHub。
夜雨聆风