Github Daily Trending
2026-06-02
markitdown
MarkItDown 是一个轻量级 Python 工具,专门用于将多种文件格式(如 PDF、Word、Excel、图片、音频等)转换为 Markdown 格式,以便于大型语言模型(LLM)和文本分析工具使用。它注重保留文档的核心结构(标题、列表、表格等),输出简洁、易于机器处理的 Markdown 文本,适合集成到 AI 应用或自动化文本处理流程中。
markitdown
#1MarkItDown 是一个轻量级 Python 工具,专门用于将多种文件格式(如 PDF、Word、Excel、图片、音频等)转换为 Markdown 格式,以便于大型语言模型(LLM)和文本分析工具使用。它注重保留文档的核心结构(标题、列表、表格等),输出简洁、易于机器处理的 Markdown 文本,适合集成到 AI 应用或自动化文本处理流程中。
ECC
#2这是一个为AI代理工作设计的原生操作符系统,源于Anthropic黑客松获奖项目。它不仅仅是配置文件,而是一套完整的体系,涵盖技能、本能、内存优化、持续学习、安全扫描和研究优先的开发模式。经过十个月以上的日常高强度使用和真实产品构建,项目形成了生产就绪的代理、技能、钩子、规则、MCP配置和遗留命令适配层。该系统兼容Claude Code、Codex、Cursor、OpenCode、Gemini、Zed、GitHub Copilot等多种AI代理工具。最新版本ECC v2.0.0-rc.1在此基础上引入了公开的Hermes操作符故事。项目采用MIT许可证永久开源,同时提供针对私有仓库的托管GitHub App版本(ECC Pro)。仓库本身只包含原始代码,详细用法和原理请参考配套指南。

hermes-webui
#3Hermes Web UI 是 Hermes Agent 的轻量级深色主题 Web 界面,通过浏览器提供与终端 CLI 几乎完全一致的操作体验。它采用三面板布局:左侧显示会话和导航,中央为聊天区域,右侧用于浏览工作区文件。用户可以在底部编写器中进行模型、个人资料和工作区控制,圆形上下文环直观显示令牌使用情况。所有设置和会话工具位于底部的 Hermes 控制中心。Hermes Web UI 支持完整个人资料配置、密码保护、工作区文件内联预览以及会话项目、标签和工具调用卡片。只需一条命令即可启动,并通过 SSH 隧道安全访问,无需任何构建步骤、框架或打包工具。它直接使用现存的 Hermes Agent 和已有模型,无需额外配置。Hermes 的独特之处在于其持久记忆、跨会话上下文保留、用户技能系统以及持续学习能力,使其在你的环境中运行越久越智能。

headroom
#4Headroom是一个为AI代理设计的上下文压缩层,能够在工具输出、日志、RAG片段、文件和对话历史到达大语言模型之前进行智能压缩。它支持多种使用方式:可作为Python或TypeScript库直接集成,也可通过代理服务无需改代码接入,还可一键包装Claude、Codex等主流代理工具,以及提供MCP服务器实现跨代理记忆共享。核心目标是大幅减少token消耗(通常降低60-95%),同时保持原有答案质量,实现本地优先、可逆压缩,使AI代理以更低成本获得相同效果。
Scrapling
#5Scrapling 是一个现代化的自适应网络爬虫框架,专为简化网页数据抓取而设计。它能够智能应对网站结构变化,自动重新定位元素,并内置绕过 Cloudflare 等反爬系统的能力。无论是单页请求还是大规模并发抓取,Scrapling 都支持通过简洁的 Python 代码实现,同时提供代理轮换、暂停/恢复等高级功能,让爬虫开发更高效、更稳定。

VoxCPM
#6VoxCPM2 是一款基于扩散自回归架构的无分词器文本转语音系统,能够直接生成连续语音表征,实现高度自然、富有表现力的语音合成。该模型拥有 20 亿参数,训练数据超过 200 万小时,支持 30 种语言,具备语音设计、可控语音克隆和 48kHz 高质量音频输出等功能。项目完全开源,可免费商用。

supermemory
#7Supermemory是一个为人工智能提供顶尖记忆和上下文能力的引擎。它解决了AI在多次对话间遗忘信息的问题,能自动从对话中学习、提取事实、构建并更新用户画像,处理时间变化、知识矛盾以及过期信息的自动遗忘。在LongMemEval、LoCoMo和ConvoMem这三大权威AI记忆基准测试中均排名第一。该引擎集成了完整的上下文栈:包括基于混合搜索的RAG(检索增强生成)、多模态文件处理(PDF、图片OCR、视频转录、代码AST解析)、以及Google Drive、Gmail、Notion等外部数据源的实时同步连接器。用户只需一个API调用(约50毫秒)即可获得稳定事实加近期活动的用户上下文。Supermemory提供面向普通用户的免费App、浏览器插件和MCP服务器,让任何兼容的AI助手拥有持久记忆;同时也为开发者提供单一API,无需配置向量数据库、嵌入管道或分块策略,即可为智能体和应用添加记忆、RAG、用户画像和连接器功能。

machine-learning-for-trading
#8该开源仓库是《ML for Trading - 2nd Edition》一书的配套代码资源,旨在通过超过150个Jupyter Notebook,全面、实用地展示如何将机器学习应用于算法交易策略。内容涵盖从线性回归到深度强化学习的广泛ML技术,包括数据获取、金融特征工程、组合管理、基于监督与非监督学习的多空策略设计与评估、从金融文本中提取交易信号、使用CNN和RNN处理市场和另类数据、用生成对抗网络合成数据,以及利用深度强化学习训练交易智能体。每个Notebook都提供了执行范例,帮助读者理解概念、复现研究、设计并回测交易策略,是书籍内容的实践延伸。

flowsint
#9Flowsint 是一款开源 OSINT 图形探索工具,专为道德调查、透明度和验证而设计。它通过可视化图形界面和自动化信息增强器,帮助用户探索实体之间的关系。Flowsint 目前处于早期开发阶段,需要社区贡献。安装依赖 Docker 和 Make,通过 git clone 和 make prod 命令即可运行,所有数据默认存储在本地,保障调查隐私。该工具支持域名、IP、ASN、CIDR 等多种信息源增强,包括反向 DNS、子域名发现、WHOIS 查询、地理定位、ASN 到 CIDR 映射等功能,适用于开放源情报调查场景。
Open-LLM-VTuber
#10Open-LLM-VTuber 是一款独特的语音交互式 AI 伴侣项目,支持实时语音对话与视觉感知,并配有生动的 Live2D 角色。所有功能均可完全离线运行于本地电脑上,无需联网依赖。用户可以将它当作个人专属 AI 伴侣,自由设定为虚拟女友、男友、宠物等任意角色。项目全面支持 Windows、macOS 和 Linux 系统,并提供网页版与桌面客户端两种使用模式,其中桌面客户端支持透明背景的桌面宠物模式,让 AI 伴侣能够跟随鼠标位置在屏幕任意处陪伴用户。当前项目正处于 v2.0 完整重写阶段,v1 版本仍持续维护并修复 bug。

production-agentic-rag-course
#11这是一个面向学习者的开源项目,旨在通过实践构建一个完整的AI研究助手系统。项目将引导你从零开始,逐步实现一个能够自动获取、理解学术论文并回答研究问题的现代RAG(检索增强生成)系统。 项目采用专业开发路径:先掌握关键词搜索等基础,再结合向量检索实现混合搜索,最终构建包含本地大模型、流式响应与生产级监控的完整RAG管道。通过七周的实践,你将学会使用Docker、FastAPI、PostgreSQL、OpenSearch等工具,搭建具备自动化数据流水线、智能分块、缓存优化及Telegram机器人接入的生产级AI系统。
夜雨聆风