本周 GitHub 最火项目:让 AI 从能用变好用的三个工具

一、markitdown：万物皆可 Markdown

你有没有算过，电脑里存了多少份 PDF？

论文、报告、合同、发票、PPT 讲义、Excel 表格...

想把这些丢给 AI 分析，常规操作是复制粘贴。遇上扫描件，还得先 OCR。要是几百页 PDF？基本无解。

markitdown 就是来解决这个的。

这是微软开源的一个 Python 工具。一行命令，把各种格式的文件转成 Markdown。

它能转什么？

格式类型	具体支持
办公文档	PDF、Word、PowerPoint、Excel
媒体文件	图片（OCR）、音频（转录）、YouTube 视频
网页数据	HTML、EPub
结构化数据	CSV、JSON、XML
压缩包	ZIP（自动遍历内容）

安装就一行：

pip install 'markitdown[all]'

用起来更简单：

markitdown report.pdf -o report.md

完事。

为什么这件事很重要？

RAG（检索增强生成）现在是 AI 应用的标准架构。

但 RAG 有个前提——你得先把文档转成 AI 能处理的格式。

以前这个"前置步骤"很脏：PDF 解析用一套工具，Word 用另一套，图片 OCR 还得再搞一个。

markitdown 给了一个统一答案。

而且它还支持插件扩展。比如 markitdown-ocr 插件，配合 GPT-4o 做图片文字提取，准确率相当高。

这不是又一个格式转换工具，是 AI 时代的文档基础设施。

二、supermemory：给 AI 装上长期记忆

跟 ChatGPT 聊了一下午项目细节，第二天新开对话，它问："你想做什么项目？"

你跟 Claude 说过十遍"我喜欢用 TypeScript，函数式风格"，它还是会推荐你 Class-based 的代码。

这就是 AI 的"金鱼记忆"问题。

每次对话都是全新的开始。AI 记不住你，记不住上下文，更记不住你们的"共同历史"。

supermemory 要解决的，就是这个。

核心数据

supermemory 目前在 GitHub 有 23,985 Star，今天一天涨了 647。

更夸张的是它的 benchmark 成绩：

基准测试	排名	说明
LongMemEval	1	长期记忆 + 知识更新
LoCoMo	1	长对话事实召回
ConvoMem	1	个性化和偏好学习

三个主流记忆测试，全部第一。

六大核心能力

🧠 Memory（记忆提取）

自动从对话中提取事实，处理时间变化、解决矛盾、自动遗忘过期信息。

比如你先说"我住在纽约"，后来又说"刚搬到旧金山"。supermemory 会自动更新这个信息，不会让 AI 继续把你当成纽约人。

👤 User Profiles（用户画像）

自动维护用户画像——稳定偏好 + 最近动态。

一个 API 调用，50ms 返回。注入到 system prompt 里，AI 瞬间知道你是谁、你喜欢什么、你最近在忙什么。

🔍 Hybrid Search（混合搜索）

RAG + Memory 二合一。查知识库的时候，同时加载你的个人上下文。

🔌 Connectors（连接器）

Google Drive、Gmail、Notion、OneDrive、GitHub —— 实时同步，webhook 触发。

📄 Multi-modal Extractors

PDF、图片 OCR、视频转录、代码 AST 解析。扔进去就行。

🤖 Agent 集成

内置 Nova Agent，支持 Claude Code、Cursor、OpenClaw 等插件。

怎么用？

方式一：直接用 App

打开 https://app.supermemory.ai，登录即用。

方式二：接入你的 AI 工具

npx -y install-mcp@latest https://mcp.supermemory.ai/mcp --client claude --oauth=yes

支持 Claude Desktop、Cursor、Windsurf、VS Code、Claude Code、OpenCode、OpenClaw。

方式三：API 接入

from supermemory import Supermemory

client = Supermemory()

# 存储信息
client.add(
    content="用户喜欢 TypeScript，函数式编程风格",
    container_tag="user_123"
)

# 获取画像
result = client.profile(
    container_tag="user_123",
    q="用户的编程风格是什么？"
)

print(result.profile.static)   # 长期事实
print(result.profile.dynamic)  # 最近动态

Memory vs RAG：关键区别

维度	RAG	Memory
工作方式	检索文档片段	追踪用户事实
时间感知	无	理解信息变化
个性化	所有人结果相同	基于用户历史
矛盾处理	无	自动解决

supermemory 默认同时跑两者——既查知识库，又加载你的个人上下文。

这不是向量数据库的替代品，是 AI 的"记忆皮层"。

三、TradingAgents：AI 不是聊天，是交易

这可能是本周最硬核的项目。

不是让 AI "分析"股票，而是让多个 AI 像真实交易团队一样协作——辩论、评估、决策、执行。

项目背景

TradingAgents 来自 TauricResearch，完全开源。

他们发了一篇论文（arXiv:2412.20138），展示了这套框架的回测结果：年化收益率可达 30.5%，显著跑赢传统策略。

七角色协作架构

这套系统模拟了真实交易公司的完整组织架构：

📊 基本面分析师

财报分析、估值建模、识别红旗。

📈 情绪分析师

聚合新闻头条、StockTwits、Reddit 讨论，产出情绪读数。

📰 新闻分析师

监控全球新闻和宏观指标，解读事件对市场的影响。

🔧 技术分析师

MACD、RSI、布林带，检测交易模式和价格趋势。

⚖️ 研究员（多空）

这是最有意思的角色。

分看多和看空两派，对分析师的报告进行结构化辩论。

不是一言堂，是真正的"投委会"机制。

💼 交易员

综合各方报告，决定交易时机和仓位规模。

🛡️ 风险管理团队

评估波动率、流动性、最大回撤，必要时否决交易提案。

👔 组合经理

最终审批人。签字后，订单发往模拟交易所执行。

技术栈

框架: LangGraph（支持检查点恢复）
模型: GPT-5.x、Gemini 3.x、Claude 4.x、Grok 4.x、DeepSeek、Qwen、GLM、MiniMax
市场: 美股、港股（0700.HK）、A股（600519.SS）、日股、加密货币

用起来长什么样？

# 安装
git clone https://github.com/TauricResearch/TradingAgents.git
cd TradingAgents
pip install .

# 配置 API Key
export OPENAI_API_KEY=...
export ALPHA_VANTAGE_API_KEY=...

# 运行
tradingagents

然后选股票代码、分析日期、LLM 提供商、研究深度。

界面会实时显示每个 agent 的思考过程——分析师在查数据，研究员在辩论，风控在评估...

像是在看一场真实的投资决策会议。

反思机制

TradingAgents 不是每次都从零开始。

每次交易后，它会记录决策到本地记忆文件。下次分析同一只股票时：

01获取实际收益（对比大盘）
02生成反思
03把经验教训注入提示词

这是一个会"从错误中学习"的交易系统。

项目链接

markitdown：https://github.com/microsoft/markitdown
supermemory：https://github.com/supermemoryai/supermemory
TradingAgents：https://github.com/TauricResearch/TradingAgents