一、markitdown:万物皆可 Markdown
你有没有算过,电脑里存了多少份 PDF?
论文、报告、合同、发票、PPT 讲义、Excel 表格...
想把这些丢给 AI 分析,常规操作是复制粘贴。遇上扫描件,还得先 OCR。要是几百页 PDF?基本无解。
markitdown 就是来解决这个的。
这是 微软 开源的一个 Python 工具。一行命令,把各种格式的文件转成 Markdown。
它能转什么?
| 格式类型 | 具体支持 |
|---|---|
| 办公文档 | PDF、Word、PowerPoint、Excel |
| 媒体文件 | 图片(OCR)、音频(转录)、YouTube 视频 |
| 网页数据 | HTML、EPub |
| 结构化数据 | CSV、JSON、XML |
| 压缩包 | ZIP(自动遍历内容) |
安装就一行:
pip install 'markitdown[all]'
用起来更简单:
markitdown report.pdf -o report.md
完事。
为什么这件事很重要?
RAG(检索增强生成)现在是 AI 应用的标准架构。
但 RAG 有个前提——你得先把文档转成 AI 能处理的格式。
以前这个"前置步骤"很脏:PDF 解析用一套工具,Word 用另一套,图片 OCR 还得再搞一个。
markitdown 给了一个统一答案。
而且它还支持插件扩展。比如 markitdown-ocr 插件,配合 GPT-4o 做图片文字提取,准确率相当高。
这不是又一个格式转换工具,是 AI 时代的文档基础设施。
二、supermemory:给 AI 装上长期记忆
跟 ChatGPT 聊了一下午项目细节,第二天新开对话,它问:"你想做什么项目?"
你跟 Claude 说过十遍"我喜欢用 TypeScript,函数式风格",它还是会推荐你 Class-based 的代码。
这就是 AI 的"金鱼记忆"问题。
每次对话都是全新的开始。AI 记不住你,记不住上下文,更记不住你们的"共同历史"。
supermemory 要解决的,就是这个。
核心数据
supermemory 目前在 GitHub 有 23,985 Star,今天一天涨了 647。
更夸张的是它的 benchmark 成绩:
| 基准测试 | 排名 | 说明 |
|---|---|---|
| LongMemEval | 1 | 长期记忆 + 知识更新 |
| LoCoMo | 1 | 长对话事实召回 |
| ConvoMem | 1 | 个性化和偏好学习 |
三个主流记忆测试,全部第一。
六大核心能力
🧠 Memory(记忆提取)
自动从对话中提取事实,处理时间变化、解决矛盾、自动遗忘过期信息。
比如你先说"我住在纽约",后来又说"刚搬到旧金山"。supermemory 会自动更新这个信息,不会让 AI 继续把你当成纽约人。
👤 User Profiles(用户画像)
自动维护用户画像——稳定偏好 + 最近动态。
一个 API 调用,50ms 返回。注入到 system prompt 里,AI 瞬间知道你是谁、你喜欢什么、你最近在忙什么。
🔍 Hybrid Search(混合搜索)
RAG + Memory 二合一。查知识库的时候,同时加载你的个人上下文。
🔌 Connectors(连接器)
Google Drive、Gmail、Notion、OneDrive、GitHub —— 实时同步,webhook 触发。
📄 Multi-modal Extractors
PDF、图片 OCR、视频转录、代码 AST 解析。扔进去就行。
🤖 Agent 集成
内置 Nova Agent,支持 Claude Code、Cursor、OpenClaw 等插件。
怎么用?
方式一:直接用 App
打开 https://app.supermemory.ai,登录即用。
方式二:接入你的 AI 工具
npx -y install-mcp@latest https://mcp.supermemory.ai/mcp --client claude --oauth=yes
支持 Claude Desktop、Cursor、Windsurf、VS Code、Claude Code、OpenCode、OpenClaw。
方式三:API 接入
from supermemory import Supermemory
client = Supermemory()
# 存储信息
client.add(
content="用户喜欢 TypeScript,函数式编程风格",
container_tag="user_123"
)
# 获取画像
result = client.profile(
container_tag="user_123",
q="用户的编程风格是什么?"
)
print(result.profile.static) # 长期事实
print(result.profile.dynamic) # 最近动态
Memory vs RAG:关键区别
| 维度 | RAG | Memory |
|---|---|---|
| 工作方式 | 检索文档片段 | 追踪用户事实 |
| 时间感知 | 无 | 理解信息变化 |
| 个性化 | 所有人结果相同 | 基于用户历史 |
| 矛盾处理 | 无 | 自动解决 |
supermemory 默认同时跑两者——既查知识库,又加载你的个人上下文。
这不是向量数据库的替代品,是 AI 的"记忆皮层"。
三、TradingAgents:AI 不是聊天,是交易
这可能是本周最硬核的项目。
不是让 AI "分析"股票,而是让多个 AI 像真实交易团队一样协作——辩论、评估、决策、执行。
项目背景
TradingAgents 来自 TauricResearch,完全开源。
他们发了一篇论文(arXiv:2412.20138),展示了这套框架的回测结果:年化收益率可达 30.5%,显著跑赢传统策略。
七角色协作架构
这套系统模拟了真实交易公司的完整组织架构:
📊 基本面分析师
财报分析、估值建模、识别红旗。
📈 情绪分析师
聚合新闻头条、StockTwits、Reddit 讨论,产出情绪读数。
📰 新闻分析师
监控全球新闻和宏观指标,解读事件对市场的影响。
🔧 技术分析师
MACD、RSI、布林带,检测交易模式和价格趋势。
⚖️ 研究员(多空)
这是最有意思的角色。
分看多和看空两派,对分析师的报告进行结构化辩论。
不是一言堂,是真正的"投委会"机制。
💼 交易员
综合各方报告,决定交易时机和仓位规模。
🛡️ 风险管理团队
评估波动率、流动性、最大回撤,必要时否决交易提案。
👔 组合经理
最终审批人。签字后,订单发往模拟交易所执行。
技术栈
- 框架: LangGraph(支持检查点恢复)
- 模型: GPT-5.x、Gemini 3.x、Claude 4.x、Grok 4.x、DeepSeek、Qwen、GLM、MiniMax
- 市场: 美股、港股(0700.HK)、A股(600519.SS)、日股、加密货币
用起来长什么样?
# 安装 git clone https://github.com/TauricResearch/TradingAgents.git cd TradingAgents pip install . # 配置 API Key export OPENAI_API_KEY=... export ALPHA_VANTAGE_API_KEY=... # 运行 tradingagents
然后选股票代码、分析日期、LLM 提供商、研究深度。
界面会实时显示每个 agent 的思考过程——分析师在查数据,研究员在辩论,风控在评估...
像是在看一场真实的投资决策会议。
反思机制
TradingAgents 不是每次都从零开始。
每次交易后,它会记录决策到本地记忆文件。下次分析同一只股票时:
- 01获取实际收益(对比大盘)
- 02生成反思
- 03把经验教训注入提示词
这是一个会"从错误中学习"的交易系统。
项目链接
- markitdown:https://github.com/microsoft/markitdown
- supermemory:https://github.com/supermemoryai/supermemory
- TradingAgents:https://github.com/TauricResearch/TradingAgents
夜雨聆风