临研人如何用 AI Agent 工具建「可累积 LLM Wiki」—

临研人如何用 AI Agent 工具建「可累积 LLM Wiki」——而不是每次重新问

一、为什么 ChatGPT 不够？

做临床研发的人，日常要面对三类难题：

1文献多：同一适应症下，III 期、亚组、LBA、补充材料叠在一起。

2对比难：SERENA-6 和 PADA-1 都是 ctDNA 指导换药，但人群、干预、终点并不相同——每次都要重新翻 PDF。

3结论留不住：在聊天里问完 HR、CI、亚组，关掉窗口就没了；两周后再问，模型可能给出不一样的表述。

Karpathy 提出的 LLM Wiki 思路，核心不是「再做一个 RAG」，而是三层分工：

层	放什么	谁维护
Raw	论文 PDF、OCR 全文、正式文献笔记	OCR 工具生成 Markdown 正式笔记——只读
Wiki	试验摘要、药物/靶点/疾病页、跨试验对比	AI Agent 批量写
Schema	ingest / query / lint 规则	`WIKI.md` 等人机共演进

一句话：AI 是程序员，Obsidian 是 IDE，Wiki 是可持续更新的代码库。

二、最小可复现架构（不必一次上齐 OCR 流水线）

即使暂时没有完整 Zotero 流水线，也可以从下面「最小集」开始：

你的 Obsidian Vault/  Resources/Literature/     ← 正式文献笔记（禁止 Agent 改正文）  Wiki/    01_sources/             ← 每篇文献一条精读    02_disease/             ← 疾病 / 适应症    03_drugs/               ← 药物    04_targets/             ← 靶点、耐药机制    05_studies/             ← 试验名、NCT    06_synthesis/           ← 跨试验对比（核对后沉淀）  WIKI.md                   ← Agent 操作手册

AI Agent 工具：打开整个 Vault 文件夹作为工作区，对 Agent 说「对 FIDSRVI9 执行 wiki ingest」。Obsidian：同一文件夹，用图谱和双向链接阅读——不必靠 MCP 逐篇改笔记。

三、案例：SERENA-6（FIDSRVI9）第一次 ingest

我以 NEJM 发表的 SERENA-6 为试点，演示「一篇文献 → 多张 Wiki 页」。

3.1 精读页（`01_sources/FIDSRVI9.md`）

临床研究 source 页采用固定结构：核心结论 → PICOS 五要素表 → 疗效表 → 安全/QoL → 知识网络 → 证据来源。

PICOS 五要素（必填，且须能回到原文）：

要素	SERENA-6 要点
P	ER+/HER2- 晚期乳腺癌；一线 AI+CDK4/6 ≥6 月；ctDNA 检出 ESR1 且无影像学进展
I	AI 换为 Camizestrant 75 mg qd，继续 CDK4/6
C	继续 AI + CDK4/6（双盲安慰剂设计）
O	主要终点：研究者评估 PFS（RECIST 1.1）
S	III 期、随机 1:1、双盲；含 ESR1 监测期 + 随机治疗期

主要疗效（Abstract / 正文 Results，中期分析）：

指标	干预组	对照组	效应量
mPFS（月）	16.0（95% CI 12.7–18.2）	9.2（7.2–9.5）	HR 0.44（0.31–0.60）；P<0.0001
OS	数据不成熟（39 例死亡）	—	HR 0.91（0.48–1.73）

随机化：315 例（Camizestrant 157，AI 158）；筛查 3256 例接受 ESR1 检测。注册号 NCT04964934。

3.2 自动拆页（ingest 触达 4 类目录）

同一篇 ingest 会更新或新建：

•03_drugs/Camizestrant — 药物机制与 SERENA-6 疗效摘要

•05_studies/SERENA-6 — 试验设计与 NCT

•04_targets/ESR1-emergent-mutation — ctDNA 新兴 ESR1 概念

•02_disease/HR-positive-HER2-negative-MBC — 适应症语境

每页文末有 证据来源，关键数字带脚注指回 Literature 正式笔记——不允许用模型常识补 HR 或样本量。

四、三条硬规则（临研 Wiki 与「随便问 AI」的分水岭）

1Wiki 事实只来自 Literature原文没写的，写「原文未报告」，不要猜。

2ingest 先读 Raw，再写 WikiAgent 必须打开 Resources/Literature/ 下对应笔记（含 OCR）后再动笔。

3Wiki 正文不用 Markdown 加粗Obsidian 里 ** 易与 tag 下划线冲突；层级只用 # / ## 标题。公众号稿可另存，排版时再加强调。

五、可选：NotebookLM 做「跨文献对比实验室」

NotebookLM 不是 Wiki 主引擎，但适合回答：

「SERENA-6 与 PADA-1 在人群、干预、终点上有何异同？」

推荐流程：

1建 notebook（如 ESR1-adaptive-SERD），只上传 3–8 篇 对比所需 PDF（不必整库上传 Google）。

2在 AI Agent 工具中通过 NotebookLM MCP（社区项目，如 notebooklm-mcp-cli^[1]）提问。

3人工核对 Literature 原文后，才把结论写入 Wiki/06_synthesis/。

必须写清的边界：

•非 Google 官方 Consumer API，可能随产品改版失效。

•临床 PDF 上传 Google 云端前确认合规（仅用已发表文献，不上传患者数据）。

•NotebookLM 输出 = 草稿；核对前不得直接进 Wiki 实体页。

配置示例见 Vault 内 Wiki/99_meta/notebooklm-mcp.example.json 与 notebooklm-packs/。

六、避坑清单

坑	正确做法
用 Obsidian MCP 维护整库 Wiki	AI Agent 工作区批量写 `Wiki/`；Obsidian 只读图谱
每次提问重新 RAG	可累积 Wiki + `index.md` 导航
NotebookLM 答案直接写进 drugs 页	先核对 Raw → 再写 `06_synthesis/`
tags 带空格（如 `Breast Cancer`）	用 `Breast_Cancer`；ingest 后跑 `normalize_wiki_tags.py`

七、你可以从哪里开始？

今天就能做：

1在 Obsidian 建 Wiki/ 目录树 + 根目录 WIKI.md。

2选一篇你正在跟的 III 期文献，对 Agent 说：「用 source-clinical-trial 模板执行 wiki ingest」。

3在 Obsidian 打开 Wiki/index.md，看图谱是否连上 drugs / studies / targets。

下一步再加： OCR 工具（PDF → Literature Markdown）、NotebookLM 对比包。