春意正盛,AI 也正以前所未有的速度重塑社会科学研究的工作方式。
备受好评的 **CIMERS 方法讲习班 **再次启动!
👉2026 年社会科学研究方法讲习班现已开启预售(最后一周报名机会,6月3-5号开讲):
2026年第一期 | AI编程代理在社会科学研究中的应用讲习班
👆课程大纲请见上述链接
最近一直在应用Codex于我自己的因果推断研究和DSGE,不过开学后我开始应用Claude code了,我个人是用Claude Code + 免费Prism的组合。后续还有更加智能化,更加高级的社会科学研究助理的用法,未完待续...
第十二讲 构建本地文献管理智能体
作者:许文立 邮箱:wlxu@cityu.edu.mo 2026-05-26
参考:Mushtaq Bilal:Claude Code 104: Building Your AI-Powered Research Management System
一、引言
我已经将这几个月以来写得“AI智能体育社会科学研究”整理成了一本电子书,取名为《社会科学研究智能体:入门与应用》。但是,在内地出一本书实在太贵,所以想寻找一家出版社可以资助免费出版这本书。请大家帮我扩散、转发给出版界的朋友和老师们,谢谢! 好了,言归正传,暑假后,我逢人就推荐大家在研究和工作中使用Agentic AI(AI智能体),我发现大部分人其实对AI智能体的认知还停留在ChatGPT、豆包、Deepseek等聊天AI的层面。 这可能是国内的几款AI模型(豆包、Kimi、千问、Deepseek、智普、文心一言)等主要还是以聊天AI的形式呈现。例如,我丈母娘过年的时候学会使用豆包后,有什么想知道的,都语音问手机豆包。而大部分研究者无非就是问一些学术专业问题,或者查找资料。 其实,国内的Kimi也有官方Kimi code,且一个美国人Hunter Brown基于Deepseek-v4开发了一款终端deepseep-cli(由于Deepseek正在招人开发,所以最近有更名为CodeWhale),这两款算是目前国内最好的AI智能体了,Kimi code差强人意,CodeWhale是非官方的。也许再等个半年,Kimi code进步了,DS也有官方版本的coding agent了,大家就可以畅快地体验AI智能体了。 如果想了解聊天AI和AI智能体的差别,可以参见以前的讲稿,【效傲江湖AI系列8】第二讲 Claude Code的技术基础、【效傲江湖AI系列7】别把 Agent 当 ChatGPT:它是你的研究工程总管 上一讲,【效傲江湖AI系列17】第十一讲 在Claude中构建专属社会科学文献智能体,给大家讲过研究文献智能体的配置,今天继续这个话题,因为文献是所有研究的基础,不过今天是配置一个本地化的研究文献管理智能体;
二、构建本地研究文献管理智能体
研究者的想法哪里来?要么“行万里路”,要么“读万卷书”;
我从读硕士开始,就阅读经济学论文,尤其是博士以来,没有读破万篇论文,也应该有大几千篇了。还记得我写博士论文过程中,将AER从1900s年代初期创刊至2017年所有与环境有关的论文全部研读了一遍,还有其它Top5和环境领域的Top,我读完后,有一种顿悟的快感,终于知道了为什么环境经济学呈现了现在这个样子,还有那些发展方向,由此,我选择了环境气候宏观经济学方向,尤其是环境气候问题在经济周期中的作用。2018年,Nordhaus因为气候变化经济学的贡献获得了诺贝尔奖,更加坚定了我选择的方向,研究从未间断过。
这也导致了一个问题,我的电脑了存储了太多的文献和资料,有pdf、word、code、网页等等
我1T的onedrive已经存储了236G的文献资料和研究资料;
我有各种专业书籍:
我有各种DSGE的代码:
我有各种计量的理论与应用文献
当然,还有各种各样的研究项目资料,都散落在我们的电脑各处;
这些资料,我都读过,所以阅读并不难,难的是将我的研究兴趣,以及这些散落的文献资料彼此联系起来;
例如,我们对实证结果进行解读和分析的时候,大部分研究者可能仅仅只是描述实证结果:政策系数为正,且在95%置信水平显著,说明政策可以促进结果,等等。
但是,高质量的实证结果分析应该有四个部分:(1)要回答的问题,或解决的偏误;(2)解决偏误的合适方法(这个通常在识别策略部分);(3)对实证结果的描述,以及经济学或相关学科专业含义,或者对经济社会的含义;(4)与相关文献的联系与比较,有哪些文献的内容支持或者反对我们的研究结果和分析观点。
最后一点,通常是大分部实证论文与高质量研究的差距。但是,我们要将自己的研究结果观点与现有文献比较和联系,以往不得不重新去搜索文献,精度文献,或者修改我们的观点分析;
别说工作量了,这个总结和归纳、理解和消化的难度就是为何大部分的研究都不是顶刊的重要原因之一吧!
今天,就来构建一个研究文献管理智能体,帮助我们在研究中快速找到相关文献之间的联系,最重要的是可以深入文献的具体内容。
(一)研究文献管理智能体的架构
本地的研究文献管理智能体有两个文件夹组成:(1)一个是原始文献资料文件夹(raw folder);(2)一个是文献资料百科文件夹(wiki folder)
在我的“应用计量经济学”文件夹中,有上述两个文件夹:
raw文件夹里存放的都是我的原始文献材料
wiki文件夹里是所有文献资料的概述,就类似于维基百科/百度百科。每个主题都有一个简介,然后一大堆原始参考文献链接。AI智能体可以查询wiki内容,并调用原始文献。
(二)安装Obsidlian软件
正如Obsidlian主页写的:提炼你的想法——一款免费、灵活的个人思想库软件
安装完成后,会提示我们创建一个“库”。库其实就是电脑上的一个文件夹。创建一个名为“Mywiki”的文件夹,并将其保存到我们的本地桌面文件夹中。
在左侧栏的上方创建两个字文件夹raw和wiki
以后,我们在Obsidlian Vault中创建的任何内容都会出现在Mywiki中
例如,我们向raw文件夹中放一些pdf文献:
这个时候,我们就在obsidlian的Mywiki中能看到这些文献
三、Claude code配置
要让 Claude Code 整理原始文件夹中的文献材料,需要两套不同的指令:AGENTS.md 和 Index.md。 AGENTS.md 是一组指令,也就是一套文本内容,用于告诉 Claude Code,我们希望如何组织这个文献研究智能体。 Index.md是指示目录。 要创建 AGENTS.md 文件,请打开Claude Code中的“Mywiki”文件夹。 Mushtaq Bilal博士提供了以下模板(中英文均可),填写与我们研究项目相关信息,然后让程序为我们创建 AGENTS.md 文件,例如,我的研究相关信息:
> I am setting up a personal research knowledge system using Obsidian and Claude Code.Here is how it works: I have a folder (an Obsidian vault) with two subfolders. A "raw" folder where I dump source material — research papers, clipped web pages, PDFs, and notes. And a "wiki" folder where Claude Code builds organized notes based on that raw material.I need you to write an AGENTS.md file. This is a plain-English or Chinese instruction file that Claude Code will read every time it organizes my material. It tells Claude Code how I want my knowledge base structured.About me and my research:- My field: fiscal, monetary, financial, Macroprudential policies, climate and enviromental policies of China, macroeconomic dynamic model(DSGE,HANK,heterogenous agent model) , related methods advances based on Dynare, difference in differences method advance, empirical research using difference in differences and related methods- What I study: [describe your topic in 1-3 sentences]- The kinds of sources in my raw folder: [e.g., journal articles, interview transcripts, datasets, book chapters, news articles]- How I think about my topic — the main themes, questions, econometric method/identification, datasets, definition of treatment and outcome variables, or categories I'd use to file things: [list a few, or say "help me figure this out"]Before you write the file, ask me up to five short questions if anything is unclear.Then write a complete AGENTS.md that covers:1. A short description of me and my research, so Claude Code understands the context.2. How to read and interpret everything in the raw/ folder.3. How to organize the wiki/ folder — what kinds of notes to create (for example, one note per theme, per author, or per concept), how to name them, and whether to use subfolders.4. Linking conventions: Claude Code should connect related notes using Obsidian's [[double-bracket]] wiki-links so my knowledge base becomes a connected web.5. How to handle citations and sources, so every wiki note points back to the original item in raw/.6. A short "rules" section: never edit, move, or delete anything in raw/; never fabricate facts or sources; mark anything uncertain clearly.Write it in plain English or Simple Chinese. I am not a programmer. Keep it clear enough that I can read and edit it myself later.Claude code问了我四个问题:
我选择了四个问题的答案后,claude code就帮我创建Agent.md,请查看Mywiki文件夹,是否存在Agent.md文件
然后复制以下模板,根据我们个人需求进行自定义,并请 Claude Code为您创建一个 Index.md 文件:
> I am building a personal research wiki in Obsidian, organized for me by Claude Code. I need you to write an index.md file — the main map or table of contents for my wiki folder.About me and my research:- My field: fiscal, monetary, financial, Macroprudential policies, climate and enviromental policies of China, macroeconomic dynamic model(DSGE,HANK,heterogenous agent model) , related methods advances based on Dynare, difference in differences method advance, empirical research using difference in differences and related methods- What I study: [1-3 sentences]- The main themes or categories I expect my wiki to be organized around: [list a few, or say "propose some based on what I told you"]Before you write the file, ask me up to three short questions if anything is unclear.Then write a complete index.md that:1. Opens with a one-paragraph overview of what this wiki is and what research it supports.2. Lists my main themes or categories as sections, with a one-line description of each.3. Under each section, leaves space (using Obsidian [[double-bracket]] links) for the individual wiki notes that will live there — so the index works as a navigation hub.4. Includes a short note at the bottom explaining that this index is a living document: Claude Code should update it whenever it adds new notes to the wiki.Write it in plain English or simple Chinese, clean and easy to scan. I am not a programmer, and I want to be able to read and edit this myself.Claude code又问了三个问题:
创建完,我们也要确认是否存在:
index.md每个板块下已预置了合理的 [[双括号链接]] 占位符,Claude Code 整理 raw/ 中的材料时,会在这些位置填入真实笔记的链接。你也可以直接在 Obsidian 里点击任意占位链接,Obsidian 会提示你新建对应的笔记。 这两个指令都会让 Claude Code 提出后续问题。只需根据您的偏好作答,Claude Code就会据此定制这些文件。 同时,我么也可以直接用文本编辑器打开这个文件修改任何部分,改完后下次 Claude Code 整理材料时就会按新规范执行
四、研究文献管理智能体
当raw文件夹中有足够的材料并且上述指令设置完毕后,我们只需在 Claude Code 中运行以下提示即可:
> Read AGENTS.md, look at everything in the raw folder and build the initial wiki structure.Claude Code会阅读我们的指令,浏览 raw 文件夹中的所有内容,并在 wiki 文件夹中创建一个有条理的 wiki。
在 Obsidian 中打开 wiki 文件夹,将看到基于原始文献的结构化笔记,这些笔记是有双向链接,并且会给我一个与研究主题和方向联系起来的文献知识图谱,让我们一目了然。
这样,我们的个人研究文献管理智能体就搭建好了。
以后,我们有任何新文献和资料,只要放入raw文件夹,然后请Claude code帮我整理,创建wiki,然后在obsidlian中就可以展示了。
以前的笔记参见:
【效傲江湖AI系列1】为什么社会科学研究者要用 Codex或者Claude Code?
【效傲江湖AI系列2】为什么社会科学研究者要警惕 Codex或者Claude Code?
【效傲江湖AI系列3】社会科学研究自动化编程助理:Codex安装与初探
【笑傲江湖AI系列5】第一讲 Claude Code配置、常见问题与第一个Vibe coding项目
【笑傲江湖AI系列6】第三讲 Claude Code with Stata Skill
【效傲江湖AI系列7】别把 Agent 当 ChatGPT:它是你的研究工程总管
【效傲江湖AI系列8】第二讲 Claude Code的技术基础
【效傲江湖AI系列9】经济学研究的AI skills:适合DSGE和因果推断
高度警惕:目前的 AI 在社会科学中没有能力自动生成可直接投稿的论文!
【效傲江湖AI系列10】第四讲:Claude Code 自动爬取数据与作图初步分析
StatsClaw:用 AI Agent 团队构建可靠的统计软件
【效傲江湖 AI 系列 11】Claude Code+Zotero+知网研学
【效傲江湖AI系列12】第六讲 Claude Code远程操控
【效傲江湖AI系列13】第五讲 Claude Code 自动爬取大规模文本数据集与初步分析
【效傲江湖AI系列14】第七讲 Claude Code自动用免费云GPU运行python代码做社会科学研究
【效傲江湖AI系列15】第八讲 AI自动设计与开发计量软件(替代收费的STATA)
夜雨聆风