技能名称:lamindb 来源:K-Dense Inc.(Apache-2.0 License) 安装命令:
claude skill install k-dense-ai/claude-scientific-skills/lamindb核心能力:基于 LaminDB 开源数据框架,实现数据的可查询(Queryable)、可追溯(Traceable)、可复现(Reproducible)和 FAIR 合规。自动整理分析代码为规范化项目结构,生成环境依赖文件、变量码表(codebook)、运行顺序文档(README),跟踪数据从原始文件到分析结果的完整血缘链路。 适用场景:论文投稿前整理可复现材料包——确保审稿人/其他研究者能一键运行你的全部分析代码,满足期刊复现要求。

请将我的最低工资DID分析整理为一个完全可复现的研究项目。数据文件: minimum_wage_panel_data.csv需要包含:1. 规范的项目目录结构(data/ scripts/ outputs/)2. 带编号的分析脚本(01_clean -> 02_descriptive -> 03_regression)3. 变量码表(codebook),说明每个变量的含义和取值范围4. requirements.txt 环境依赖5. README.md 项目说明和运行顺序6. 可复现性验证清单

reproducible_project/├── README.md├── requirements.txt├── codebook.md├── data/│ └── minimum_wage_panel_data.csv (symlink or copy)├── scripts/│ ├── 01_clean.py│ ├── 02_descriptive.py│ └── 03_did_regression.py└── outputs/├── figures/└── tables/
2.每个目录有明确职责

requirements.txt 包含精确版本号codebook.md 列出所有变量:变量名、类型、含义、取值范围、单位数据来源说明

01_clean.py:数据清洗和验证02_descriptive.py:描述性统计和基线平衡性检验03_did_regression.py:DID回归、事件研究、稳健性检验每个脚本开头注明输入文件和输出文件脚本之间通过文件系统传递中间结果

README 包含:项目简介、环境配置、运行顺序、预期输出一键运行命令(bash 脚本或 Makefile)复现性验证清单:环境依赖是否齐全?数据文件是否存在?脚本是否按顺序执行?输出文件是否完整?
python3 demo_5_reproducibility.py
中国深度数据库:让精品数据 得以流动
CNDeepData:Let high-quality data flow without barriers
夜雨聆风