超详实论文复刻课程,从数据下载、清洗、指标构建开始:视频+全套代码+原始数据
课程特色
-
[1] 超详实复刻体验,大部分变量复刻将从下载数据这一步开始,从年末数据的选取、合并报表类型的选取出发,让复现不仅仅是重新抄一遍回归代码,更是体验真实研究的全过程.
-
[2] 提供完整数据集以及从导入csv数据到完成指标构建的全流程过程,代码可复现,简单改一改就可用于其他文本分析指标的计算.
-
[3]超多原创指标:这些指标的计算均是包含原创的计算过程,可直接用于自身研究.
-
[4] 附赠PPT形式论文精讲,对论文进行逐句拆解,分析行文逻辑,教学改写方法.
-
[5] 将所有原创指标以独立数据包形式发给所有购买课程会员,直接省去购买数据的钱.
-
[6] 全程可答疑.
在经管学术研究中,能否熟练处理与分析数据,尤其是充分利用专业数据库、统计面板数据、年鉴数据,通过完整复刻经管类顶刊论文的全过程,手把手带你突破数据处理、模型构建、实证分析与论文写作的重重难关。我们开发了一套高质量的经管类顶刊论文复刻课程,将系统性地带你走完以下环节:
-
理论框架与文献综述(引言与文献梳理):学习如何从现实问题和理论空白中提炼出有价值的 research question,并学会高效梳理文献,奠定研究的理论基础。
-
研究设计与计量模型(模型设定):理解作者为何选择特定的计量模型(如固定效应、双重差分法、断点回归设计、工具变量法等),并掌握模型设定的思路及其背后的假设条件。
-
数据处理与变量构建(变量测算):学习核心变量(如数字化转型、ESG、全要素生产率)的复杂构建方法,这是复现的关键和难点。
-
实证结果与统计推断(基准回归与检验):不仅要跑出结果,更要理解系数含义、显著性以及各种检验(如稳健性、内生性处理)的目的和解读方法。
-
机制分析与异质性讨论(深挖故事):学习如何运用中介效应模型等方法检验理论机制,以及如何进行异质性分析(如分样本回归)以丰富论文内涵。
|
【10篇顶刊论文复现主要内容】 [1]方先明,胡丁.企业ESG表现与创新——来自A股上市公司的证据[J].经济研究,2023,58(02):91-106. 学科领域:环境经济学;创新经济学 主要复刻指标:企业创新;ESG表现;融资约束;员工创新效率;风险承担 主要复刻实证方法:描述性统计+基准回归+稳健性检验(工具变量+Heckman)+异质性分析+两步法机制检验+拓展分析【已完成复现】 [2]文茜,李万利,申志轩.地方政府释放财政压力的微观传导机制:企业盈余管理视角[J].世界经济,2023,46(10):91-114. 学科领域:财政学;会计学 主要复刻指标:财政压力;盈余管理;企业避税;企业投资;企业捐赠 主要复刻实证方法:描述性统计+基准回归+稳健性检验+两步法机制检验+异质性分析 [3]胡楠,薛付婧,王昊楠.管理者短视主义影响企业长期投资吗?——基于文本分析和机器学习[J].管理世界,2021,37(05):139-156+11+19-21. 学科领域:公司治理;文本分析;机器学习 主要复刻指标:管理者短视主义;长期投资;公司治理;分析师关注 主要复刻实证方法:相关性分析+基准回归+稳健性检验(两阶段残差介入法)+中介效应 [4]沈坤荣,乔刚,谭睿鹏.国家级大数据综合试验区设立与就业增长[J].中国工业经济,2024,(12):5-23. 学科领域:政策评估;劳动经济学 主要复刻指标:大数据试验区;就业;地区创业水平;企业生产率;政府补贴 主要复刻实证方法:描述性统计+基准回归+稳健性检验(平行趋势检验+除混淆政策干扰+置换检验+双重差分的异质性处理效应)+两步法机制检验 [5]杜勇,张欢,陈建英.金融化对实体企业未来主业发展的影响:促进还是抑制[J].中国工业经济,2017,(12):113-131. 学科领域:公司金融;会计学 主要复刻指标:金融化;企业未来主业发展;投资效率;实物资本投资 主要复刻实证方法:描述性统计+组间差异检验+基准回归+调节效应+稳健性检验(工具变量+非线性关系+双重聚类调整)+中介效应 [6]祝树金,申志轩,文茜,等.经济政策不确定性与企业数字化战略:效应与机制[J].数量经济技术经济研究,2023,40(05):24-45. 学科领域:宏观经济学;数字经济学 主要复刻指标:经济政策不确定性;企业数字化战略;经营成本和经营风险;市场竞争程度 主要复刻实证方法:描述性统计+基准回归+稳健性检验(PSM+工具变量法+双重聚类调整)+两阶段模型机制检验 [7]王文蔚.气候冲击与企业违约风险:基于物理风险的视角[J].世界经济,2025,48(03):90-110. 学科领域:环境经济学;公司金融 主要复刻指标:企业违约风险;气候冲击;实体经营;企业成本转嫁能力;信息披露质量;.转型风险 主要复刻实证方法:描述性统计+基准回归+稳健性检验+三阶段模型机制检验 [8]聂辉华,阮睿,沈吉.企业不确定性感知、投资决策和金融资产配置[J].世界经济,2020,43(06):77-98. 学科领域:公司财务;公司金融 主要复刻指标:企业不确定性感知;金融化;融资成本;相对收益风险比; 主要复刻实证方法:描述性统计+基准回归+稳健性检验(联合固定效应+工具变量) [9]叶永卫,陶云清,王琪红,等.税收激励、人力资本投资与企业劳动生产率——来自2018年职工教育经费税前扣除政策的证据[J].数量经济技术经济研究,2023,40(05):136-157. 学科领域:劳动经济学;财政学 主要复刻指标:职工教育经费税前扣除政策;人力资本投资;企业劳动生产率;税收负担;资本密集度+经营绩效+员工工资和劳动收入份额 主要复刻实证方法:描述性统计+基准回归+稳健性检验(平行趋势+安慰剂检验+PSM-DID)+两步法机制 [10]沈坤荣,乔刚,林剑威.智能制造政策与中国企业高质量发展[J].数量经济技术经济研究,2024,41(02):5-25. 学科领域:政策评估;公司金融 主要复刻指标:智能制造政策;TFP;生产经营效率;,信息化能力;人力资本结构;数字基础设施建设 主要复刻实证方法:描述性统计+基准回归+稳健性检验(平行趋势+安慰剂检验+PSM-DID)+两步法机制+异质性分析 |
-
科研新手:经管、社科、金融领域硕博生,急需规范实证研究技能
-
高校教师:希望提升论文质量、冲刺SSCI/C刊
-
数据分析师:需掌握大数据的深度挖掘
李博士,来自中央财经大学,B站知识区Stata知名UP主,在Jornal of Empirical Finance、Pacific-Basin Finance Journal、《会计研究》等SSCI、CSSCI以及核心期刊发表论文9篇,研究方向宏观经济政策与微观企业行为、政府数字化治理。
《常用公共数据库全流程复现训练营》:从数据清洗到顶刊复现,解锁科研新范式!——覆盖CHARLS/CFPS/CGSS等国内外大型权威数据库,持续更新,助力你的学术跃迁!为了方便大学系统的学习论文复现,对于stata零基础的同学,本课程增加了stata操作基础的内容,包含如下:
|
模块一:数据文件和do文档操作(1H) 1、数据导入、导出、保存。 2、结果导出。 3、do 文档操作。 模块二:数据预处理清洗实战·(4H) (1)数据合并与重构 多期追踪数据纵向合并 宽表转长表 多表数据横向匹配 (2)缺失值与异常值处理 多重插补法 异常检测 (3)变量编码与标准化 分类变量哑变量化 连续变量标准化与分箱 对数、加减乘除等综合变量构建 数据探索(均值标准差、频数占比) 模块三:常用回归方法 ols,中介,调节,逻辑,固定效应,did,稳健性,异质性,工具变量 |
【已复现文章列表】
|
|
|
|
|
| CHARLS | 长期护理保险对家庭代际转移支付的影响 | 金融评论 | 2024.1 |
|
|
医养结合与老年人健康养老 | 财经研究 | 2022.4 |
|
|
Risk of fall in patients with chronic kidney disease: results from the China health and retirement longitudinal study (CHARLS) | BMC public health |
|
| CFPS | 电商进村政策实施的就业效应与机制分析 | 中国农村经济 |
|
|
|
数字经济对灵活就业的影响效应:基于数量和质量双重视角 | 中国软科学 |
|
|
|
全面两孩政策后性别角色态度对生育意愿的影响研究 |
|
|
|
|
|||
|
|
|
|
|
|
|
公共服务供给、生计资本转换与相对贫困的形成———基于 CGSS2015 数据的实证分析 |
|
|
|
|
|
|
|
|
|
|
|
|
-
科研新手:经管、社科、公卫领域硕博生,急需规范实证研究技能
-
高校教师:希望提升论文质量、冲刺SSCI/C刊
-
数据分析师:需掌握大规模社会调查数据的深度挖掘
实证初学者在面对着多如牛毛的学习资料和实证资源看似轻松,但面对这些零碎的知识时通常不知所措,各种细节处理上屡屡出错。本次课程着眼于如何帮助实证初学者系统地开始自己的第一篇论文,从数据库的初始下载、文件的初始处理、回归的第一张表到最后一张表进行系统的讲解,真正开始自己的第一篇论文。通过12小时的深度复现,之其然更知其所以然,快速掌握实证论文的套路化写作,并能轻松移植到其他相关论文的研究中。(注:《数字化转型与企业创新》不特指某一篇论文,而是假设我们有这个选题思路,重头开始,此篇论文重要用于整体的论文全流程方法学习;此外,还会对管理世界的顶刊《数字经济、创业活跃度与高质量发展》进行复刻,用于进一步强化学习)
二、课程内容
模块一:数据与变量
1.上市企业研究数据库
1.1 CSMAR数据库、CNRDS数据库(重要子库,子指标、预处理、注意事项)
2.变量生成
2.1变量选择框架(Libby’s box)
2.2 常用变量生成与解析(数字化转型、企业创新、融资约束SA、WW、KZ、FC,盈余管理、公司治理、企业办公地、风险承担等)
3.全流程回归前数据预处理
3.1 标准化CSMAR、CNRDS下载EXCEL预处理
3.2 数据横向合并(merge)、纵向合并(append),转置(reshape)、其他合并joinby
3.3 指标简单计算;增长率相关计算
3.4 变量初始调整;滞后相关处理;缺失值相关处理
3.5循环处理(foreach forvalues while)
3.6 其他
模块二:基准回归
1.基准回归理论讲解(在于讲懂原理,无复杂公式推导)
1.1合适标准误选择问题:稳健、聚类稳健、Bootstrap等;聚类层级选择
1.2多元线性回归与FWL定理
1.3 OLS与FE选择:FE不一定最优
1.4 统计显著性与经济显著性;回归系数过大或过小
1.5 遗漏变量偏误方向:低估还是高估
1.6 其他
2.基准回归实证操作(以复刻《数字化转型与企业创新为例》)
2.1 缩尾;初始剔除标准;vif
2.2 期刊论文常见表格输出(四表(描述性;相关性;组间差异与基准回归))
2.3 不同导出命令对比 esttab outreg2 reg2docx
2.4 其他问题
模块三:稳健性检验
1.稳健性检验理论
1.0 敏感性分析方法(Altonji方法;oster方法)
1.1 IV(工具变量选择;相关性与外生性;常用工具变量;弱工具变量与过度识别)
1.2 Heckman检验(样本选择模型与处理效应模型)
1.3 非线性模型(泊松与负二项、logit与probit、tobit、ppmlhdfe)
1.4 PSM方法
1.5 排除替代性解释
1.6 其他稳健性检验(替换核心变量;聚类与固定效应调整; 联合固定效应与时间趋势项等)
2.稳健性检验实证操作(以复刻《数字化转型与企业创新为例》)
2.1 IV(ivreghdfe;结果导出;常见指标分析)
2.2 Heckman检验(命令选择;操作细节与结果导出)
2.3 PSM 全流程操作
2.3 非线性模型(命令使用细节与注意事项)
2.4 其他稳健性检验具体回归命令使用
模块四:进一步分析
1.机制检验(以复刻《数字化转型与企业创新为例》)
1.1 概述;机制检验的目的
1.2 三步法模型理论与实操
1.3 江艇两步法模型理论与实操
1.4 交乘项模型做机制检验与实操
1.5 分组做机制检验与实操;组间系数差异检验方法
2.常见进一步分析方法
模块五:《数字经济、创业活跃度与高质量发展》复刻
1.相关基础数据下载
2.被解释变量经济高质量发展水平构建
3.解释变量数字经济发展水平构建
4.复刻之描述性统计、基准回归、中介效应回归
5.复刻之门槛效应回归、空间溢出效应回归
6.复刻之异质性回归于稳健性检验(含工具变量、DID、安慰剂检验)
| 课程名称 | 售价(元) |
1.常用公共数据库全流程复现——从数据清洗到实证分析(用于微观调查数据库) |
799 |
|
|
|
| 3.写作从模仿开始——12小时深度复现课程 | 599 |
夜雨聆风