AI工具+科研软件:学术论文问卷与访谈数据收集
各位同学,论文数据获取的核心方法,就是问卷调查数据。不少同学已经装了SPSS,这个工具就够用了。对于MBA同学,我的建议就是用这个方法,再搭配个访谈,不用追求太多创新。为啥?因为创新的方法大家还没吃透,贸然用很容易出错,用这种传统方法稳扎稳打,毕业肯定没问题。
那论文里最有技术含量的部分,就是问卷收集数据,整个流程分四步:设计问卷、预调查、修改问卷、正式调查,一步都不能少。首先说设计问卷,绝对不能让AI直接来,咱们的学术问卷和市场问卷不一样,AI理解不了学术研究的需求,必须自己先搭框架,之后可以让AI帮忙润色,直接用AI的肯定出问题。

那自己该怎么设计?核心就是看文献,硕士论文、优质的期刊文献,尤其是做实证、做问卷的英文期刊文献,别看人家篇幅短,问卷题项都写得很清楚,这都是靠谱的来源。用有出处的问卷,导师、答辩专家都不会质疑,这是站在前人的肩膀上做研究,不是自己拍脑袋想的,改一改就能用,千万别凭空设计。
设计完初稿要做预调查,找几十个人或者身边的人填一填,核心就是看看问题能不能看懂、有没有歧义,选项是不是清晰,有没有错别字这些基础问题,收集大家的建议再修改,才能形成正式问卷。这里给做问卷调查的同学提个建议,先找好问卷的参考出处,发给导师说明思路,设计完之后,把每一部分的文献来源都跟导师说清楚,这样导师能提前把控,避免后期收集完数据,研究被否定,那时候就来不及了。
接下来说说问卷的结构,一般分三部分。
第一部分是调查说明,要写清楚调查目的、保密承诺,说明数据只用于学术研究,不会发给受访者的领导,还要说清填写大概需要5分钟,也可以提一下填完有红包这类小奖励,这些信息都得写明白。
第二部分是人口统计学特征变量,就是性别、年龄、收入、是否党员这些常规问题,问卷系统一般能获取IP定位,受访者所在城市不用问。另外,和研究相关的非量表题项都放这部分。很多同学分不清量表和非量表,我简单说下,从非常满意到非常不满意这类是量表,性别、分阶段的年龄、分等级的收入,这些就是非量表,别放混了。
第三部分就是量表题项,要是论文里用量表,题项必须有出处,这样后续才能做信度效度分析。还有,题项数量要把握好,太少的话,关键变量没问到,后期补调查也没用,样本不一样了;太多的话,受访者填着不耐烦,数据质量会下降,一定要做好取舍。
这里教大家一个小技巧,AI可以帮我们高效做问卷的前两部分。我自己试过,设计经管专业本科生的问卷,让AI写调查说明,它把保密、调查目的、耗时这些要点都写全了,只需要改改团队名称,时间也能按需调整,直接能用。让AI设计人口统计学特征题项,它能出12道题,比我想的还细,性别、年龄、年级、专业、学校类型,还有创新项目经历、专业学习时间这些都有,大家根据自己的研究取舍就行。

不过有个细节要注意,不管是年龄还是收入,都别让受访者填具体数字,一是容易暴露隐私,二是数据也不好统计,要设区间。区间怎么定?还是看文献,参考别人的问卷设置,但是别找太老的文献,毕竟收入水平这些年变化挺大的,题项一定要匹配你的研究样本。
再说说量表,做学术研究,量表是必不可少的,因为很多问题没法直接问,比如“你幸福吗?”“你的主管支持你吗?”,直接问得到的答案没意义,受访者也不知道从哪个角度回答。这时候就要用量表题项,把问题具体化,比如“主管常常和我讨论工作中遇到的困难”,然后设置非常不同意到非常同意的选项,这样受访者才有明确的回答方向。而且量表题项不能只出一道,至少三道起,用了量表,后续的信效度分析才有意义。
问卷里还要设置两种特殊题项,提升数据质量。一个是跳转题项,比如调查快时尚消费,要是受访者没买过快时尚服装,直接让他跳出问卷,所有问卷平台都有这个功能,能排除不符合样本要求的人。另一个是反向题项,把同一个问题正反各问一次,看受访者回答是否一致,能筛掉那些不认真填的人,比如为了领红包几秒钟填完、所有选项都选一个的,这些无效问卷会把数据搞乱,必须删掉。而且把这两个设计写进研究设计里,审阅论文的人会觉得你做研究很专业、很科学。
还有同学问,量表题项从哪找?给大家推荐一个免费的中文数据库,OBHRM.net,这里面有超多量表,不管是人格假说这类经典的,还是新文献里的,都能找到,像创造性领导、创新自我效能这些都有,写人力资源、组织相关的论文,这个数据库能帮大家省好几周的时间。当然,找到题项不能直接用,要根据自己的研究问题修改,贴合研究情境,再形成初始问卷。
问卷设计好之后,该怎么发放收集?现在基本都是线上为主,就算线下,也是给个二维码让受访者手机填,除非你的研究对象是农民工、老年人这类不会用手机填,或者问题需要当面解释的,才用纯线下。线上平台包括问卷星、见数,我自己用下来感觉很好,问卷网应该也差不多,基础功能都是免费的,只有让平台帮忙收样本才需要花钱。

花钱收样本的费用看两个方面,题项多就贵,人群要求越特殊越贵,比如企业高管这类小众人群,样本本身少,费用就高;如果是普通人群,费用就低。但如果调查的是自己公司的员工,平台也帮不上忙,还是得自己把问卷录到平台,生成二维码或链接发给受访者。不管线上线下,都可以给点小激励,现在平台都有在线红包功能,最低一块钱,能直接发,也能审核后再发,还能设随机红包,能提高大家的填写积极性。
说完问卷,再说说访谈,毕业论文里超50%用问卷,还有约30%会用到访谈,很多时候是问卷加访谈结合用。访谈也有固定流程:制定访谈计划、确定人员分工、联系受访对象、发送访谈提纲、录音整理,学术访谈和管理咨询访谈都是这个套路。
访谈的核心是访谈提纲,它是开放式的,不用参考文献,根据自己的研究问题来设计就行,要是不知道怎么设,直接问AI就行。我试过让AI生成“生成式人工智能对大学生专业能力影响”的半结构化访谈提纲,它连引言都写好了,出了20多个问题,比我想的细多了,大家拿到后删改一下就行。甚至还能让AI根据提纲生成访谈介绍和具体问题,包括开场的自我介绍、调查说明,还有正式的问题,特别省心。
访谈可以线上也可以线下,用腾讯会议访谈的,线上录屏录音,之后直接转文字,特别方便。不管哪种方式,开场一定要再跟受访者说清调查目的,就算提前发了提纲,说清楚了人家才敢放开说,不然会很谨慎。
AI还能帮我们测试访谈提纲,比如让AI模拟成大四本科生,回答提纲里的问题,从受访者的角度看看问题合不合适,有没有需要修改的地方,这个方法特别实用。但有一点要注意,不能让AI直接替真人填问卷、做访谈。当然,有位教授做过相关研究,把顶级期刊的问卷让AI填,对比和真人回答的结论差异,这是正规的学术研究,和我们直接用AI凑数据完全是两回事。
访谈记录这块,除了军工企业这类不能录音拍照的,一般都可以用AI工具记录,比如豆包、通义,能直接把语音转文字,比以前用录音笔录完再自己整理方便多了。当然豆包要下APP,电脑浏览器版没有会议记录功能,这点大家注意一下。

最后再补充一个数据来源,除了问卷和访谈,还有公开的数据库数据。国家统计局的官网、国家数据网,能查到大量宏观经济数据,各省、大城市的统计局也有相关数据,四线城市一般没有统计年鉴,但政府工作报告里也有数据,这些都是免费的。
金融行业的同学可以用万德数据库,有宏观、企业、上市公司等各类数据;研究上市公司的,国泰安数据库是必备的,当然上市公司官网也能查到不少数据。还有一个小方法,要是政府网站上没找到你需要的数据,这时候可以去政府平台的在线留言板块,说清自己的身份、研究需求,留个邮箱,大概率能拿到数据。
以上就是问卷调查、访谈、二手数据收集和设计的核心方法,大家把这些要点掌握了,论文的数据部分就没问题了。
本文来自《AI工具+科研软件:学术论文写作全流程赋能》对应MBA课程整理。


夜雨聆风

