【统计分析软件SPSS】54、个案加权-夜雨聆风

【统计分析软件SPSS】54、个案加权

本系列（基于SPSS 31版本）文章配套数据可通过百度网盘获取：

链接：https://pan.baidu.com/s/15r0rLWkJlcecUvBPKZo_MQ?pwd=mnsj 提取码：mnsj

由于微信公众号已发布文章的内容及排版顺序无法二次编辑，为了方便大家后续查阅、检索，同时便于我对内容进行补充更新与完善，我会将所有已发布的推文，在个人网站上以结构化文档的形式重新整理、归档。欢迎前往查看：

https://www.mizhushare.com/docs/

应用场景

在SPSS的默认逻辑里，数据文件中的每一行代表一个独立的观测对象（例如一名受访者）。然而在实际研究中，出于数据存储效率或隐私保护的考虑，我们获取的往往是经过汇总的频数数据。

假设现有一份简单的性别统计汇总表：

若直接将上述两行数据导入SPSS进行分析，软件会默认样本总量仅为 2（即1名男性和1名女性），这将导致统计结果严重失真。

此时，必须使用【个案加权】功能告知SPSS每一行数据所代表的实际频数。启用加权后，SPSS在进行所有统计分析时，会将总样本量修正为350人，从而确保计算结果的准确性。

简而言之，个案加权就是赋予每行数据一个权重值（通常为频数），指示SPSS在计算时将该行数据视为N个独立的个案进行处理，而非单一的观测值。

需要注意的是，加权状态具有持续性。一旦开启个案加权，该设置将一直生效并随数据文件保存，直到用户手动关闭加权功能或指定新的权重变量为止。因此，在完成相关分析后，请务必检查并适时取消加权，以免影响后续其他分析任务的准确性。

操作步骤

加载示例数据【gender_agg.sav】。该数据为性别-年龄段调研汇总数据。

示例数据集是4行汇总数据，每行代表一组人群，人数（num变量）是该组实际样本量，未加权时，SPSS会把这4行当成4个独立个案，总样本量显示为4，完全失真；加权后，总样本量会自动计算为45+62+58+71=236，贴合真实调研样本。

点击顶部菜单栏的【数据→个案加权】，在打开的对话框中进行相应设置。

设置完成后，回到SPSS数据视图，数据编辑器窗口的右下角会显示「权重开启」字样，这就代表加权功能已生效，后续所有分析都会自动按权重计算。

完成个案加权设置后，即可进行后续的统计分析。本次将以频率分析操作为例验证加权是否生效。

点击顶部菜单栏的【分析→描述统计→频率】，在弹出的对话框中，将「gender、age」变量移入「变量」框，点击确定生成输出结果。

SPSS会输出两个变量的频率结果，频率表中显示的样本总数应与加权后的总频数一致（即235人），说明加权设置正确。

需要注意是，在完成特定的分析后，如果需要进行其他类型的不加权分析，记得取消加权！