


点击蓝字 关注我们


“问卷星导出的数据,怎么一到SPSS里就全乱码了?”“数字全变成字符串,没法做分析了!”
从Excel向SPSS导入问卷数据时,许多人遭遇的第一个“下马威”就是格式混乱、编码错误或变量类型不对。
这个看似简单的操作,却隐藏着无数“坑”,若处理不当,后续所有分析都将在错误的数据基础上进行。
掌握一份标准、安全的“数据导入检查清单”,能为你的实证分析奠定坚实、干净的基础。


预处理


在打开SPSS之前,请先在Excel中对你导出的原始数据文件(通常是.csv或.xlsx格式)进行彻底检查与清理。
删除冗余信息:线上问卷平台(如问卷星、Credamo)导出的文件通常包含多行表头、说明、汇总统计。只保留数据矩阵本身:第一行是变量名,第二行及以下是数据。删除所有其他行和合并单元格。
规范变量名:
SPSS兼容:变量名不能以数字开头,不能包含空格、运算符(如+、-、*、/)和大多数标点符号(下划线_除外)。建议使用英文或拼音缩写,如gender, age, Q1_sat。
清晰易懂:避免使用“V1”、“Q1”等无意义命名,除非你有完整的变量编码手册。可以用“满意度_Q1”等形式。
处理异常值与格式:
统一数字格式:确保所有数值型数据(如李克特量表的1-5)的单元格格式为“常规”或“数值”,而非“文本”。文本格式的数字在SPSS中会被识别为字符串,无法计算。
查找乱码与缺失:检查是否有“#NULL!”、“#DIV/0!”等系统错误值,或“不适用”、“未回答”等文字。将系统缺失值统一清空单元格,将可理解的缺失(如“不想回答”)编码为一个明确的数值(如999),并记录在案。
保存为正确格式:清理完成后,将文件另存为“CSV (逗号分隔) (.csv)”格式*。这是最兼容、问题最少的文本格式,是导入SPSS的推荐桥梁。


在SPSS中安全导入


不要直接双击.csv文件,这会让SPSS用默认(可能是错误的)设置导入。
推荐路径:通过文本导入向导(完全控制)
打开SPSS,点击 【文件】→【打开】→【数据】。
在文件类型中选择 “所有文件 (.)”** 或 “CSV (.csv, .dat)”,找到并选中你的.csv文件。
这会自动启动 “文本导入向导”。
请严格遵循以下步骤:
步骤1/6:通常选择“是”,表示“你的文件与预定义格式匹配吗?”(这能保留变量名)。
步骤2/6:关键! 观察“数据预览”窗格。检查“第一个数据个案从第几行开始?”必须是2(因为第1行是变量名)。分隔符通常勾选“逗号”。
步骤3/6:再次确认变量名是否正确显示在第一行。观察数据预览,检查是否有因文本包含逗号导致的一行被错误分割的情况。
步骤4/6:在此界面,你可以逐个点击变量,在“数据预览”上方为其指定“变量名”和“数据类型”。这是最后一道纠错防线!对于问卷题项,通常应为“数值(N)”。对于开放式文本回答,设为“字符串(A)”。
步骤5/6:通常无需操作。
步骤6/6:点击“完成”。


导入后检查


数据进入SPSS后,工作只完成了一半。请立即在“变量视图”和“数据视图”中进行以下核查:
检查变量类型与小数位:
在“变量视图”中,逐列检查“类型”列。确保所有量表题、年龄、分数等变量类型为“数值(N)”,而非“字符串(S)”。
将字符串变量改为数值型:转换 → 自动重新编码,将其映射为新数值变量。
调整“小数”列,量表数据通常无需小数,设为0。
检查变量标签与值标签(赋予数据意义):
变量标签:在“标签”列,用中文为每个变量(尤其是Q1, Q2)添加清晰描述,如“工作满意度_题1”。这在分析时至关重要。
值标签:为分类变量(如性别:1=男,2=女)和量表(1=非常不同意…5=非常同意)定义值标签。选中变量,点击“值”列单元格,点击“…”,进行设置。
快速描述性统计扫描:
分析 → 描述统计 → 频率,将所有数值型变量选入。
查看输出中的“有效个案数”(检查是否与你的样本量一致,有无意外缺失)、“最小值”、“最大值”。如果某题项的最小值/最大值超出了合理范围(如5点量表出现了0或6),说明数据录入或导入时有错误,需返回Excel溯源修正。
检查缺失值定义:
在“变量视图”的“缺失”列,为之前标记的特殊缺失值(如999)进行定义,告诉SPSS这些值应被识别为“系统缺失值”,不参与计算。


常见“天坑”与拯救方案


乱码/中文显示为“?”:导入时编码错误。在“文本导入向导”的步骤2/6,尝试更改“文本编码”为“936: 简体中文(GB18030)”或“65001: Unicode(UTF-8)”。
数字变成字符串,无法计算:最常见问题。原因是在Excel中该列被设为“文本”格式,或在导入SPSS时被误识别。按上述“变量类型”检查方法,通过“自动重新编码”或转换 → 计算变量(使用NUMBER(原变量, F)函数)进行转换。
日期格式混乱:在Excel中,将日期列统一设置为“YYYY-MM-DD”格式再保存为CSV。在SPSS导入向导的步骤4/6,将该变量类型明确指定为“日期”,并选择匹配的格式。
案
方

一次干净、准确的数据导入,是所有高级分析的基石。花上半小时严谨地走完这个流程,可以避免在后续分析中耗费数小时去debug诡异的结果。记住,垃圾进,垃圾出。对你的数据好一点,它才会在分析中回报你可靠的真相。
夜雨聆风