拯救你的“废铁数据”:不出错的标准 Excel 录入模板与避坑指南
-
软件对中文兼容性极差,极易出现乱码。千万别带空格、括号或%、/等符号。 -
正解 :全部使用英文简写或拼音首字母,单词间用下划线连接。例如把“入院时收缩压”写成SBP_adm。
-
不要带单位 :格子里只写15,绝对不能写15 mg/dL,否则这列数据会瞬间从“数值变量”变成“文本字符”,无法计算均值。单位请写在你的“数据字典”里。
-
不要用颜色代替信息 :把重症患者标成红色背景,轻症标成绿色?统计软件导入时, 颜色是带不进去的 ,你的分类信息会彻底丢失。必须新建一列Severity,用数字1和2来代表。
-
不要乱写“缺失值” :如果这个病人没查血常规, 单元格直接留白(什么都别敲) 。千万不要自作聪明地填入“/”、“不详”、“拒查”、“N/A”或者“0”(除非他的指标真的是 0)。
-
Sheet 1:Raw_Data(原始数据表) —— 里面全是密密麻麻的数字和拼音表头。 -
Sheet 2:Codebook(数据字典) —— 这是你的“密码本”,用来解释 Sheet 1 里的数字到底是什么意思。
|
|
|
|
|
|
|---|---|---|---|---|
ID |
|
|
|
|
Age |
|
|
|
|
Sex |
|
|
|
|
Smoke |
|
|
|
|
WBC_adm |
|
|
|
×109/L |
Comorb_DM |
|
|
|
|
Follow_Date |
|
|
YYYY-MM-DD |
|
-
姓名:李四(泄露隐私)
-
年龄/性别:65岁/男(带单位、带汉字、且挤在一个格子里)
-
既往史:高血压3级(文本格式,无法做分类统计)
-
血压:140/90(无法计算)
-
血糖:未查(混入汉字,整列报废)
-
ID:001
-
Age:65
-
Sex:1
-
HTN:1
-
SBP:140
-
DBP:90
-
Glu:(直接留出空白)
夜雨聆风