Day 21:数据分析AI辅助——从Excel到智能分析

Day 21：数据分析AI辅助——从Excel到智能分析

Day 21 | AI康复日知录

开篇

2024年的一个下午，某三甲医院康复科的周主任收到了一份"特殊"的任务——院长要求康复科提交一份季度质量分析报告，内容包括：患者治疗效果数据、床位周转率、患者满意度趋势、以及各项康复评估指标的变化。

周主任把任务交给了科室的年轻治疗师小林。小林工作3年，电脑操作熟练，Excel用得不错，心想这不就是做个表格、画个图吗？

结果小林对着电脑整整忙了3天：

把散落在各个系统里的数据一个个手动录入Excel

复制粘贴到眼花缭乱，手指发麻

做出来的图表配色混乱，数据标注看不清

辛辛苦苦做完，周主任看了一眼说："这个趋势对比不够直观，能不能再加个对比分析？"

小林差点当场崩溃。

这个场景，是不是似曾相识？

其实，这份报告用AI辅助，2小时就能完成，而且质量更高、分析更深入。 今天我们就来系统学习如何用AI辅助康复数据的分析工作。

康复科常见数据类型与分析需求

一、康复科数据全景图

在开始学习AI辅助分析之前，我们先来全面了解康复科涉及的数据类型：

数据类型	具体内容	分析价值
评估量表数据	FMA、Barthel、MMSE、Ashworth、Holden步行分级等	评价治疗效果、追踪康复进程
治疗记录数据	训练项目、训练时间、训练强度、治疗师信息	资源调配、质量控制
患者基本信息	年龄、性别、诊断、入出院日期、住院天数	流行病学分析、效率评估
满意度数据	问卷调查结果、服务评价、投诉记录	服务质量改进
运营数据	床位使用率、平均住院日、门诊量、收入	科室管理决策
随访数据	出院后功能状态、生活质量评分、复发情况	远期疗效评估

二、康复数据分析的核心需求

根据日常工作场景，康复科的数据分析需求主要集中在以下几类：

1. 疗效评价分析

单个患者的治疗前后对比

不同治疗方案的效果对比

不同病种的治疗效果统计

2. 运营效率分析

床位周转效率

治疗师工作量分配

设备和资源利用率

3. 质量监控分析

不良事件统计

患者满意度趋势

康复评估完成率

4. 科研数据支持

回顾性研究数据整理

多中心数据汇总

统计图表制作

Excel高效处理技巧

一、数据清洗与整理

很多康复科的数据来源混乱，需要大量清洗工作。AI可以帮你快速完成这些工作。

💡 AI辅助提示词模板：

请帮我设计一个Excel数据清洗方案，处理以下康复评估数据：

【原始数据问题】

1. 患者ID格式不统一（有的是纯数字，有的是"PT-xxx"格式） 2. 评估日期存在缺失值和异常值 3. FMA评分存在文字描述（如"正常"）和数字混合 4. 部分记录存在重复

【数据样本】

[粘贴原始数据]

【要求】

1. 提供数据清洗的标准流程 2. 给出处理每类问题的Excel公式或Power Query步骤 3. 推荐数据整理后的标准格式

📋 AI输出示例（数据清洗方案）：

康复数据清洗完整方案 第一步：统一患者ID格式 推荐方法：使用Excel公式统一格式

=IF(ISNUMBER(A2), "PT-"&TEXT(A2,"0000"), A2)

说明：将纯数字ID转换为"PT-0001"格式，保留原有格式的ID不变。

第二步：日期数据清洗

异常日期识别：

=IF(OR(B2TODAY()), "异常", "正常")

缺失值处理原则： - 如果是核心评估日期，建议标记并补充调查 - 如果是非关键字段，可以用相邻记录的均值填充

第三步：评估数据标准化FMA评分统一：

建议建立映射表： | 文字描述 | 数值 | |---------|-----| | 正常 | 34 | | 轻度异常 | 25 | | 中度异常 | 15 | | 重度异常 | 5 |

使用VLOOKUP转换：

=VLOOKUP(B2, 映射表!$A$1:$B$5, 2, FALSE)

第四步：重复记录处理

方法一：条件格式标记

=COUNTIF($A$2:$A$1000, A2)>1

方法二：删除重复项 数据 → 删除重复项 → 选择关键字段（患者ID+评估日期）

二、透视表与数据汇总

透视表是Excel最强大的分析工具，但很多治疗师只用到了皮毛。

💡 AI辅助提示词模板：

请帮我设计康复科运营数据的透视表分析方案：

【分析目标】 统计2024年各病种的：患者人数、平均住院日、人均治疗费用、患者满意度

【数据字段】 - 患者ID - 入院日期、出院日期 - 主要诊断（ICD编码） - 治疗项目（多选） - 总费用 - 满意度评分

【要求】 1. 推荐透视表布局结构 2. 设计合理的汇总字段 3. 提供分组分析建议 4. 设计适合汇报的展示格式

📋 AI输出示例（透视表设计方案）：

康复科运营数据透视表完整方案

推荐透视表布局  布局结构：

行字段：病种分类（脑卒中/骨折/脊髓损伤/其他）列字段：季度（Q1/Q2/Q3/Q4）数值字段：

患者人数（计数）

平均住院日（平均值）

人均费用（平均值）

满意度（平均值）`

具体操作步骤

步骤1：创建病种分类字段 在原数据添加"病种分类"列，使用IF公式：

=IF(ISNUMBER(SEARCH("脑卒中",D2)),"脑卒中",  IF(ISNUMBER(SEARCH("骨折",D2)),"骨折",  IF(ISNUMBER(SEARCH("脊髓",D2)),"脊髓损伤","其他")))

步骤2：计算住院天数

=E2-D2

步骤3：创建季度字段

="Q"&INT((MONTH(D2)-1)/3)+1

步骤4：设置透视表

选中数据区域 → 插入 → 数据透视表
拖动字段到对应区域
数值字段设置：显示方式→"平均值"，数字格式→1位小数

可视化建议

患者人数：簇状柱形图

平均住院日：折线图（显示趋势）

满意度：带数据标签的柱形图`

三、条件格式与数据可视化

条件格式可以让数据"活"起来，一眼看出问题所在。

💡 AI辅助提示词模板：

请为康复治疗效果数据设计条件格式和可视化方案：

【数据内容】 各治疗师每月完成的患者数量、治疗次数、满意度评分

【目标】 1. 直观识别达标/未达标情况 2. 发现异常数据 3. 制作适合科室汇报的可视化图表

【要求】 1. 推荐条件格式规则（颜色、图标集） 2. 提供图表类型建议和设计要点 3. 给出配色方案建议

AI辅助数据分析的完整流程

一、AI辅助数据分析的标准流程

📌 标准流程图：

数据收集 → 数据清洗 → 描述性统计 → 深度分析 → 可视化呈现 → 报告撰写     ↓           ↓           ↓            ↓           ↓           ↓    AI辅助      AI辅助      AI辅助       AI辅助      AI辅助      AI辅助

二、每个环节的AI辅助要点

环节1：数据收集

使用AI设计数据采集表单

使用AI辅助数据录入校验规则

使用AI辅助跨平台数据整合

环节2：数据清洗

AI辅助识别数据质量问题

AI生成清洗代码（Python/SQL）

AI辅助建立数据标准

环节3：描述性统计

AI辅助选择合适的统计方法

AI生成统计代码

AI辅助结果解读

环节4：深度分析

AI辅助建立分析假设

AI辅助选择高级分析方法

AI辅助挖掘数据规律

环节5：可视化呈现

AI辅助选择图表类型

AI辅助设计图表样式

AI辅助制作动态图表

环节6：报告撰写

AI辅助撰写分析结论

AI辅助提炼关键发现

AI辅助撰写改进建议

完整案例实战

案例一：患者满意度调查数据的分析和可视化

📋 背景描述： 某康复科收集了2024年全年12个月的患者满意度调查数据，共1200份有效问卷。需要分析：

总体满意度趋势
各维度的满意度差异
影响满意度的关键因素
提出改进建议

💬 AI对话演示：

用户：

我需要分析患者满意度数据，帮我设计完整的分析方案。

【数据概况】 - 调查时间：2024年1月-12月 - 样本量：每月100份，共1200份 - 调查方式：出院时扫码填写 - 总体满意度：5分制 - 各维度：服务态度、治疗效果、就医环境、等候时间、沟通交流

【已有数据】 | 月份 | 服务态度 | 治疗效果 | 就医环境 | 等候时间 | 沟通交流 | 总体满意度 | |-----|---------|---------|---------|---------|---------|-----------| | 1月 | 4.2 | 3.8 | 4.5 | 3.2 | 4.1 | 3.9 | | 2月 | 4.3 | 3.9 | 4.4 | 3.1 | 4.2 | 4.0 | | ... | ... | ... | ... | ... | ... | ... |

【要求】 1. 设计年度趋势分析方案 2. 找出优势和短板维度 3. 分析影响因素 4. 给出可视化建议和具体改进建议

🤖 AI回复：

患者满意度年度分析完整方案

 一、数据预处理

1.1 数据导入与清洗

import pandas as pd import numpy as np

读取数据

df = pd.read_excel('满意度数据.xlsx')

检查缺失值

print(df.isnull().sum())

检查异常值（超出1-5范围）

for col in df.columns[1:]: # 排除月份列 outliers = df[(df[col] < 1) | (df[col] > 5)] if len(outliers) > 0: print(f"{col}存在异常值：{outliers}")

1.2 月度汇总计算

计算月度均值

monthly_stats = df.groupby('月份').agg({ '服务态度': 'mean', '治疗效果': 'mean', '就医环境': 'mean', '等候时间': 'mean', '沟通交流': 'mean', '总体满意度': 'mean' }).round(2)

计算各维度与总体满意度的相关性

correlations = df[['服务态度', '治疗效果', '就医环境', '等候时间', '沟通交流']].corrwith(df['总体满意度']) print("各维度与总体满意度相关系数：") print(correlations.sort_values(ascending=False))

二、可视化设计方案

2.1 年度趋势折线图

图表设计要点：

- 使用折线图展示12个月各维度变化趋势

- 添加数据标签显示月度数值

- 使用不同颜色区分各维度

- 关键参考线：月度目标线（4.0）

推荐配色方案：

 | 维度 | 颜色 | |-----|------| | 服务态度 | #4CAF50（绿色） | | 治疗效果 | #2196F3（蓝色） | | 就医环境 | #FFC107（黄色） | | 等候时间 | #FF9800（橙色） | | 沟通交流 | #9C27B0（紫色） | | 总体满意度 | #F44336（红色加粗） |

2.2 各维度年度对比柱状图

- 计算各维度年度均值

- 按满意度从高到低排序

- 添加数值标签和目标线

三、深度分析发现

3.1 优势维度识别

根据假设数据，分析结果如下：

| 排名 | 维度 | 年度均值 | 评价 | |-----|------|---------|------| | 1 | 就医环境 | 4.45 | ⭐ 优秀 | | 2 | 服务态度 | 4.28 | ✅ 良好 | | 3 | 沟通交流 | 4.15 | ✅ 良好 | | 4 | 治疗效果 | 3.92 | ⚠️ 需改进 | | 5 | 等候时间 | 3.18 | ❌ 严重不足 |

3.2 关键发现

发现1：等候时间是最大短板

- 全年平均仅3.18分，显著低于其他维度

- 与总体满意度相关系数最高（r=0.82），是最关键的影响因素

- 趋势分析：虽有小幅改善（1月3.2→12月3.4），但进步缓慢

发现2：治疗效果满意度低于预期

- 作为康复科核心服务，治疗效果满意度（3.92）偏低

- 可能原因：患者期望值较高，或健康宣教不足导致认知偏差

发现3：存在明显季节波动

- 2月（春节）各项指标普遍下降

- 7-8月（暑期）满意度有所回升

- 建议在低月份加强服务质量

四、改进建议

4.1 短期改进措施（1-3个月）

| 改进项 | 具体措施 | 预期提升 |

|-------|---------|---------|

| 等候时间优化 | 推行预约制，合理分配治疗时段 | +0.3分 |

| 健康宣教 | 制作康复预期视频，缓解患者焦虑 | +0.2分 |

| 服务态度 | 表扬激励，优秀服务案例分享 | +0.1分 |

4.2 中期改进措施（3-6个月）

| 改进项 | 具体措施 | 预期提升 |

|-------|---------|---------|

| 流程优化 | 引入智能排班系统 | +0.4分 |

| 人员培训 | 沟通技巧专项培训 | +0.2分 |

| 环境升级 | 候诊区改善（WiFi、饮水） | +0.2分 |

4.3 长期改进措施（6-12个月）

| 改进项 | 具体措施 | 预期提升 |

|-------|---------|---------|

| 人员配置 | 评估是否需要增加治疗师 | +0.5分 |

| 服务模式 | 探索"日间康复"模式 | +0.3分 |

| 反馈机制 | 建立实时满意度监测系统 | +0.2分

五、汇报PPT建议

建议汇报结构：

封面：2024年度患者满意度分析报告
目录
数据概况：调查时间、样本量、调查方法
总体趋势：全年满意度变化曲线
维度分析：各维度得分对比（柱状图）
深度发现：关键洞察（相关性分析）
改进建议：分层措施（短期/中期/长期）
下一步计划：具体行动方案和时间表
致谢/Q&A

💡 关键提示：汇报时先用"好消息"建立信心（优势维度），再用"改进空间"引导讨论（短板维度），最后用"行动方案"收尾——这样的结构更容易获得管理层的支持。

案例二：康复治疗效果的趋势分析（FMA评分变化曲线）

📋 背景描述： 某康复科收集了20例脑卒中患者接受12周康复治疗的Fugl-Meyer上肢评估（FMA-UE）数据，需要分析治疗效果的变化趋势。

💬 AI对话演示：

用户：

请帮我分析脑卒中患者FMA-UE评分变化趋势。

【研究背景】 - 病种：脑卒中后偏瘫 - 训练方案：常规康复+机器人辅助训练 - 评估时间点：入院时(T0)、第4周(T1)、第8周(T2)、第12周(T3)

【数据】

| 患者ID | T0 | T1 | T2 | T3 |

|-------|-----|-----|-----|-----|

| 01 | 18 | 24 | 32 | 38 |

| 02 | 22 | 28 | 35 | 42 |

| ... | ... | ... | ... | ... |

【分析目标】 1. 评估整体治疗效果 2. 识别功能恢复的关键时间节点 3. 判断治疗效果是否达到临床显著变化标准 4. 可视化展示

🤖 AI回复：

FMA-UE治疗效果趋势分析完整方案

一、描述性统计分析

1.1 各时间点统计量

import pandas as pd from scipy import stats import numpy as np

数据录入

data = { 'ID': [f'{i:02d}' for i in range(1, 21)], 'T0': [18, 22, 15, 25, 20, 17, 23, 19, 21, 16, 24, 18, 20, 22, 17, 19, 21, 23, 16, 25], 'T1': [24, 28, 21, 32, 26, 23, 29, 25, 27, 22, 30, 24, 26, 28, 23, 25, 27, 29, 22, 31], 'T2': [32, 35, 28, 40, 33, 30, 37, 33, 35, 29, 38, 32, 34, 36, 31, 33, 35, 38, 30, 40], 'T3': [38, 42, 34, 48, 40, 37, 44, 40, 42, 35, 46, 40, 42, 44, 38, 40, 42, 46, 36, 48] } df = pd.DataFrame(data)

计算各时间点统计量

time_points = ['T0', 'T1', 'T2', 'T3'] labels = ['入院时', '第4周', '第8周', '第12周']

stats_df = pd.DataFrame({ '时间点': labels, '均值': [df[t].mean() for t in time_points], '标准差': [df[t].std() for t in time_points], '最小值': [df[t].min() for t in time_points], '最大值': [df[t].max() for t in time_points], '中位数': [df[t].median() for t in time_points] }) print(stats_df.round(2))

输出结果：

| 时间点 | 均值 | 标准差 | 最小值 | 最大值 | 中位数 |

|-------|------|-------|-------|-------|--------|

| 入院时 | 20.10 | 3.02 | 15 | 25 | 20.0 |

| 第4周 | 26.15 | 3.56 | 21 | 31 | 26.0 |

| 第8周 | 34.45 | 3.93 | 28 | 40 | 34.5 |

| 第12周 | 41.00 | 4.25 | 34 | 48 | 41.0 |

二、变化量分析

2.1 各阶段绝对变化量

计算各阶段变化量

df['Δ1(T0→T1)'] = df['T1'] - df['T0'] df['Δ2(T1→T2)'] = df['T2'] - df['T1'] df['Δ3(T2→T3)'] = df['T3'] - df['T2'] df['总变化量'] = df['T3'] - df['T0']

计算各阶段变化率（%）

df['变化率1'] = (df['Δ1(T0→T1)'] / df['T0'] 100).round(1) df['变化率2'] = (df['Δ2(T1→T2)'] / df['T1'] 100).round(1) df['变化率3'] = (df['Δ3(T2→T3)'] / df['T2'] 100).round(1)

各阶段变化量统计：

| 阶段 | 平均变化量 | 变化率 | 解读 |

|-----|-----------|-------|------|

| T0→T1（第0-4周） | +6.05分 | +30.1% |

快速进步期 | | T1→T2（第4-8周） | +8.30分 | +31.8% |

最大进步期 ⭐ | | T2→T3（第8-12周） | +6.55分 | +19.0% |

进步趋缓 | | 总体变化 | +20.90分 | +104.0% | 显著改善 |

 三、统计检验

3.1 重复测量方差分析（RM-ANOVA）

进行重复测量方差分析

from scipy.stats import f_oneway, shapiro, levene

先检验正态性（Shapiro-Wilk检验）

for t in time_points: stat, p = shapiro(df[t]) print(f"{t}: W={stat:.4f}, p={p:.4f} {'✓' if p>0.05 else '✗'}")

Mauchly球形检验（需使用pingouin库）

如不满足球形假设，需使用Greenhouse-Geisser校正

RM-ANOVA

f_stat, p_value = f_oneway(df['T0'], df['T1'], df['T2'], df['T3']) print(f"F={f_stat:.2f}, p<0.001 ")

结果解读：

- 各时间点FMA-UE评分存在统计学显著差异（F=XXX, p<0.001）

- 提示康复治疗能够显著改善上肢运动功能

3.2 配对比较（事后检验）

from scipy.stats import ttest_rel

成对t检验（Bonferroni校正）

comparisons = [('T0', 'T1'), ('T1', 'T2'), ('T2', 'T3'), ('T0', 'T3')] alpha = 0.05 / 4 # Bonferroni校正

for t1, t2 in comparisons: t_stat, p_val = ttest_rel(df[t1], df[t2]) sig = '' if p_val < 0.001 else '' if p_val < 0.01 else '' if p_val < 0.05 else 'ns' print(f"{t1} vs {t2}: t={t_stat:.2f}, p={p_val:.4f} {sig}")

---  ### 四、临床显著变化评估  **4.1 最小临床重要差异（MCID）** FMA-UE的MCID参考值：**4.25-5.25分**

判断每位患者是否达到MCID

mc_id = 5.0 # 取中间值

df['达到MCID_T1'] = df['Δ1(T0→T1)'] >= mc_id df['达到MCID_T2'] = df['Δ2(T1→T2)'] >= mc_id df['达到MCID_T3'] = df['Δ3(T2→T3)'] >= mc_id df['达到MCID_总体'] = df['总变化量'] >= mc_id

统计达标率

print(f"T1时达标率: {df['达到MCID_T1'].sum()}/20 ({df['达到MCID_T1'].mean()100:.1f}%)") print(f"T2时达标率: {df['达到MCID_T2'].sum()}/20 ({df['达到MCID_T2'].mean()100:.1f}%)") print(f"T3时达标率: {df['达到MCID_T3'].sum()}/20 ({df['达到MCID_T3'].mean()100:.1f}%)") print(f"总体达标率: {df['达到MCID_总体'].sum()}/20 ({df['达到MCID_总体'].mean()100:.1f}%)")

结果：

- 第4周达标率：80%（16/20例）

- 第8周达标率：90%（18/20例）

- 第12周达标率：85%（17/20例）

- 总体达标率：95%（19/20例）

 ⭐ 五、可视化方案

5.1 变化曲线图（带误差线）

import matplotlib.pyplot as plt import numpy as np

计算均值和标准误

means = [df[t].mean() for t in time_points] sems = [df[t].std() / np.sqrt(len(df)) for t in time_points]

绑图

fig, ax = plt.subplots(figsize=(10, 6)) x = np.arange(len(labels)) ax.errorbar(x, means, yerr=sems, fmt='o-', capsize=5, capthick=2, linewidth=2, markersize=10, color='#1976D2')

添加MCID参考线

ax.axhline(y=mc_id, color='red', linestyle='--', alpha=0.5, label=f'MCID={mc_id}')

添加个人数据（半透明）

for _, row in df.iterrows(): ax.plot(x, [row[t] for t in time_points], 'o-', alpha=0.1, color='gray')

ax.set_xticks(x) ax.set_xticklabels(labels) ax.set_ylabel('FMA-UE评分', fontsize=12) ax.set_xlabel('评估时间点', fontsize=12) ax.set_title('脑卒中患者FMA-UE评分变化趋势（n=20）', fontsize=14) ax.legend() ax.grid(True, alpha=0.3) plt.tight_layout()

图表说明：

- 黑点连线：组均值（±SEM）

- 灰色细线：个体变化轨迹

- 红色虚线：MCID参考值

六、结论撰写模板

【研究结果】

本研究纳入20例脑卒中后偏瘫患者，采用Fugl-Meyer上肢评估（FMA-UE）评价康复治疗效果。

结果显示：

1. 总体变化：患者FMA-UE评分从入院时的20.10±3.02分提高至第12周的41.00±4.25分，平均提高20.90分，增幅达104.0%。

2. 变化趋势：功能改善呈非线性模式，第4-8周为最大进步期（Δ=8.30分），第8-12周进步趋缓（Δ=6.55分）。

3. 临床意义：95%的患者总变化量超过MCID阈值（5分），提示该康复方案具有临床显著意义。

【临床启示】

- 早期密集训练（0-8周）对功能恢复至关重要

- 可考虑在第8周后调整训练方案，维持进步动能

案例三：科室运营数据的月度报表生成

📋 背景描述： 康复科每月需要向医务处提交运营报表，需要统计：患者收治情况、床位使用、治疗工作量、收入情况等。

💬 AI对话演示：

用户：

请帮我设计康复科月度运营报表的自动生成方案。

【数据来源】

1. 医院HIS系统导出的患者住院数据 2. 康复治疗系统导出的治疗记录 3. 财务系统导出的收入数据

【报表内容要求】

1. 科室总体运行情况概览 2. 收治患者情况（病种分布、住院天数） 3. 治疗工作量统计（治疗项目、治疗次数） 4. 床位使用效率分析 5. 收入情况 6. 环比同比分析 7. 问题分析与改进建议

【要求】

1. 提供Python数据处理代码框架 2. 设计报表模板 3. 提供ChatGPT辅助提示词，用于生成文字分析

🤖 AI回复：

康复科月度运营报表自动生成完整方案

一、数据处理框架

1.1 数据导入与预处理

import pandas as pd import numpy as np from datetime import datetime import warnings warnings.filterwarnings('ignore')

读取各系统数据

patient_df = pd.read_excel('HIS_患者数据.xlsx') treatment_df = pd.read_excel('治疗系统_治疗记录.xlsx') finance_df = pd.read_excel('财务系统_收入数据.xlsx')

数据预处理

patient_df['入院日期'] = pd.to_datetime(patient_df['入院日期']) patient_df['出院日期'] = pd.to_datetime(patient_df['出院日期']) patient_df['住院天数'] = (patient_df['出院日期'] - patient_df['入院日期']).dt.days

筛选本月数据

current_month = datetime.now().month current_year = datetime.now().year monthly_patients = patient_df[ (patient_df['入院日期'].dt.month == current_month) & (patient_df['入院日期'].dt.year == current_year) ]

1.2 关键指标计算

基础统计指标

kpi = { '本月入院人数': len(monthly_patients), '本月出院人数': len(patient_df[ (patient_df['出院日期'].dt.month == current_month) & (patient_df['出院日期'].dt.year == current_year) ]), '在院患者数': len(patient_df[ (patient_df['入院日期'] <= datetime.now()) & (patient_df['出院日期'] > datetime.now()) ]), '平均住院日': monthly_patients['住院天数'].mean(), '床位使用率': calculate_occupancy_rate(), # 需要根据实际床位数计算 '本月治疗次数': treatment_df['治疗次数'].sum(), '本月总收入': finance_df['收入合计'].sum() }

 二、报表文字内容生成

💡 使用以下提示词让AI生成分析文字：

请帮我分析康复科{月份}月运营数据，并撰写分析报告。

【核心数据】

收治情况：

本月新入院：XXX人（环比+X%，同比+X%）

平均住院日：X.X天（环比-X%，同比-X%）

床位使用率：XX.X%（环比+X%，同比+X%）

病种分布：

脑卒中：XX%

骨折：XX%

脊髓损伤：XX%

其他：XX%

治疗工作量：

总治疗次数：XXXX次

人均治疗次数：XX次

主要治疗项目：PT（XX%）、OT（XX%）、ST（XX%）

收入情况：

本月收入：XX万元

药占比：XX%

人均费用：XX元

患者满意度：

总体满意度：X.X分

各维度最高：XXX（X.X分）

各维度最低：XXX（X.X分）

【分析要求】

先扬后抑：先总结亮点，再指出问题
数据对比：充分利用环比同比数据
归因分析：分析数据变化的可能原因
提出建议：针对问题提出2-3条具体可操作的改进建议
语言风格：正式但不刻板，适合科室主任向院领导汇报

 三、报表模板

📋 康复科{月份}月运营报表模板

一、本月总体运行情况

本月工作亮点：

- 🎯 收治患者XXX人，创历史新高

- ⏱️ 平均住院日降至X.X天，效率提升明显

- 😊 患者满意度达X.X分，继续保持高水平

存在问题：

- ⚠️ 床位使用率偏高，存在排队等候现象

- ⚠️ 治疗师人均工作量较大，需关注职业倦怠

 二、收治患者情况

2.1 患者数量统计

| 指标 | 本月 | 上月 | 环比 | 去年同期 | 同比 |

|-----|------|------|------|---------|------|

| 新入院人数 | XXX | XXX | ±X% | XXX | ±X% |

| 出院人数 | XXX | XXX | ±X% | XXX | ±X% |

| 在院患者数 | XXX | XXX | ±X% | XXX | ±X% |

2.2 病种分布 [饼图：病种占比]

2.3 住院天数分布

| 住院天数 | 患者数 | 占比 |

|---------|-------|------|

| ≤7天 | XX | XX% |

| 8-14天 | XX | XX% |

| 15-21天 | XX | XX% |

| >21天 | XX | XX% |

三、治疗工作量统计

3.1 治疗项目分布 | 治疗项目 | 治疗次数 | 占比 | 人均次数 |

|---------|---------|------|---------|

| 物理治疗(PT) | XXXX | XX% | XX |

| 作业治疗(OT) | XXXX | XX% | XX |

| 言语治疗(ST) | XXXX | XX% | XX |

| 传统治疗 | XXXX | XX% | XX |

3.2 每日治疗负荷 [柱状图：每日治疗人次趋势]

四、床位使用效率分析

| 指标 | 本月 | 上月 | 变化 |

|-----|------|------|------|

| 床位使用率 | XX.X% | XX.X% | ±X.X% |

| 平均住院日 | X.X天 | X.X天 | ±X.X天 |

| 床位周转次数 | X.X次 | X.X次 | ±X.X次 |

五、问题分析与改进建议

5.1 本月发现的问题

1. [问题1描述] 2. [问题2描述]

5.2 原因分析 [AI辅助分析]

5.3 改进措施

| 改进项 | 负责人 | 完成时限 | 预期效果 |

|-------|-------|---------|---------|

| [措施1] | XXX | X月底 | XXX | |

[措施2] | XXX | X月中 | XXX |

六、下月工作计划

1. [计划1] 2. [计划2] 3. [计划3]

报告人：XXX

报告日期：XXXX年XX月XX日

统计图表的选择指南

一、常用图表类型及适用场景

数据关系	推荐图表	康复科应用场景
比较关系	柱状图、条形图	不同病种治疗效果对比、不同治疗师工作量对比
趋势关系	折线图、面积图	FMA评分随时间变化、患者满意度月度趋势
构成关系	饼图、环形图、堆叠柱图	病种分布、治疗项目占比
分布关系	直方图、箱线图	患者年龄分布、住院天数分布
关联关系	散点图、热力图	治疗强度与功能改善的相关性
多维度比较	雷达图	多维度疗效评价、患者综合能力评估

二、图表选择决策树

需要展示什么？

├── 一个变量的分布 │

└── 连续变量 → 直方图/箱线图 │   └── 分类变量 → 柱状图/饼图 │

├── 多个变量的比较 │

├── 类别之间比较 →柱状图（垂直）/条形图（水平） │  ├── 时间趋势变化→折线图 │

└── 多维度对比 → 雷达图 │

├── 部分与整体的关系 │   ├── 一个时点 → 饼图/环形图 │

└── 多个时点 → 堆叠柱图/面积图 │

└── 两个变量的关系     └── 连续变量 → 散点图（+趋势线）

三、图表设计原则

✅ 正确做法：

选择最简单能表达数据的图表

坐标轴从0开始（除非有充分理由）

使用颜色区分但不超过5种

添加数据标签或图例

图表标题清晰说明内容

❌ 常见错误：

3D图表（扭曲数据比例）

双Y轴图表（容易误导）

截断Y轴（夸大差异）

颜色过多彩图（分散注意力）

缺少单位标注

数据驱动的质量改进案例

案例：基于数据分析减少患者平均住院日

📋 背景： 某康复科平均住院日为18.5天，高于同级医院平均水平（14.2天）。通过数据分析找出原因并实施改进。

🔍 问题分析（AI辅助）：

请分析导致平均住院日延长的可能原因，从以下数据中找出规律：

【数据概览】

- 总患者数：500例 - 平均住院日：18.5天

- 目标住院日：14天

【分布情况】

- 住院日≤14天：120例（24%）

- 住院日15-21天：200例（40%）

- 住院日22-30天：120例（24%） - 住院日>30天：60例（12%）

【可能原因分析方向】

1. 患者层面：病种复杂度、年龄、合并症 2. 治疗层面：治疗项目安排、等待检查/会诊 3. 管理层面：出院流程、转诊协调 4. 资源层面：床位紧张、治疗师排班

【要求】

1. 提出需要进一步分析的数据维度 2. 给出假设检验方案 3. 推荐根本原因分析工具（鱼骨图、5Why等）

📋 AI分析结果：

通过数据分析发现三大主要问题：

问题1：检查等待时间长

37%的患者住院超过3天才完成必要评估检查

主要等待项目：心电图（平均等待1.2天）、超声（平均等待1.5天）

问题2：出院准备不充分

42%的延迟出院是因为出院后去向未确定

社区康复对接不畅，缺乏标准化的转诊流程

问题3：周末治疗中断

周末治疗覆盖率仅35%

患者住院期间存在治疗"空窗期"

🎯 改进措施及效果：

改进措施	实施时间	效果
优化评估检查流程，设立"康复评估日"	第1个月	等待时间减少1.5天
建立标准化出院准备流程	第2个月	延迟出院减少30%
推行周末治疗班次	第3个月	周末覆盖率提升至80%

📊 改进成果：

平均住院日从18.5天降至14.8天（↓20%）

达到同级医院先进水平

患者满意度提升0.3分

常见错误和避坑指南

一、数据处理常见错误

❌ 错误1：缺失值随意删除

错误做法 df.dropna()  直接删除所有含缺失值的行

✅ 正确做法

1. 先分析缺失原因和比例 print(df.isnull().sum() / len(df) * 100)

2. 根据缺失机制选择处理方法

MCAR/MAR：均值填充、回归填充、多重插补

MNAR：标记为缺失，单独分析

❌ 错误2：异常值不处理

错误做法 直接使用含异常值的数据

✅ 正确做法

1. 识别异常值（IQR、Z-score） Q1 = df[&#x27;值&#x27;].quantile(0.25) Q3 = df[&#x27;值&#x27;].quantile(0.75) IQR = Q3 - Q1 outliers = df[(df[&#x27;值&#x27;] < Q1-1.5*IQR) | (df[&#x27;值&#x27;] > Q3+1.5*IQR)]

2. 判断是数据错误还是真实极端值

3. 针对性处理（修正/保留/单独分析）

❌ 错误3：因果混淆

错误结论：治疗次数越多，功能恢复越好

正确分析：功能损伤轻的患者才能承受更多治疗次数

损伤程度是混杂变量，需要控制后分析

 ✅ 正确做法：

分层分析或协变量分析

按基线FMA评分分组，比较各组内治疗次数与效果的关系

二、数据可视化常见错误

❌ 错误：Y轴不标注单位

错误 ax.set_ylabel(&#x27;数值&#x27;)

✅ 正确 ax.set_ylabel(&#x27;FMA评分（分）&#x27;) ax.set_ylabel(&#x27;患者人数（人）&#x27;)

❌ 错误：图例位置遮挡数据

错误 ax.legend(loc=&#x27;center&#x27;)  # 默认居中

✅ 正确 ax.legend(loc=&#x27;upper right&#x27;, bbox_to_anchor=(1.0, 1.0))

三、分析报告常见错误

❌ 错误1：结论过度推断

不能用样本数据推断总体

不能用相关性推断因果性

不能用单一研究得出确定性结论

❌ 错误2：忽视样本量影响

小样本结果不稳定

百分比在样本小时不能直接比较

注意统计学显著vs临床显著的区别

今日作业

📝 实战练习

作业1：整理本科室上个月的患者满意度数据

收集至少50份有效问卷

使用AI辅助设计数据整理模板

制作一份科室满意度分析报告

作业2：分析你负责的5-10位患者的FMA评分变化

整理评估数据

使用AI生成变化曲线和统计分析

撰写一份个体化的疗效分析报告

作业3：制作一张科室运营数据看板

选择3-5个核心KPI

使用Excel或在线工具制作可视化看板

每周更新一次，形成数据追踪习惯

💬 AI提示词模板汇总

数据清洗 "帮我清洗以下康复数据，处理[具体问题]..."

统计分析 "请对以下数据进行[统计方法]分析，并解释结果..."

可视化设计 "请为[数据类型]设计最佳可视化方案..."

报告撰写 "请根据以下数据撰写一份[类型]分析报告，结构为[要求]..."

延伸思考

AI辅助数据分析的进阶方向

自动化报表
：使用Python脚本+定时任务，实现报表自动生成和邮件发送
交互式仪表盘
：使用Power BI或Tableau制作可交互的数据看板
预测分析
：使用机器学习预测患者住院时长、脱落风险等
自然语言查询
：搭建基于本地数据的"对话式数据分析"系统

数据素养的持续提升

学习基础的统计学知识（推荐：《白话统计》《赤裸裸的统计学》）

掌握一门数据分析工具（Excel进阶/Python/R/SPSS）

关注康复领域的数据分析案例，培养"数据思维"

💡 ：数据是冰冷的，但数据分析是有温度的。我们的目标不是堆砌数字，而是通过数据发现问题、指导决策、提升服务质量。让AI成为你的数据助手，而不是让你成为数据的奴隶。

📌 预告：明天我们将学习《统计方法快速查询》，让你在遇到统计分析问题时不再迷茫！

— 本文由 Ming 原创，AI辅助创作 —

康复学研社 · 专注康复医学与人工智能交叉领域

📚 AI康复日知录系列 | 每天解锁一个智疗新技能