[医疗软件开源] 医保拒付预测警报器:一款面向医院信息科与临床科室的医疗

在医保控费持续深化、DRG/DIP支付改革全面铺开的背景下，医院结算环节的风险识别正从“事后追责”转向“事前干预”。如何让医生在开具医嘱后、费用结算前，就预知该病例是否存在被医保拒付或低偿的风险？又如何给出可操作、易理解的整改建议？医保拒付预测警报器正是为此而生，一个轻量、本地化、可快速部署的开源医疗软件工具。

项目概述：用数据驱动临床行为优化

医保拒付预测警报器不是一个云端SaaS系统，也不是需要对接HIS的复杂中间件。它是一个基于Python构建的命令行工具，核心目标非常明确：基于历史结算数据与当月医嘱数据，滚动预测每个在院病例的结算风险，并生成可直接用于临床干预的“明日清单”。

整个流程闭环清晰：输入CSV或Excel格式的历史结算记录（含拒付/低偿标签）和当月医嘱明细；模型自动学习拒付模式；输出三类成果，交互式HTML报告、终端简明摘要、结构化Excel风险清单；最关键的是，对TOP高风险病例，还提供由大语言模型（LLM）生成的个性化整改建议（如“主诊断编码与手术不匹配，建议补充并发症编码”），或在无API密钥时降级为规则模板建议。

项目完全离线运行，所有数据处理均在本地完成，不上传任何原始病历或费用信息，符合医院对数据安全与隐私保护的基本要求。

技术亮点：务实架构下的精准与可控

本项目的技术选型兼顾效果、可维护性与落地友好度，拒绝过度工程化：

模型层稳健可靠底层采用LightGBM为主模型，辅以scikit-learn进行特征筛选与评估。相比黑盒深度学习，LightGBM具备良好的可解释性，便于医务科回溯风险归因，也更适合中小规模医疗数据集训练。
LLM建议智能但不依赖整改建议模块支持OpenAI或Anthropic API，但设计上严格解耦：若未配置.env中的API密钥，系统将无缝切换至预置规则模板，不影响核心预测功能的完整性与可用性。这意味着医院无需为引入AI而额外采购服务或承担合规风险，也能获得基础质控提示。
报告输出兼顾效率与体验HTML报告使用Plotly生成交互式饼图与条形图，支持鼠标悬停查看详情；Jinja2模板确保样式统一、内容可定制；Excel清单则严格遵循医务科日常处理习惯，字段完整、排序合理，可直接导入OA或质控系统二次分派。
模块化设计利于扩展项目按职责清晰划分为数据加载、特征工程、模型训练、风险分层、LLM建议、报告生成六大模块，目录结构一目了然。未来如需接入医保局最新拒付规则库、增加DIP分组特征，或对接医院内部知识图谱，均可在对应子模块中增量开发。

应用场景：适合医保办、质控科与临床医师协同使用的医院信息工具

本项目并非替代现有HIS或医保接口系统，而是作为其能力延伸，适用于以下典型场景：

医保办日常质控前置化每月初导入上月结算数据与当月已开医嘱，生成“高风险病例TOP 20”清单，提前介入沟通，减少月末集中申诉压力。
临床科室自我质控科主任可定期导出本科室病例风险分布，结合诊断编码、高值耗材使用等维度分析共性问题，组织针对性培训。
住院医师行为引导在医嘱系统旁部署简易脚本，医师提交关键医嘱（如高风险药品、高价检查）后，自动触发单例风险扫描，返回即时提示，形成“决策辅助闭环”。
新入职人员培训辅助利用模拟数据集演示常见拒付诱因（如诊断与手术不匹配、超适应症用药），帮助年轻医生建立医保合规意识。

需注意的是，项目当前定位为辅助决策工具，不替代医师专业判断，也不承担法律责任。所有预测结果均标注概率区间，建议始终结合临床实际综合评估。

使用指南：三步完成本地部署与首次运行

项目对环境要求简洁，Windows、macOS、Linux均可运行，全程无需数据库或服务器配置。

第一步：安装依赖

pip install -r requirements.txt

第二步：准备数据

将历史结算数据保存为data/historical_settlement_*.csv，当月医嘱数据保存为data/monthly_orders_*.csv。字段名与类型须严格匹配README中定义，特别是settlement_result必须为「正常」「拒付」「低偿」三类之一。

第三步：运行预测流程

最常用方式是一键执行完整流程（含训练、预测、生成报告）：

python -m src.main --history data/historical_settlement_100.csv --orders data/monthly_orders_50.csv --output output/

如已有训练好的模型，可跳过训练阶段，仅做预测：

python -m src.main --history data/historical_settlement_100.csv --orders data/monthly_orders_50.csv --predict-only

所有输出默认存入output/目录，包括report.html、risk_summary.txt与risk_list.xlsx三个核心文件。

若需启用LLM建议功能，请先复制并编辑环境配置文件：

cp .env.example .env

在.env中填入有效的OpenAI或Anthropic API密钥，保存后重新运行即可。

总结：小工具，大价值

医保拒付预测警报器没有宏大叙事，却直击一线痛点：它把原本分散在医保政策文件、结算反馈单、质控通报里的隐性知识，转化为每个病例可量化的风险分数与可执行的整改动作。它不追求“全院一张网”的集成野心，而是以最小侵入方式嵌入现有工作流，让数据真正服务于临床、赋能于管理。

项目代码开源、文档清晰、依赖精简、隐私可控，既适合信息科技术人员快速验证效果，也便于医务科同仁参与规则共建。更重要的是，它传递了一种务实的技术观：AI不是万能钥匙，但当它被装进一个边界清晰、责任明确、输出可信的工具壳里，就能成为推动医疗质量持续改进的扎实支点。

项目当前免费开源，若您对项目有疑问、使用上的困惑或想深入交流，欢迎私信我们，或加入社群讨论。

项目地址：

https://github.com/nexorin9/medical-insurance-denial-predictor