在医院收费系统中,一笔费用本应归属明确科室、对应真实服务,但现实中却存在一种隐蔽的异常模式:费用在多个科室之间反复流转、相互抵消,最终未形成实际结算。这种「对冲」行为既干扰财务统计,也掩盖潜在违规风险。传统审计依赖人工抽样与规则筛查,难以发现跨科室、多环节、低频次的闭环流转。而 HIS收费对冲检测器 正是为此类问题量身打造的开源工具,它不靠经验猜,而是用图结构建模+环检测算法,把隐藏的资金暗流可视化、可量化、可追溯。
项目概述:从数据表到资金环路的视角跃迁
该项目将医院收费数据抽象为一张科室-收费项二部图。其中,节点分为两类:一类是「科室」(如呼吸内科、检验科、药房),另一类是「收费项目」(如「肺功能检查」「血常规」「头孢呋辛钠注射液」)。若某科室执行了某项收费,则在二者之间建立一条边。当同一笔费用被多个科室重复收取或相互冲销时,图中便可能形成闭合环路,例如「呼吸内科→肺功能检查→检验科→血常规→药房→头孢呋辛钠→呼吸内科」,构成一个长度为4的环。
这类环本身不违法,但若环内各边金额高度匹配、时间密集、路径固定,则极可能是人为设计的对冲痕迹。项目核心逻辑正是:构建图 → 搜索环 → 评估环的对冲强度 → 分级标记风险 → 生成可读报告。整个流程无需预设业务规则,而是让数据结构自己“说话”。
技术亮点:轻量架构下的精准识别能力
纯图结构驱动的异常发现不依赖字段正则或固定编码规则,而是基于 networkx 构建动态二部图,天然适配不同医院 HIS 系统的数据字段命名差异。
DFS 实现高效环检测针对医疗数据中环长度通常较短(3–8 节点)的特点,采用深度优先搜索遍历,在保障完整性的同时控制计算开销;支持配置最小/最大环长度、最低对冲金额等阈值,避免噪声干扰。
三级异常分类体系
完全对冲:环内所有收费项金额总和趋近于零,闭环完整 部分对冲:存在净流入或流出,但比例低于设定阈值(默认 0.3) 疑似对冲:金额匹配度高但缺乏完整凭证链,需人工复核
LLM 辅助归因,降低理解门槛在配置 OpenAI 或 Anthropic API 密钥后,系统自动调用大模型,将技术性环路描述转化为自然语言归因说明,例如:“该环涉及呼吸内科与检验科高频互转‘肺功能检查’与‘血气分析’项目,建议核查是否为打包服务拆分计费”。
双 CLI 入口,兼顾开发与业务人员Python 脚本
run.py提供快速启动能力;TypeScript 编写的his-ghost命令行工具则提供更友好的交互提示、参数校验与错误反馈,适合非程序员的财务或纪检人员直接使用。多格式输出,无缝对接下游流程HTML 报告含资金流向图与科室关联网络,便于汇报展示;JSON 结构化数据可接入 BI 工具二次分析;CSV 导出支持 Excel 排查与存档;Markdown 归因文档便于归入审计底稿。
应用场景:面向真实工作流的合规支持
该项目并非理论玩具,其设计直指一线工作痛点:
医院财务科可用于日常收费数据批量扫描,替代部分人工对账环节,快速定位高风险科室组合 纪检部门可在专项检查前导入历史数据,生成疑似对冲清单,作为线索初筛依据 医院信息科可将其嵌入 HIS 系统月度自检流程,辅助发现接口逻辑缺陷或权限配置漏洞 等级评审准备阶段,可生成《收费合规性图谱报告》,直观呈现资金流转健康度
所有使用均基于本地数据运行,不上传任何敏感信息,符合医疗数据安全基本要求。
使用指南:三步上手,五分钟完成首次检测
第一步:环境准备
确保已安装 Python 3.10+ 与 Node.js(v18+ 推荐):
pip install -r requirements.txtnpm installcp .env.example .env# 编辑 .env 文件,填入 OPENAI_API_KEY 或 ANTHROPIC_API_KEY(如需 LLM 报告)第二步:生成示例数据(可选)
快速验证安装是否成功:
python -m his_charge_ghost.data_generator --output data/sample该命令将在 data/sample/ 下生成模拟的 CSV 与 JSON 样例文件。
第三步:运行检测
最简命令,生成默认 HTML 报告:
python run.py --input data/sample/charges.csv查看详细过程与中间结果:
python run.py --input data/sample/charges.csv --verbose同时导出全部格式(HTML + JSON + CSV + Markdown):
python run.py --input data/sample/charges.csv --format all若希望用 TypeScript CLI 运行(适合习惯 Node.js 生态的用户):
npx tscnpx ts-node cli/index.ts --input data/sample/charges.csv --verbose所有输出默认保存至 output/ 目录,支持通过 --output 参数自定义路径,也可用 --threshold、--min-cycle-length 等参数精细调节检测灵敏度。
总结:让异常无处遁形的技术守门人
HIS收费对冲检测器不是另一个报表生成器,也不是一套需要定制开发的商业系统。它是一把轻量、透明、可验证的“数字探针”,把抽象的收费合规问题,转化为清晰的图结构问题。它不替代人工判断,但显著压缩了可疑线索的搜索空间;它不承诺自动定性,但让每一条异常路径都具备可追溯、可解释、可归档的基础。对于正在推进精细化管理、强化内控机制的各级医疗机构而言,这是一个即装即用、开箱可见价值的实用型医院信息工具。
项目当前免费开源,若您对项目有疑问、使用上的困惑或想深入交流,欢迎私信我们,或加入社群讨论。
项目地址:
https://github.com/nexorin9/his-charge-ghost-detector
夜雨聆风