编者按:第七届智慧医疗创新大赛已于2025年4月圆满结束,组委会推出“伴飞计划”,以对获奖项目进行宣传推广,并给行业提供参考和借鉴。深圳市瑞铭医疗科技有限公司和中山大学附属肿瘤医院联合申报的“AI医生辅助病案编码助手”项目,获得第七届智慧医疗创新大赛技术创新赛道全国一等奖。
病历病案数据质量涉及医保支付、国考、等级评审、医院运营统计、临床科研及医疗纠纷等医院临床、医院管理、医院科研的关键工作。但大部分医院苦于病历病案数据的低质量,造成珍贵的临床数据成为“沉睡资产”。我国DRG/DIP支付改革全面落地,国家医保局数据显示,首批试点医院因数据和编码质控问题导致的医保拒付金额占比高达37%,某医院甚至因主要诊断选择错误损失超千万医保基金。单凭人才引进、人工堆积很难全面实现病历病案数据质量的真正提升,医院对病案数据智能化质控和辅助书写的信息化解决方案需求强烈。
生成式大模型能实现对病历文本和逻辑推理的技术能力突破。基于长期深度的病案数据质控研究工作,2022年起本项目团队提出利用大模型来辅助病案ICD编码的创新思路。经过不断的实验和迭代,成功借助经过底层算法优化改造和编码质控能力后训练的病案垂域大模型,深度洞察病历文书中的复杂语义关系,精准识别文书与病案编码间的隐性关联,显著提升ICD编码和病历质控精准度。
该项目获得大赛全国一等奖,说明全国首个解读全病历实现诊断与手术操作全智能ICD编码的大模型AI应用,获得了全国专家评委的认可,我国医疗机构管理者开始意识到AI人机协同提升病案ICD编码质量的必要性。
思路、方案和路线
此前,建设全病历通读项目的关键技术主要依赖传统NLP方法,然而,传统NLP技术在语义理解方面存在一定的局限性。尽管可以通过语法分析、词性标注和命名实体识别等技术解析句子结构,但要完全理解语言的深层含义和上下文信息仍然是一个挑战。因此鲜有医院能真正落地实现完整的全病历解读和有效利用。
项目团队认为,生成式大模型通过在海量医学文献数据上的后训练,相比传统的自然语言处理(NLP)技术能够更好地理解医学概念、推理病情,从而实现更准确、更全面的病案编码和质控。
同时,项目团队意识到单纯依靠AI技术还不足以全面提升病案数据质量,还需要与医院信息化系统深度融合,形成全流程的解决方案。因此,项目团队提出了一套涵盖医生病历书写规范化、病案首页数据互联互通、全过程质控、知识库构建等多个环节的整体优化方案,力求从源头帮助临床医生提高病案数据的准确性、完整性和规范性,就像是给每位临床医生配备了一个病历书写和病案编码的专家助手。
临床科室缺乏关于DRG及病案首页填写规范的培训体系,再者,常由进修医生甚至实习医生承担病案首页填写工作,影响了填写质量。而编码员缺少了一些未详细记录的真实诊疗过程信息,难以精准理解复杂病历的内涵,在实际工作中会和临床医生产生分歧,如主要诊断和主要手术的选择问题。因此,AI在一定程度上可以协助加强编码员与临床医生之间的沟通。
一、自研病案垂域大模型
项目团队自研病案垂域大模型,在500亿tokens的医学医疗语料知识库上开展了针对性后训练,使其深度理解医学概念和临床知识。在此基础上,项目团队又使用超过100万条病案编码和病历书写规范相关的指令数据对模型进行深度微调,使其精准掌握完成准确病案分类编码、病历内涵质控等具体任务能力。通过领域适应和任务适应,使模型能够更好地服务于医疗病案场景。通过深度改造大模型底层,新增病案ICD编码的专属接口,使模型与通用大模型有根本性区别,能够高度专业适配信息化系统业务流程,精准满足病案首页编码质控的需求,实现自动审核与智能辅助纠错,极大提升质控效率与准确性。
二、实现基于本地化编码习惯的AI自适应学习迭代
基于LLM的ICD智能编码系统创新构建“动态学习-反馈优化”双循环机制,实现病案信息化编码领域两大突破:
1.“智能推荐+专家校准”协同工作流
系统在输出ICD智能推荐的同时,支持编码专家通过框选标注功能,以自然语言形式注入本地编码规则及编码偏好。最大程度方便编码专家们日常工作。
2.动态知识进化架构
系统内置三层学习引擎:“基础层”固化ICD编码规范,“增强层”吸收医疗机构本地化规则,“优化层”整合编码员的实际反馈。
通过以上三个层次的控制和过滤,达到ICD编码基础规范化、应用过往的ICD编码偏好以及未来可根据政策规范变动及时调整编码规则及习惯的效果。实现将各类可能发生情况考虑到AI迭代调整的行为中。
三、深度融合AI白盒化
项目团队将AI能力与信息化系统深度融合,不仅是技术层面的融合,更是从产品设计研发、业务流程梳理到用户体验的全方位优化,包括了智能ICD编码推荐、AI全病历溯源白盒可解释化、主要诊断编码推理分析、主要手术操作编码推理分析、多病历同时并发运算等优化。
项目团队构建了一个涵盖疾病诊断、手术操作、病案质控、医保支付等方面的大型知识库和规则库。通过将显性知识与模型学到的隐性知识相结合,既保证了病案编码和审核的准确性,又提高了智能化程度。规则库的不断扩充完善,也为质控工作提供了可解释、可迭代优化的基础。
一线临床医生及编码员反馈:“AI不是取代我们,而是帮我们扛掉80%的机械劳动,帮我们及时发现人容易漏掉的细节,让我们能专注审核复杂病历,实现全量病历内涵质控,同时提高我们的专业能力。”项目的创新之处在于,将生成式大模型技术应用于病案编码领域,实现了自动化、高效率和高准确性的编码过程。项目团队的模型在多个医疗数据集上进行了测试,显示出比传统方法更高的编码准确率。此外,项目团队还开发了用户友好的界面,使得非AI专业人员也能轻松使用。
项目团队的方案具有很强的落地性、推广度和普适性,可以满足绝大多数医院的病历文书和医疗质量管理需求。该项目的推广和普及将大大提高医院病案管理的效率和质量,在减轻医护人员的工作负担和书写病历时间的同时,为医疗大数据分析和研究提供了更准确、更全面的数据支持。