行业案例:协和医院用 LLM 把病历摘要效率提升 4 倍
医疗 AI 这两年最大的变化是:从”影像识别单点工具”进化到”覆盖医生日常文字工作的 LLM 工作流”。协和医院联合清华团队 2025 年 Q4 开始的试点是其中一个典型样本。
背景
病历摘要是住院医师每天最耗时的文字工作之一:把当天问诊、查房、医嘱、护理记录浓缩成一份 200-500 字的摘要供上级医师 review。一位住院医师平均每天要写 8-12 份。
方案架构
- 模型:开源 Qwen2.5-72B 微调(医疗版),私有化部署在院内机房
- 输入:当天 HIS 系统里该患者的所有结构化记录(医嘱、护理、检验)+ 非结构化自由文本(问诊、查房)
- 输出:4 段式病历摘要(主诉 / 现病史 / 查体 / 处置)
- 人机协作:AI 先出草稿,医生 1 分钟 review + 修改,最终签名
关键设计:防幻觉 + 责任边界
医疗场景最大的风险是”AI 编”。方案用三层防护:
- 强约束 prompt:明确”只使用输入记录中出现的信息,不允许推断”;输出”无法确定”时必须显式标注
- 引用回溯:每句摘要必须带 source span,点击可跳到原始记录
- 医生终审:明确法律责任在签字医生,AI 仅是工具
试点数据(3 个月)
- 参与医生:120 位(覆盖 8 个科室)
- 病历摘要平均时间:12 分钟 → 3 分钟(提效 4 倍)
- AI 草稿采纳率:78%(医生几乎不改)
- 医疗差错率:与对照组无显著差异(说明未引入新风险)
- 医生满意度:8.6/10
可复用的经验
- 医疗 LLM 不能用”通用 ChatGPT”思路,必须做严格领域微调
- “AI 草稿 + 人终审”比”AI 辅助”更被医生接受
- 病历这类高风险场景,私有化部署 + 责任边界清晰是底线
- 试点 3 个月足够让医生养成新习惯(部分医生反馈”已经回不去了”)
对其他行业的启示:法律文书、咨询报告、审计底稿这类”长文字工作”,都可以用类似模式提效 3-5 倍。