-
公开(公告)号:CN120012715A
公开(公告)日:2025-05-16
申请号:CN202411887436.7
申请日:2024-12-20
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 中山大学附属第八医院(深圳福田)
IPC: G06F40/126 , G06F40/58 , G06N3/096 , G16H10/60
Abstract: 本发明提供了一种基于大语言模型迁移学习的ICD自动编码的方法及系统,包括:输入低资源语言的电子病历数据,使用大语言模型,识别待编码文本的类型;基于待编码的内容,构建多语言ICD自动编码指令;使用语言迁移ICD自动编码大模型,对待编码内容进行ICD自动编码,输出I CD编码结果;基于低资源语言的编码规则,对输出的ICD编码结果进行验证与对齐,输出最终编码结果。本发明利用大语言模型的多语言能力,对于低资源语言环境下获取人工标注数据较难的ICD自动编码任务,有效减少了人工标注工作量、降低大语言模型在I CD编码任务上的落地成本。