-
公开(公告)号:CN117892721A
公开(公告)日:2024-04-16
申请号:CN202410107618.1
申请日:2024-01-25
Applicant: 广州国家实验室
IPC: G06F40/232 , G06F40/30 , G06F16/215 , G06N3/045 , G16H10/60
Abstract: 本发明公开了一种基于大语言模型的电子病历数据的错误检测方法及装置,方法包括:获取病历文本;对所述病历文本进行清洗,得到清洗后的临床数据;对所述清洗后的临床数据进行截断处理,得到截断文本;对所述截断文本进行检测,得到错误字段;对所述错误字段进行校正,得到治理文本。本发明可以避免传统的信息抽取过程中引入的识别错误,提高了错误检测的准确性,能广泛应用于数据处理技术领域。
-
公开(公告)号:CN117133397A
公开(公告)日:2023-11-28
申请号:CN202311405615.8
申请日:2023-10-27
Applicant: 广州国家实验室
IPC: G16H10/60 , G06F40/103
Abstract: 本发明公开了一种电子病历数据增强方法、系统、电子设备和存储介质,可广泛应用于大数据处理技术领域。本发明通过对获取的第一全科医疗电子病历数据和第一专科医疗电子病历数据进行预处理,以提高第二电子病历数据的数据质量,接着对第二全科医疗电子病历数据和第二专科医疗电子病历数据分别进行采样后生成第三全科电子病历数据格式,以为后续数据生成提供统一的数据格式,然后将采样后的第二专科医疗电子病历数据和第三全科电子病历数据格式填入构建的离散提示模板,并将得到的病历数据离散提示输入到预设大模型后得到第三全科电子病历数据,从而无需依赖训练数据的质量、专业知识或医疗词典的完善度,有效提高了增强数据的质量和可靠性。
-
公开(公告)号:CN117133397B
公开(公告)日:2024-02-20
申请号:CN202311405615.8
申请日:2023-10-27
Applicant: 广州国家实验室
IPC: G16H10/60 , G06F40/103
Abstract: 本发明公开了一种电子病历数据增强方法、系统、电子设备和存储介质,可广泛应用于大数据处理技术领域。本发明通过对获取的第一全科医疗电子病历数据和第一专科医疗电子病历数据进行预处理,以提高第二电子病历数据的数据质量,接着对第二全科医疗电子病历数据和第二专科医疗电子病历数据分别进行采样后生成第三全科电子病历数据格式,以为后续数据生成提供统一的数据格式,然后将采样后的第二专科医疗电子病历数据和第三全科电子病历数据格式填入构建的离散提示模板,并将得到的病历数据离散提示输入到预设大模型后得到第三全科电子病历数据,从而无需依赖训练数据的质量、专业知识或医疗词典的完善度,有效提高了增强数据的质量和可靠性。
-
-