-
公开(公告)号:CN117133397A
公开(公告)日:2023-11-28
申请号:CN202311405615.8
申请日:2023-10-27
Applicant: 广州国家实验室
IPC: G16H10/60 , G06F40/103
Abstract: 本发明公开了一种电子病历数据增强方法、系统、电子设备和存储介质,可广泛应用于大数据处理技术领域。本发明通过对获取的第一全科医疗电子病历数据和第一专科医疗电子病历数据进行预处理,以提高第二电子病历数据的数据质量,接着对第二全科医疗电子病历数据和第二专科医疗电子病历数据分别进行采样后生成第三全科电子病历数据格式,以为后续数据生成提供统一的数据格式,然后将采样后的第二专科医疗电子病历数据和第三全科电子病历数据格式填入构建的离散提示模板,并将得到的病历数据离散提示输入到预设大模型后得到第三全科电子病历数据,从而无需依赖训练数据的质量、专业知识或医疗词典的完善度,有效提高了增强数据的质量和可靠性。
-
公开(公告)号:CN120068918A
公开(公告)日:2025-05-30
申请号:CN202411982801.2
申请日:2024-12-30
Applicant: 广州国家实验室
Abstract: 本发明提供一种任务辅助方法、装置、电子设备及存储介质,属于人工智能技术领域,包括:通过粗粒度规划群组确定完成组学任务所需的任务实施流程;依次遍历任务实施流程中的每个流程步骤,执行以下操作:通过细粒度规划群组确定完成每个流程步骤所需的具体实施步骤;通过行动执行群组执行具体实施步骤,得到完成具体实施步骤后的目标组学结果。本发明提供的任务辅助方法、装置、电子设备及存储介质,提供了一种基于大语言模型的多智能体系统与生物信息学研究相结合进行组学研究的方法并开创性地设计智能体群分组管理的方式,可减少智能体之间交互的信息冗余和无意义对话,确保高效和精准的信息流动,有效的提高了两者之间组学研究的效率和准确性。
-
公开(公告)号:CN117892721A
公开(公告)日:2024-04-16
申请号:CN202410107618.1
申请日:2024-01-25
Applicant: 广州国家实验室
IPC: G06F40/232 , G06F40/30 , G06F16/215 , G06N3/045 , G16H10/60
Abstract: 本发明公开了一种基于大语言模型的电子病历数据的错误检测方法及装置,方法包括:获取病历文本;对所述病历文本进行清洗,得到清洗后的临床数据;对所述清洗后的临床数据进行截断处理,得到截断文本;对所述截断文本进行检测,得到错误字段;对所述错误字段进行校正,得到治理文本。本发明可以避免传统的信息抽取过程中引入的识别错误,提高了错误检测的准确性,能广泛应用于数据处理技术领域。
-
公开(公告)号:CN119202274B
公开(公告)日:2025-02-28
申请号:CN202411717950.6
申请日:2024-11-28
Applicant: 慧算基因科技(上海)有限公司 , 广州国家实验室
IPC: G06F16/36 , G06F16/334 , G06F16/3329 , G06F18/214 , G06F18/24 , G06N5/04
Abstract: 本发明提出了一种基于知识图谱增强大型语言模型的构建系统,该系统将LLM与知识图谱(KG)相结合,通过利用知识图谱中的可验证信息来改进模型的初始响应,从而显著减少推理过程中的事实性错误。KAR框架展示了较强的适应性,并在多种开源LLM中表现出色。特别是,KAR可以通过识别潜在的药物‑癌症关联,促进现有药物的新用途发现,并可以通过分析相关的生物标志物和遗传机制来辅助预测耐药性。为评估生物医学领域内的知识网络问答任务,我们开发了一种名为跨域肿瘤问答的基准测试。KAR框架显著提高了LLM在生物医学领域的准确性和实用性,展示了其在生物医学问答中的卓越表现。
-
公开(公告)号:CN117133397B
公开(公告)日:2024-02-20
申请号:CN202311405615.8
申请日:2023-10-27
Applicant: 广州国家实验室
IPC: G16H10/60 , G06F40/103
Abstract: 本发明公开了一种电子病历数据增强方法、系统、电子设备和存储介质,可广泛应用于大数据处理技术领域。本发明通过对获取的第一全科医疗电子病历数据和第一专科医疗电子病历数据进行预处理,以提高第二电子病历数据的数据质量,接着对第二全科医疗电子病历数据和第二专科医疗电子病历数据分别进行采样后生成第三全科电子病历数据格式,以为后续数据生成提供统一的数据格式,然后将采样后的第二专科医疗电子病历数据和第三全科电子病历数据格式填入构建的离散提示模板,并将得到的病历数据离散提示输入到预设大模型后得到第三全科电子病历数据,从而无需依赖训练数据的质量、专业知识或医疗词典的完善度,有效提高了增强数据的质量和可靠性。
-
公开(公告)号:CN119202274A
公开(公告)日:2024-12-27
申请号:CN202411717950.6
申请日:2024-11-28
Applicant: 慧算基因科技(上海)有限公司 , 广州国家实验室
IPC: G06F16/36 , G06F16/33 , G06F16/332 , G06F18/214 , G06F18/24 , G06N5/04
Abstract: 本发明提出了一种基于知识图谱增强大型语言模型的构建系统,该系统将LLM与知识图谱(KG)相结合,通过利用知识图谱中的可验证信息来改进模型的初始响应,从而显著减少推理过程中的事实性错误。KAR框架展示了较强的适应性,并在多种开源LLM中表现出色。特别是,KAR可以通过识别潜在的药物‑癌症关联,促进现有药物的新用途发现,并可以通过分析相关的生物标志物和遗传机制来辅助预测耐药性。为评估生物医学领域内的知识网络问答任务,我们开发了一种名为跨域肿瘤问答的基准测试。KAR框架显著提高了LLM在生物医学领域的准确性和实用性,展示了其在生物医学问答中的卓越表现。
-
-
-
-
-