-
公开(公告)号:CN117077649B
公开(公告)日:2024-01-09
申请号:CN202311336529.6
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06F40/186 , G06F40/166 , G06F16/28
Abstract: 本说明书公开了一种生成医疗文本提取模版方法,从上述方法可以看出,本申请将若干医疗文本输入训练完成的提取模型,得到提取模型输出的若干医疗文本分别对应的候选提取模版。根据候选提取模版中每个元素出现频率,以及与其他元素的共现次数,分别确定每个元素的代表性和可靠性。根据代表性以及可靠性,确定每个元素的置信度,根据置信度对候选提取模版过滤,提高候选提取模板包含的元素对医疗文本覆盖率。将过滤后的候选提取模版进行聚合,可以提高候选提取模板的泛化性,根据聚合结果,确定目标提取模版。实现了自动生成医疗文本提取模版,减少人力成本,提高了提取医学信息的效率和准确性。
-
公开(公告)号:CN114861600B
公开(公告)日:2022-12-13
申请号:CN202210793967.4
申请日:2022-07-07
Applicant: 之江实验室
IPC: G06F40/117 , G06F40/166 , G06F40/274 , G06F40/284 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向NER的中文临床文本数据增强方法及装置,通过数据预处理得到未标注数据和标签线性化处理的标注数据。使用未标注数据,通过掩盖文本中的部分信息,基于保留信息对掩盖部分进行预测,同时引入实体词级判别任务,进行基于片段的语言模型预训练;在微调阶段引入多种解码机制,基于预训练后的基于片段的语言模型得到文本向量和文本数据之间的关系,将线性化的带实体标签数据转化为文本向量,在文本生成模型的预测阶段通过正向解码和反向解码进行文本生成,通过对标签进行解析,得到带有标注信息的增强数据。本发明在进一步提升数据多样性的同时,对增强数据的质量也做了改善,从而确保模型可以生成更多高质量增强数据。
-
公开(公告)号:CN111370127B
公开(公告)日:2022-06-10
申请号:CN202010039000.8
申请日:2020-01-14
Applicant: 之江实验室
Abstract: 本发明公开了一种基于知识图谱的跨科室慢性肾病早期诊断决策支持系统,包括患者信息模型建立模块、患者信息模型库存储模块、知识图谱关联模块、知识图谱推理模块和决策支持反馈模块;本发明通过构建患者信息模型,利用OMOP CDM标准术语体系,将患者电子病历数据建构为概念编码统一、语义结构统一的患者信息模型;发挥语义技术在数据交互性和可扩展性的优势,使得该系统对不同医院的异构数据有较好的适应性和扩展性。同时,基于知识图谱知识推理得出的临床建议,来源均为符合循证医学的临床指南和医师经验,推理流程和建议原因通过构建推理实例可以追溯获取,从而能够在给出临床建议的同时给出推理过程和建议原因,提升医师对决策支持建议的信任度。
-
公开(公告)号:CN114004233B
公开(公告)日:2022-05-06
申请号:CN202111644281.0
申请日:2021-12-30
Applicant: 之江实验室
IPC: G06F40/295 , G06F40/242 , G06F40/211 , G06F40/216 , G06F16/903 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于半训练和句子选择的远程监督命名实体识别方法,该方法首先通过半训练策略将双向循环神经网络和条件随机场混合双向循环神经网络和条件随机场混合模型在人工标注数据集上的平衡F分数训练到预设半训练区间;然后采用FNN作为强化学习中的策略网络,来对远程监督数据集中的句子进行选择;接着采用软概率选择出置信度大于阈值的句子;然后将筛选出的句子和人工标注数据集进行合并作为新的训练集;最后利用新的训练集对双向循环神经网络和条件随机场混合双向循环神经网络和条件随机场混合模型进行训练,同时对策略网络进行更新。本发明方法能够有效提高基于远程监督的命名实体识别模型的性能。
-
公开(公告)号:CN114003791A
公开(公告)日:2022-02-01
申请号:CN202111649231.1
申请日:2021-12-30
Applicant: 之江实验室
IPC: G06F16/906 , G06F16/901 , G06F16/93
Abstract: 本发明公开了一种基于深度图匹配的医疗数据元自动化分类方法及系统,本发明定义了基于最小元数据信息的医疗数据元图数据模型,使得深度图匹配模型的效果同样适用于极低元数据信息的局部数据沼泽的情况,达到使用最少的元数据信息完成数据元自动化分类的目的,同时保证在图数据模型标准下采集的图结构数据适用于深度图匹配模型的训练;基于表示学习方法计算医疗数据元的向量表示,通过向量表示的分类,快速、自动化筛选有可能映射到标准数据模型的有效数据元;基于图注意力机制计算列顶点的向量表示,构建深度图匹配模型完成医疗数据元的自动化分类。本发明方法及系统具有良好的可拓展性,可应用于各类数据沼泽向数据湖转化问题的处理。
-
公开(公告)号:CN113436698B
公开(公告)日:2021-12-07
申请号:CN202110994475.7
申请日:2021-08-27
Applicant: 之江实验室
Abstract: 本发明公开了一种融合自监督和主动学习的医学术语自动标准化系统及方法,该系统包括候选集生成模块、训练术语标准化模型的自监督学习模块、主动学习模块、用于对术语标准化模型预测结果从文本和语义维度进行全面评估的精准排序模块等基础模块,还包括半监督学习模块、直系上级术语检索模块等优选模块;本发明可在标注数据较少的情况下实现自动化的医学术语标准化模型,并且使模型保持快速更新升级的能力,确保输出结果准确性的同时大幅减少人工干预的工作量;对于新增的临床概念能够匹配到直系上级术语,在标准术语表中找到准确的位置,从而保证标准化结果的完整性和统一性。
-
公开(公告)号:CN113656604A
公开(公告)日:2021-11-16
申请号:CN202111213727.4
申请日:2021-10-19
Applicant: 之江实验室
Abstract: 本发明公开了一种基于异构图神经网络的医疗术语规范化系统及方法,首先对各种类型的医疗术语构建关键的信息单元,实现医疗术语的结构化表示,并基于信息单元构建包含各种类型医疗术语的知识图谱。基于此知识图谱构建包含各种类型医疗术语的异构图神经网络,在异构图神经网络的训练过程中综合考虑图的临近节点分布和节点内容编码,用于进行医疗术语规范化。本发明能够充分利用同类医疗术语的信息单元互相之间关联与差异的知识,同时容纳各种类型的医疗术语,能够全面学习医疗领域的知识,并且能够方便地将新类型的医疗术语增加到系统中,减少了新类型医疗术语规范化的工作量。
-
公开(公告)号:CN113436698A
公开(公告)日:2021-09-24
申请号:CN202110994475.7
申请日:2021-08-27
Applicant: 之江实验室
Abstract: 本发明公开了一种融合自监督和主动学习的医学术语自动标准化系统及方法,该系统包括候选集生成模块、训练术语标准化模型的自监督学习模块、主动学习模块、用于对术语标准化模型预测结果从文本和语义维度进行全面评估的精准排序模块等基础模块,还包括半监督学习模块、直系上级术语检索模块等优选模块;本发明可在标注数据较少的情况下实现自动化的医学术语标准化模型,并且使模型保持快速更新升级的能力,确保输出结果准确性的同时大幅减少人工干预的工作量;对于新增的临床概念能够匹配到直系上级术语,在标准术语表中找到准确的位置,从而保证标准化结果的完整性和统一性。
-
公开(公告)号:CN116110533B
公开(公告)日:2023-09-01
申请号:CN202310169762.3
申请日:2023-02-27
Applicant: 之江实验室
Abstract: 本发明公开了一种基于事件图谱的药物种类和用量推荐系统及方法,本发明联合使用患者事件图谱和药物知识图谱进行用药推荐,能够利用患者的病情动态变化过程中的信息,与患者相关的各种事件之间复杂的关联信息,以及事件和药物属性的关联信息,这样推荐使用的药物更契合患者实际身体状况和病情。使用大量患者诊疗数据对患者和药物的关联程度进行修正,充分利用了医生在临床诊疗过程中产生的经验性知识。在事件图谱中针对特定药物识别出主要事件路径,利用主要事件路径上的信息在药物用量专家知识的指导下计算精确的药物用量,使得药物用量模型在利用患者特定信息的同时又不脱离权威指导,确保药物用量推荐结果在正常范围内尽量做到精准和个性化。
-
公开(公告)号:CN113688248B
公开(公告)日:2022-02-22
申请号:CN202111247796.7
申请日:2021-10-26
Applicant: 之江实验室
Abstract: 本发明公开了一种小样本弱标注条件下的医疗事件识别方法及系统,本发明构建了医疗事件库,利用远程监督方法实现了在小样本弱标注条件下对医疗要素的自动标注;从多个维度构建医疗要素和事件元学习模型,解决小样本弱标注条件下,医疗事件识别模型泛化性差、标注数据不足的问题;利用医疗要素和事件元学习模型进行负采样,将未标注医疗要素控制在一个较低的范围,降低远程监督方法引起的漏标问题,提升医疗要素识别模型性能;基于医疗事件库和专家知识计算医疗要素重要度,利用医疗要素重要度与医疗要素和事件元学习模型对医疗事件进行分类识别,解决了医疗事件触发词难以定义的问题。
-
-
-
-
-
-
-
-
-