-
公开(公告)号:CN115438652A
公开(公告)日:2022-12-06
申请号:CN202211170513.8
申请日:2022-09-23
Applicant: 安徽讯飞医疗股份有限公司
IPC: G06F40/247 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种医学术语质量监控方法及相关装置、电子设备、存储介质,其中,医学术语质量监控方法包括:获取初始术语库;再基于术语元素模板对医学术语对中标准术语和同义术语分别进行术语拆分,并对拆分词语进行标准化,得到医学术语对的拆分标准化结果;拆分标准化结果包括标准术语的第一拆分标准化组合和同义术语的第二拆分标准化组合,拆分标准化组合包括术语对照术语元素模板拆分后与各个术语元素分别对应的拆分词语经标准化后的标准词语;并基于初始术语库中各对医学术语对的拆分标准化结果对初始术语库进行质检,得到目标术语库。上述方案,能够尽可能地提升术语质检的效率,进而提高术语资源质量。
-
公开(公告)号:CN114780691B
公开(公告)日:2022-12-02
申请号:CN202210701343.5
申请日:2022-06-21
Applicant: 安徽讯飞医疗股份有限公司
IPC: G06F16/33 , G06F40/295 , G06F40/30 , G06F16/332 , G06F16/35 , G06F16/36
Abstract: 本申请公开了一种模型预训练及自然语言处理方法、装置、设备及存储介质,本申请在预训练模型过程中,获取到训练文本及所属领域的知识图谱,基于知识图谱查找训练文本中匹配的目标实体词,以及训练文本所匹配的三元组,将训练文本中目标实体词进行掩码,得到掩码后训练文本,同时,选取一目标实体词,将其中头实体词和关系词与训练文本拼接,得到拼接后训练文本,进而以预测掩码后训练文本中被掩码的目标实体词,及预测拼接后训练文本包含的目标三元组中的尾实体词为目标,训练神经网络模型,得到预训练模型。由此可见,本申请将训练文本所属领域的知识图谱中的知识融入到模型预训练过程中,促进了模型对相关领域知识的理解和掌握。
-
公开(公告)号:CN115293163A
公开(公告)日:2022-11-04
申请号:CN202210910491.8
申请日:2022-07-29
Applicant: 安徽讯飞医疗股份有限公司
IPC: G06F40/295 , G06F40/284 , G06F40/30
Abstract: 本申请公开了一种画像方法、装置、设备和存储介质,该方法包括:获取关于目标对象的若干原始医学文本;从若干原始医学文本中抽取多个文本信息,多个文本信息属于至少两个画像标签,至少两个画像标签所属类别包括目标对象基本信息、病情信息和治疗信息中的至少两类;将多个文本信息对应填充至至少两个画像标签,得到目标对象的画像信息。通过上述方式,本申请能够快速而又全面的了解目标对象信息,提高医务人员的工作效率。
-
公开(公告)号:CN114780691A
公开(公告)日:2022-07-22
申请号:CN202210701343.5
申请日:2022-06-21
Applicant: 安徽讯飞医疗股份有限公司
IPC: G06F16/33 , G06F40/295 , G06F40/30 , G06F16/332 , G06F16/35 , G06F16/36
Abstract: 本申请公开了一种模型预训练及自然语言处理方法、装置、设备及存储介质,本申请在预训练模型过程中,获取到训练文本及所属领域的知识图谱,基于知识图谱查找训练文本中匹配的目标实体词,以及训练文本所匹配的三元组,将训练文本中目标实体词进行掩码,得到掩码后训练文本,同时,选取一目标实体词,将其中头实体词和关系词与训练文本拼接,得到拼接后训练文本,进而以预测掩码后训练文本中被掩码的目标实体词,及预测拼接后训练文本包含的目标三元组中的尾实体词为目标,训练神经网络模型,得到预训练模型。由此可见,本申请将训练文本所属领域的知识图谱中的知识融入到模型预训练过程中,促进了模型对相关领域知识的理解和掌握。
-
-
-