模型预训练及自然语言处理方法、装置、设备及存储介质

    公开(公告)号:CN114780691A

    公开(公告)日:2022-07-22

    申请号:CN202210701343.5

    申请日:2022-06-21

    Abstract: 本申请公开了一种模型预训练及自然语言处理方法、装置、设备及存储介质,本申请在预训练模型过程中,获取到训练文本及所属领域的知识图谱,基于知识图谱查找训练文本中匹配的目标实体词,以及训练文本所匹配的三元组,将训练文本中目标实体词进行掩码,得到掩码后训练文本,同时,选取一目标实体词,将其中头实体词和关系词与训练文本拼接,得到拼接后训练文本,进而以预测掩码后训练文本中被掩码的目标实体词,及预测拼接后训练文本包含的目标三元组中的尾实体词为目标,训练神经网络模型,得到预训练模型。由此可见,本申请将训练文本所属领域的知识图谱中的知识融入到模型预训练过程中,促进了模型对相关领域知识的理解和掌握。

    多语言融合的语义表示方法、装置、存储介质及设备

    公开(公告)号:CN115858752A

    公开(公告)日:2023-03-28

    申请号:CN202211539197.7

    申请日:2022-12-01

    Abstract: 本申请实施例公开了一种多语言融合的语义表示方法、装置、存储介质及设备。该方法包括:利用高资源的源语言的多个数据样本中的文本信息对至少一种低资源的目标语言进行扩充,以得到至少一种目标语言的目标文本信息,并根据每个数据样本的文本信息和至少一种目标语言的目标文本信息确定多组平行数据,利用多组平行数据对初始语义表示模型进行训练,在训练的过程中,根据初始语义表示模型对每组平行数据中的文本信息和至少一种目标语言的目标文本信息分别进行处理的处理结果,和同一个标签信息来更新初始语义表示模型,利用高资源的源语言中学到的知识优化低资源的至少一种目标语言的语义表示,提高低资源的目标语言的语义表示的准确性。

    医学知识提取方法、装置、存储介质及计算机设备

    公开(公告)号:CN115730566A

    公开(公告)日:2023-03-03

    申请号:CN202211481858.5

    申请日:2022-11-24

    Abstract: 本申请实施例公开了一种医学知识提取方法、装置、存储介质及计算机设备。该方法包括:获取输入的医学文本并进行编码处理,得到医学文本中每个字的编码特征,对于医学文本中任意长度的每个子文本,通过注意力机制和每个子文本的编码特征确定每个子文本的自身特征表示,以提高每个子文本的自身特征表示的准确性,根据每个子文本的自身特征表示,确定每个子文本所属的目标实体,得到医学文本中的子文本所属的目标实体所构成的实体集合后,对于实体集合中的任意两个子文本,根据两个子文本的自身特征表示,通过多视角的上下文注意力机制,确定两个子文本所属的目标实体之间的目标关系,提高实体之间的关系确定的准确性,提高医学知识获取的准确性。

    医学术语质量监控方法及相关装置、电子设备、存储介质

    公开(公告)号:CN115438652A

    公开(公告)日:2022-12-06

    申请号:CN202211170513.8

    申请日:2022-09-23

    Abstract: 本申请公开了一种医学术语质量监控方法及相关装置、电子设备、存储介质,其中,医学术语质量监控方法包括:获取初始术语库;再基于术语元素模板对医学术语对中标准术语和同义术语分别进行术语拆分,并对拆分词语进行标准化,得到医学术语对的拆分标准化结果;拆分标准化结果包括标准术语的第一拆分标准化组合和同义术语的第二拆分标准化组合,拆分标准化组合包括术语对照术语元素模板拆分后与各个术语元素分别对应的拆分词语经标准化后的标准词语;并基于初始术语库中各对医学术语对的拆分标准化结果对初始术语库进行质检,得到目标术语库。上述方案,能够尽可能地提升术语质检的效率,进而提高术语资源质量。

    问诊交互方法及相关装置、电子设备、存储介质

    公开(公告)号:CN114822830B

    公开(公告)日:2022-12-06

    申请号:CN202210736890.7

    申请日:2022-06-27

    Abstract: 本申请公开了一种问诊交互方法及相关装置、电子设备、存储介质,其中,问诊交互方法包括:获取问诊参考文本,问诊参考文本至少包括目标对象输入的咨询文本和基于咨询文本预测到的系统文本,系统文本表征目标对象所患疾病所属的功能系统;基于问诊参考文本和目标症状文本,在症状文本集合确定本轮交互的若干候选症状文本,且目标症状文本包括目标对象在本轮交互之前已经选择的候选症状文本;基于目标对象在本轮交互的若干候选症状文本中所选择的候选症状文本,更新目标症状文本;重新执行基于问诊参考文本和目标症状文本,在症状文本集合确定本轮交互的若干候选症状文本的步骤以及后续步骤。上述方案,能够提升问诊交互的灵活性、准确性和适用性。

    一种健康状态评估方法、装置、设备及存储介质

    公开(公告)号:CN115116614A

    公开(公告)日:2022-09-27

    申请号:CN202210790883.5

    申请日:2022-07-05

    Abstract: 本申请公开了一种健康状态评估方法、装置、设备及存储介质,本申请获取同一对象的各个时刻的诊断记录,对每一时刻的诊断记录分别进行语义编码,得到症状表示特征,对于每一时刻的诊断记录,根据该诊断记录相对于指定评估时刻的时间间隔,以及该诊断记录的症状表示特征,确定诊断记录对应的注意力权重,由此可见,本申请考虑了时序演进上不同诊断记录对最终评估结果影响的差异,进而据此为各诊断记录赋予了对应的注意力权重,按照各诊断记录的注意力权重,对各诊断记录对应的症状表示特征进行加权相加,得到最终症状表示特征,该最终症状表示特征能够更好的反映对象的症状表征,基于此确定对象在指定评估时刻的健康状态,得到的结果也更加准确。

Patent Agency Ranking