一种基于文档结构和外部知识的文档级实体关系抽取方法

    公开(公告)号:CN113032585B

    公开(公告)日:2021-08-20

    申请号:CN202110597525.8

    申请日:2021-05-31

    Abstract: 本发明公开了一种基于文档结构和外部知识的文档级实体关系抽取方法,所述方法包括:获取文档文本,并根据所述文档文本构建文档文本对应的结构图,初始化所述结构图的所述结点和所述边,得到结构图初始化结果;基于结构图、所述结构图初始化结果、经过训练的面向边的图神经网络模型,得到更新后的边,并将所述更新后的边输入分类器,得到所述文档文本的实体关系抽取结果。本发明实施例通过上述方法得到实体关系抽取结果,提升文档级别关系抽取的性能,解决了正负样例不均衡的问题,具备更好的处理部分知识缺失的能力,同时具有较好的可扩展性。

    一种基于阅读理解的医学概念编码方法、装置及存储介质

    公开(公告)号:CN113033154A

    公开(公告)日:2021-06-25

    申请号:CN202110597702.2

    申请日:2021-05-31

    Abstract: 本发明公开了一种基于阅读理解的医学概念编码方法、装置及存储介质,通过将临床医疗文本中的医学概念的编码任务转换为阅读理解任务,将临床医疗文本当做阅读理解中的文章,将若干个标准医学术语作为阅读理解中的选项,通过比较选项与选项之间的相关性以及选项与文本之间的相关性,在所述若干个标准医学术语中确定与所述临床医疗文本最相符的目标标准医学术语,并根据所述目标标准医学术语确定所述临床医疗文本的医学编码。本发明可以实现计算机自动为临床医疗文本中的医学概念进行自动编码,解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。

    一种基于文档结构和外部知识的文档级实体关系抽取方法

    公开(公告)号:CN113032585A

    公开(公告)日:2021-06-25

    申请号:CN202110597525.8

    申请日:2021-05-31

    Abstract: 本发明公开了一种基于文档结构和外部知识的文档级实体关系抽取方法,所述方法包括:获取文档文本,并根据所述文档文本构建文档文本对应的结构图,初始化所述结构图的所述结点和所述边,得到结构图初始化结果;基于结构图、所述结构图初始化结果、经过训练的面向边的图神经网络模型,得到更新后的边,并将所述更新后的边输入分类器,得到所述文档文本的实体关系抽取结果。本发明实施例通过上述方法得到实体关系抽取结果,提升文档级别关系抽取的性能,解决了正负样例不均衡的问题,具备更好的处理部分知识缺失的能力,同时具有较好的可扩展性。

    笔画层级手写字符序列识别方法、装置、终端及存储介质

    公开(公告)号:CN114612911B

    公开(公告)日:2022-11-29

    申请号:CN202210095671.5

    申请日:2022-01-26

    Abstract: 本发明公开了一种笔画层级手写字符序列识别方法、装置、终端及存储介质,其中,上述方法包括:获取待识别手写字符的笔画图片序列;基于所述笔画图片序列,根据编码端神经网络模型获得笔画序列特征;基于已识别字符序列,获取字符序列特征;基于交叉注意力机制,将所述字符序列特征和所述笔画序列特征输入解码端单向多头自注意力层,获得所述待识别手写字符的语义特征向量;基于所述语义特征向量和所述笔画序列特征,根据神经网络模型获得所述待识别手写字符的识别结果。与现有技术相比,本发明通过将手写字符序列的上下文语义信息与手写字符的笔画特征融合,能够准确识别非完整笔画字符,提高识别效率,实现高鲁棒性的手写汉字序列识别。

    笔画层级手写字符序列识别方法、装置、终端及存储介质

    公开(公告)号:CN114612911A

    公开(公告)日:2022-06-10

    申请号:CN202210095671.5

    申请日:2022-01-26

    Abstract: 本发明公开了一种笔画层级手写字符序列识别方法、装置、终端及存储介质,其中,上述方法包括:获取待识别手写字符的笔画图片序列;基于所述笔画图片序列,根据编码端神经网络模型获得笔画序列特征;基于已识别字符序列,获取字符序列特征;基于交叉注意力机制,将所述字符序列特征和所述笔画序列特征输入解码端单向多头自注意力层,获得所述待识别手写字符的语义特征向量;基于所述语义特征向量和所述笔画序列特征,根据神经网络模型获得所述待识别手写字符的识别结果。与现有技术相比,本发明通过将手写字符序列的上下文语义信息与手写字符的笔画特征融合,能够准确识别非完整笔画字符,提高识别效率,实现高鲁棒性的手写汉字序列识别。

    手写序列可编辑的连续手写输入方法与系统

    公开(公告)号:CN104063176A

    公开(公告)日:2014-09-24

    申请号:CN201410295010.2

    申请日:2014-06-25

    Abstract: 本发明提供了一种手写序列可编辑的连续手写输入方法及系统,该连续手写输入方法包括手写文字连续书写步骤、手写文字识别与排版步骤、校对步骤、切换输入步骤、编辑步骤,手写文字连续书写步骤、校对步骤、切换输入步骤、编辑步骤能够随时交替进行,直到用户发出提交识别结果的指令时将整个手写字符序列对应的第1级候选中的书面字符串提交到等待字符输入的应用程序。本发明的有益效果是:用户可以一次性连续输入多个文字,在发生切分或者识别结果错误的情况下,实现单个手写字符的修改或者重新输入。解决了用户连续输入字符的修改受限问题,提高了文字的输入效率,极大改善了用户的书写体验。

Patent Agency Ranking