文本的知识结构化处理方法、装置、设备和可读存储介质

    公开(公告)号:CN112241458A

    公开(公告)日:2021-01-19

    申请号:CN202011089921.1

    申请日:2020-10-13

    Abstract: 本申请实施例提供了一种文本的知识结构化处理方法、装置、设备和可读存储介质,其中,方法包括:对待处理文本根据业务特征进行分类处理,得到所述待处理文本的业务类型;根据所述待处理文本的业务类型,对所述待处理文本进行实体提取处理,得到所述待处理文本的实体要素;基于所述实体要素在有向连接实体关系图中的入度值和在所述待处理文本中的相对距离值,对所述待处理文本进行关系抽取处理,确定所述待处理文本的实体关系对,得到所述待处理文本的知识结构化信息。本申请实施例不需要大量的数据标注和较高的硬件资源,可以有效提升关系抽取的准确性,节约人工和成本,满足实际业务的需求。

    文本校对方法、装置、计算机可读存储介质及电子设备

    公开(公告)号:CN110929514A

    公开(公告)日:2020-03-27

    申请号:CN201911144534.0

    申请日:2019-11-20

    Abstract: 本公开涉及一种文本校对方法、装置、计算机可读存储介质及电子设备。方法包括:确定待校对文本中各句子的纠错信息,纠错信息包括错误词和其对应的至少一个纠错词;针对各错误词,分别确定错误词与其前、后词在预设语料库中的第一共现频次、第二共现频次;针对错误词对应的各纠错词,获取语义特征;至少根据第一共现频次、第二共现频次及语义特征,判定纠错词是否正确。判定纠错词的正确性,可提升文本校对准确率。对纠错词的正确性进行判定时,综合考虑了前后词的搭配及上下文语义特征,可保证纠错词的正确性判定的精度,从而进一步提升文本校对准确率。此外,使得校对工作智能化、自动化,减轻人工校对的压力,提升工作效率,降低人工成本。

    命名实体校对方法、装置、可读存储介质及电子设备

    公开(公告)号:CN110909535A

    公开(公告)日:2020-03-24

    申请号:CN201911244893.3

    申请日:2019-12-06

    Abstract: 本公开涉及一种命名实体校对方法、装置、可读存储介质及电子设备。方法包括:基于中文分词结果,从待识别文本中提取第一命名实体,所述第一命名实体包括第一人名和/或第一职务;基于预设的数据库,从所述待识别文本中提取第二命名实体,所述第二命名实体包括第二人名和/或第二职务,所述预设的数据库中包括预设的人名和/或职务;根据所述第二命名实体,对所述第一命名实体进行纠错处理。由于是基于预设的数据库提取的第二命名实体,所以,所提取的第二命名实体较为准确,进而基于该较为准确的第二命名实体辅助对第一命名识别进行纠错处理,可以提高对待识别文本中的第一命名实体校对的准确度。

Patent Agency Ranking