基于混合对比学习的关系抽取方法、装置、设备及介质

    公开(公告)号:CN119476206A

    公开(公告)日:2025-02-18

    申请号:CN202411294832.9

    申请日:2024-09-14

    Abstract: 本发明提供一种基于混合对比学习的关系抽取方法、装置、设备及介质,涉及人工智能技术领域,通过获取待抽取文本;将所述待抽取文本输入混合对比学习关系抽取模型,输出关系抽取结果,其中,所述混合对比学习关系抽取模型基于正样本以及混合负样本训练得到,所述混合负样本根据实体向量表示和上下文词向量表示构造。本发明通过引入混合对比学习策略,生成更具挑战性的负样本实例,从而提升关系抽取模型的关系抽取性能,不仅拓宽了负样本的选择范围,还提高了模型的泛化能力,可以实现各种复杂情况的文本关系抽取。

    基于自适应图神经网络的敏感文本检测方法及系统

    公开(公告)号:CN113946682B

    公开(公告)日:2022-03-11

    申请号:CN202111565272.2

    申请日:2021-12-21

    Applicant: 北京大学

    Abstract: 本发明涉及一种基于自适应图神经网络的敏感文本检测方法及系统,方法包括:采集网络敏感文本,将敏感文本以及敏感文本的类型保存至数据库;解析敏感文本,过滤解析后的敏感文本,得到高质量敏感文本语料库;对语料库进行预处理,得到模型训练需要的敏感语句输入序列以及目标敏感类型序列;将敏感语句输入序列和目标敏感类型序列输入模型进行训练,训练后经过验证得到分类模型;将数据库中用于测试的文本信息输入分类模型,输出分类结果。本发明提出基于采用强化学习的自适应图神经网络,改模型基于图神经网络,能够很好的从敏感文本中提取有用特征,用强化学习来生成图,并输入图神经网络,提升文本分类的准确率。

    基于知识图谱的敏感文本检测方法及系统

    公开(公告)号:CN113963357B

    公开(公告)日:2022-03-11

    申请号:CN202111535596.1

    申请日:2021-12-16

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于知识图谱的敏感文本检测方法及系统,其中方法包括:爬取网络中现有知识,对所述现有知识进行预处理,得到知识图谱网络;获取网络中的敏感文本,对所述敏感文本进行预处理,得到训练语料;根据所述训练语料和所述知识图谱网络得到文本检测模型的编码信息,将所述编码信息转化为向量表示,得到最终的所述文本检测模型;对待测试文本进行预处理,根据所述文本检测模型得到检测结果。本发明通过知识图谱引入外部知识,建立文本检测模型,并通过多视图推理网络对外部知识进行进一步融合,使得外部知识能够得到充分利用。

    基于知识图谱的敏感文本检测方法及系统

    公开(公告)号:CN113963357A

    公开(公告)日:2022-01-21

    申请号:CN202111535596.1

    申请日:2021-12-16

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于知识图谱的敏感文本检测方法及系统,其中方法包括:爬取网络中现有知识,对所述现有知识进行预处理,得到知识图谱网络;获取网络中的敏感文本,对所述敏感文本进行预处理,得到训练语料;根据所述训练语料和所述知识图谱网络得到文本检测模型的编码信息,将所述编码信息转化为向量表示,得到最终的所述文本检测模型;对待测试文本进行预处理,根据所述文本检测模型得到检测结果。本发明通过知识图谱引入外部知识,建立文本检测模型,并通过多视图推理网络对外部知识进行进一步融合,使得外部知识能够得到充分利用。

    基于自适应图神经网络的敏感文本检测方法及系统

    公开(公告)号:CN113946682A

    公开(公告)日:2022-01-18

    申请号:CN202111565272.2

    申请日:2021-12-21

    Applicant: 北京大学

    Abstract: 本发明涉及一种基于自适应图神经网络的敏感文本检测方法及系统,方法包括:采集网络敏感文本,将敏感文本以及敏感文本的类型保存至数据库;解析敏感文本,过滤解析后的敏感文本,得到高质量敏感文本语料库;对语料库进行预处理,得到模型训练需要的敏感语句输入序列以及目标敏感类型序列;将敏感语句输入序列和目标敏感类型序列输入模型进行训练,训练后经过验证得到分类模型;将数据库中用于测试的文本信息输入分类模型,输出分类结果。本发明提出基于采用强化学习的自适应图神经网络,改模型基于图神经网络,能够很好的从敏感文本中提取有用特征,用强化学习来生成图,并输入图神经网络,提升文本分类的准确率。

Patent Agency Ranking