-
公开(公告)号:CN119166808A
公开(公告)日:2024-12-20
申请号:CN202411184070.7
申请日:2024-08-27
Applicant: 电信科学技术第五研究所有限公司
IPC: G06F16/35 , G06F16/33 , G06F40/295 , G06F40/30 , G06N5/025 , G06N5/022 , G06N5/04 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种端到端实体与关系联合抽取方法,其包括:对文本数据进行实体与关系标注以及关系类别合并,构造实体关系标注数据集;使用预训练语言模型获取文本token;使用标注好的实体关系数据对实体关系联合抽取网络模型进行训练,得到模型权重文件;使用实体关系联合抽取网络模型和训练好的模型权重文件对其他样本进行预测,得到实体关系预测结果,并按照预设实体关系整合规则表进行关系拆分,得到精确的实体关系预测结果。本发明的实体与关系联合抽取准确率高,速度快,具有较强的鲁棒性,对实体类别复杂、关系类别繁多、样本分布不均匀的数据具有较好的实体与关系抽取效果。
-
公开(公告)号:CN119248844A
公开(公告)日:2025-01-03
申请号:CN202411162570.0
申请日:2024-08-23
Applicant: 电信科学技术第五研究所有限公司
IPC: G06F16/2458 , G06F16/242 , G06F9/50
Abstract: 本发明公开了一种内存多线程模糊检索方法,其包括:采用多线程并行运算的方式分别计算词条与用户检索词的编辑距离相似度值和公共序列相似度值;求取每个词条与检索词对应的编辑距离相似度值和公共序列相似度值的均值并对其进行排序,从中选取前N个字符串作为模糊检索结果。本发明在不依赖大数据检索组件的情况下,能够针对用户输入的检索词在极短的时间内从百万级甚至千万级词条中高效搜索出可靠的结果。
-