一种基于解耦合学习策略的小样本知识推理方法

    公开(公告)号:CN114792134B

    公开(公告)日:2025-02-18

    申请号:CN202111032526.4

    申请日:2021-09-03

    Abstract: 本发明提出了一种基于解耦合学习策略的小样本知识推理方法,基于小样本知识推理模型实现综合推理特征提取、候选实体成立概率计算和最佳候选实体预测,其中综合推理特征提取基于头实体的嵌入向量和关系嵌入向量提取头实体的综合推理特征,包括嵌入特征和小样本特征;候选实体成立概率计算将头实体的嵌入特征和小样本特征输入推理得分器,计算候选实体在嵌入特征和小样本特征下成立的概率;最佳候选实体预测结合渐进学习因子和候选实体在嵌入特征和小样本特征下成立的概率,计算候选实体推理成立的综合概率,确定综合概率值最高的候选实体为最终推理结果。本发明为推理得分函数提供了综合性的推理信息,提高了小样本推理精度。

    一种基于加权泰森多边形的自治域拓扑网络构建方法

    公开(公告)号:CN117938673A

    公开(公告)日:2024-04-26

    申请号:CN202311763963.2

    申请日:2023-12-20

    Abstract: 本发明公开一种基于加权泰森多边形的自治域拓扑网络构建方法,对IP地址数据、自治域数据、区县经纬度数据和自治域关系数据进行数据预处理,便于自治域拓扑网络的构建;对IP地址数据、自治域数据和区县经纬度数据进行数据融合,融合成带有自治域信息的城市中心点数据;利用加权泰森多边形等地理空间技术计算自治域的地理覆盖范围;利用每个自治域的地理覆盖范围,计算每个自治域的地理中心点;根据自治域关系数据生成拓扑网络的线集合,以自治域的地理中心线点构成拓扑网络的点集合,以此构建一个拥有逻辑拓扑关系和地理空间拓扑关系的自治域拓扑网络。本发明能够直观地展示自治域在地理空间的分布特征。

    一种基于抽取式的话题簇新闻标题自动生成方法

    公开(公告)号:CN116227477A

    公开(公告)日:2023-06-06

    申请号:CN202310399460.5

    申请日:2023-04-14

    Abstract: 本发明公开一种基于抽取式的话题簇新闻标题自动生成方法,将话题簇下的所有标题按语义近似度进行分组,分组后每组的标题个数为2或1;对元素个数为2的组求取最长公共子序列和对应的贡献度,并添加到标题集中;更新最长公共子序列集合,并在标题集中删除该组所有元素;将获得的最长公共子序列集合作为候选集合,同时根据贡献度大小对该候选集进行降序排序,对排序结果再按照最长公共子序列长度升序排序;依次遍历最长公共子序列集合排序后的结果,在候选集中找到能包含最多个最长公共子序列的原始标题,如果有多个这样的标题,把长度最短的标题作为该话题簇的标题。本发明可极大提高话题簇标题的可读性、通顺度以及信息完整性。

    一种基于张量分解的动态个性化推荐方法及系统

    公开(公告)号:CN115357794A

    公开(公告)日:2022-11-18

    申请号:CN202211019358.X

    申请日:2022-08-24

    Abstract: 本发明提出了一种基于张量分解的动态个性化推荐方法,对反映用户兴趣特征的用户‑物品‑时间关联网络数据进行统计,得到用户、物品和时间戳构成的集合,并对集合中的元素进行ID编号;将用户集合、物品集合和时间戳集合中的元素随机映射至语义向量空间中,建立用户、物品和时间戳到兴趣语义空间的初步映射关系;构建语义空间下用户、物品和时间之间的语义关联关系,使用户、物品和时间能够正确映射到语义空间中;根据用户、物品和时间到语义空间的语义关联关系,训练最优动态个性化推荐模型,预测用户的兴趣点,完成个性化推荐任务。本发明能有效学习用户随时间动态变化的兴趣,提升了个性化推荐的效果。

    一种基于多源遥感数据和数字地球平台的固废堆场管理方法

    公开(公告)号:CN119810683A

    公开(公告)日:2025-04-11

    申请号:CN202411862586.2

    申请日:2024-12-17

    Abstract: 本发明公开了一种基于多源遥感数据和数字地球平台的固废堆场管理方法,获取公开的高分辨率遥感固废堆场数据集和多源卫星图像,进行预处理操作;构建固废堆场遥感目标检测模型,基于遥感预训练模型和预处理后的高分辨率遥感固废堆场检测数据集进行微调,得到迭代初始模型参数;采用初始迭代模型推理多源卫星图像,结合自动标签生成与专家验证操作,生成高质量标签数据。将新生成的标签数据与预处理后的高分辨率遥感固废堆场数据集合并,重复模型训练、图像推理、自动标签生成、专家验证和新数据生成,得到强化的模型参数和扩增的固废堆场数据集;将从多源卫星图像中检测出的固废堆场录入可视化数字地球平台,实现数据存储、数据查询、数据更新和空间分析,据此完成对固废堆场实时和高效的管理。本发明能够实现固废堆场的智能化、精细化和高效化管理。

    一种基于倒排索引的相似文本获取方法

    公开(公告)号:CN117633144A

    公开(公告)日:2024-03-01

    申请号:CN202311765074.X

    申请日:2023-12-20

    Abstract: 本发明公开一种基于倒排索引的相似文本获取方法,对已有文本建立倒排索引,主要包括文档预处理、构建单词词典、构建倒排列表以及构建倒排索引过程;输入待查询文本,经过预处理后,得到查询词项列表,然后根据BM25计算公式分别计算每个词项在已有文档中的分数,将各个词项的分数加权平均后得到各个文档的最终评分;选取评分靠前的N个文档,与待查询文本进行余弦相似性计算,得到每个文档的相似度值;设定相似度阈值,将相似度值超过阈值的文档作为最终的相似文本结果集进行输出。本发明能够实现相似文本快速而又准确的获取,并且能够适应不同类型的文本数据,应用场景较多。

    一种基于共享语义空间的远程监督关系抽取方法

    公开(公告)号:CN114281941A

    公开(公告)日:2022-04-05

    申请号:CN202111513041.7

    申请日:2021-12-11

    Abstract: 本发明提出了一种基于共享语义空间的远程监督关系抽取方法,将远程监督标注的数据划分为不含噪数据集和含噪声数据集;将句子的句向量和实体对的位置向量拼接作为BiLSTM网络的输入向量,分别提取含噪声数据集和不含噪数据集中的实体对特征;将实体对特征和关系类型表征映射到同一语义空间中;统计两个关系类型共有的实体类别数量,计算关系类型间的相关度,对不含噪数据集和含噪声数据集分别建模,学习实体对映射矩阵和关系类型映射矩阵;将实体对和关系类型通过学习到的映射矩阵映射到共享语义空间,计算实体对和关系类型的相似度得分,得分最高的关系类型为该实体对的关系。本发明解决了处理复杂关系时存在的语义漂移严重、数据噪声大等问题。

    一种基于相似词汇表的文本关系自动标注方法

    公开(公告)号:CN113886521A

    公开(公告)日:2022-01-04

    申请号:CN202111070442.X

    申请日:2021-09-13

    Abstract: 本发明提出一种基于相似词汇表的文本关系自动标注方法,确定所有抽取的关系名称以及对应的实体类型,并获取含有关系名称的语料;在语料中每个出现关系名称的地方生成可替代该关系名称的相似词汇表,并以此整理出关系类型词汇表;对句子进行命名体识别以及实体关系三元组提取;依据命名体识别的结果判断实体关系三元组的实体对是否满足条件,生成候选关系集合;对实体关系三元组中关系短语的每个词汇生成相似词汇表,结合关系类型词汇表,判断该词汇表达的候选关系,所有词汇中表达次数最多的候选关系即为标注关系,完成自动标注。本发明解决了传统远程监督方法构建知识库难度大、标注语料质量低的问题,为构建关系抽取模型所需的数据集提供了新的策略。

    一种基于相似词汇表的文本关系自动标注方法

    公开(公告)号:CN113886521B

    公开(公告)日:2025-02-18

    申请号:CN202111070442.X

    申请日:2021-09-13

    Abstract: 本发明提出一种基于相似词汇表的文本关系自动标注方法,确定所有抽取的关系名称以及对应的实体类型,并获取含有关系名称的语料;在语料中每个出现关系名称的地方生成可替代该关系名称的相似词汇表,并以此整理出关系类型词汇表;对句子进行命名体识别以及实体关系三元组提取;依据命名体识别的结果判断实体关系三元组的实体对是否满足条件,生成候选关系集合;对实体关系三元组中关系短语的每个词汇生成相似词汇表,结合关系类型词汇表,判断该词汇表达的候选关系,所有词汇中表达次数最多的候选关系即为标注关系,完成自动标注。本发明解决了传统远程监督方法构建知识库难度大、标注语料质量低的问题,为构建关系抽取模型所需的数据集提供了新的策略。

    一种基于共享语义空间的远程监督关系抽取方法

    公开(公告)号:CN114281941B

    公开(公告)日:2024-12-03

    申请号:CN202111513041.7

    申请日:2021-12-11

    Abstract: 本发明提出了一种基于共享语义空间的远程监督关系抽取方法,将远程监督标注的数据划分为不含噪数据集和含噪声数据集;将句子的句向量和实体对的位置向量拼接作为BiLSTM网络的输入向量,分别提取含噪声数据集和不含噪数据集中的实体对特征;将实体对特征和关系类型表征映射到同一语义空间中;统计两个关系类型共有的实体类别数量,计算关系类型间的相关度,对不含噪数据集和含噪声数据集分别建模,学习实体对映射矩阵和关系类型映射矩阵;将实体对和关系类型通过学习到的映射矩阵映射到共享语义空间,计算实体对和关系类型的相似度得分,得分最高的关系类型为该实体对的关系。本发明解决了处理复杂关系时存在的语义漂移严重、数据噪声大等问题。

Patent Agency Ranking