短文本关键短语抽取方法
    201.
    发明公开

    公开(公告)号:CN116522929A

    公开(公告)日:2023-08-01

    申请号:CN202310518582.1

    申请日:2023-05-09

    Abstract: 本发明提供了一种短文本关键短语抽取方法,主要包括以下步骤:首先对文档进行预处理,从文档中提取候选短语并去除重复短语,接着建立词汇表并记录上下文信息;通过遍历词汇表,记录其他需要的统计信息并计算统计特征得分;计算候选短语的统计特征得分;根据候选短语之间的语义相似度构建语义图;融合统计与语义特征得分,根据得分进行降序排名并输出结果。本发明综合考虑了统计特征与语义特征,避免了传统抽取方法中语义相似短语共现性弱的问题,可以提高短文本场景下的关键短语抽取的准确率,在自动问答系统,推荐系统,情感分析等领域有较好的应用价值。

    一种基于区块链的面向数据不平衡问题的联邦学习方法

    公开(公告)号:CN115640846A

    公开(公告)日:2023-01-24

    申请号:CN202211090697.7

    申请日:2022-09-07

    Abstract: 本发明属于区块链技术领域,具体地说,是一种基于区块链的面向数据不平衡问题的联邦学习方法,包括:本地节点从向区块链发出获取全局模型请求得到当前的全局模型;本地节点从三个角度对模型进行训练,训练完成后,本地节点将本地模型上传至区块链中进行存储;区块链收集到足够的本地模型后触发智能合约选取本地模型进行汇聚,生成最新的全局模型;区块链将最新的全局模型信息存储到链上,以便下一轮的全局训练。本发明能够提高联邦学习任务在数据不平衡场景下的模型质量,同时保障了联邦学习任务的安全性和可追溯性,在联邦学习领域具有广泛的实用价值和应用前景。

    基于BERT的实体属性相似度计算方法及系统

    公开(公告)号:CN115577267A

    公开(公告)日:2023-01-06

    申请号:CN202211106635.0

    申请日:2022-09-07

    Abstract: 本发明提供一种基于BERT的实体属性相似度计算方法及系统,该方法通过对两个知识图谱进行预处理,过滤掉知识图谱中的关系三元组、冗余或无效的三元组,获得预对齐实体对;对齐第一知识图谱和第二知识图谱的关系;使用BERT模型对属性三元组中的尾实体即属性文本进行无监督学习,获得训练好的BERT模型;根据关系对齐的结果,通过训练好的BERT模型,计算有相同关系的属性文本相似度,通过计算整合,获得各实体属性相似度的结果;本发明能够在知识图谱数据量巨大且缺少标注的情况下,通过无监督的算法,高准确率地实现对知识图谱间实体属性相似度的计算,为知识图谱的融合提供支持,可有效解决知识图谱融合过程中标注样本的人工成本过高且准确率较低的问题。

    基于自然语言处理的教育资源质量评价挖掘方法及系统

    公开(公告)号:CN110147552B

    公开(公告)日:2022-12-06

    申请号:CN201910431440.5

    申请日:2019-05-22

    Abstract: 本发明公开了一种基于自然语言处理的教育资源质量评价挖掘方法及系统,首先从海量教育评论数据中使用自然语言处理技术挖掘用户评价观点,以 二元组存储。其次,以 为指标结点建立。然后基于教育资源语料库通过神经网络对词向量进行训练,建立词到向量的模型。再对评价对象进行聚类,再按照floyd算法选出中心向量。接着对评价词进行聚类,生成资源评价指标树,选出的中心向量作为评价指标树的结点,最后对评价词进行情感分析并打分输出。解决了基于众筹众创的数字教育评价数据量过大,人工评价方法成本高、难度大、主观性高等问题。

    三维目标检测方法及三维目标检测器

    公开(公告)号:CN110909623B

    公开(公告)日:2022-10-04

    申请号:CN201911052349.9

    申请日:2019-10-31

    Abstract: 本发明提出了一种三维目标检测方法及三维目标检测器。所述三维目标检测方法主要包括以下步骤:对三维目标检测数据集的图像数据进行语义分割,得到语义预测;将语义预测投影到点云空间中,并筛选特定类别的点形成视锥;构建三维目标检测网络,并将视锥作为三维目标检测网络的输入;通过损失函数强化三维目标检测网络对目标的敏感程度;优化三维目标检测网络。本发明大大减少了三维检测的时间并且降低了计算需求,使得输入更加简单,具有很好的实时目标检测性能,在保持实时检测的同时也能获得很好的检测效果。

    一种基于生成性对抗网络的模态一致性跨模态检索方法

    公开(公告)号:CN111460201B

    公开(公告)日:2022-09-23

    申请号:CN202010143786.8

    申请日:2020-03-04

    Abstract: 本发明公开了一种基于生成性对抗网络的模态一致性跨模态检索方法,包括以下步骤:首先利用生成性对抗网络强大的数据分布建模能力,将文本特征映射到图像特征空间,用这种方法将跨模态检索问题转换为单模态检索问题,尽可能多地保留图像语义信息的同时减小模态的异质性。其次,设计了一个模态一致性哈希网络,将真实的图像特征和通过生成性对抗网络生成的特征投影到汉明空间中,并且利用标签信息对模态间和模态内的相似性进行建模,使得输出的哈希码在模态间和模态内具有更好的语义区分性,获得更具判别性的哈希码。最后在两个常用的基准数据集上的实验结果表明本方法与现有的流行方法相比具有更好的跨模态检索性能。

    一种基于参考序列的基因压缩方法

    公开(公告)号:CN110310709B

    公开(公告)日:2022-08-16

    申请号:CN201910598102.0

    申请日:2019-07-04

    Abstract: 本发明公开了一种基于参考序列的基因压缩方法,首先任意选取一个基因序列作为参考序列。其次,获取参考序列的小写字符和ACGT,并以二元组表示小写字符。然后,读取参考文件,获得参考文件的头部、换行信息、小写字符、N字符、碱基信息和其他字符,并将换行长度、小写字符、N字符和其他字符表示成二元组。接着,匹配参考序列和待压缩序列的小写字符二元组。最后匹配Hash值。解压缩过种采用压缩过程相反的步骤。采用本压缩方法的压缩比高,压缩速度快,而且二元组编码与基因次序无关,有利于分布式存储和分析基因序列。

    基于主动学习的葡萄糖浓度预测方法及相关设备

    公开(公告)号:CN114898875A

    公开(公告)日:2022-08-12

    申请号:CN202210432583.X

    申请日:2022-04-22

    Abstract: 本申请提供一种基于主动学习的葡萄糖浓度预测方法及相关设备,所述方法包括获取样本训练集;根据标记样本集对支持向量机模型进行训练,得到葡萄糖浓度预测模型;根据未标记样本集中构建待查询样本集;计算标记样本与待查询样本和未标记样本之间的巴氏距离,并结合目标函数确定未标记样本集中的目标样本并进行标记;将标记后的目标样本加入至标记样本集中,并利用新的标记样本集对葡萄糖浓度预测模型进行训练,得到训练好的葡萄糖浓度预测模型;将待测样本数据输入至训练好的葡萄糖浓度预测模型,输出葡萄糖浓度预测结果。本申请的方法能够以小样本训练预测精度较高的模型,大大减少了样本的标记成本。

Patent Agency Ranking