-
公开(公告)号:CN114926676A
公开(公告)日:2022-08-19
申请号:CN202210425626.1
申请日:2022-04-21
Applicant: 中国科学院信息工程研究所
IPC: G06V10/764 , G06K9/62 , G06V10/774 , G06F17/16 , G06V10/40 , G06V10/74
Abstract: 本发明公开了一种基于特征空间有效面积的自适应加权长尾分类方法及装置,所述方法包括:在原始数据的分布上训练特征提取器与分类器,得到基本分类模型;基于训练后的特征提取器,抽取所述原始数据的特征表示,并根据每一类别中所述特征表示之间的相关系数,构建该类别的相关系数矩阵;基于所述相关系数矩阵,计算每一类别在特征空间中的有效面积,并通过所述有效面积给各类别分配权重,训练所述基本分类模型,以得到分类模型;基于所述分类模型,获取待检测数据的分类结果。本发明通过估计特征空间中的有效面积从而给予不同的类别不同的权重损失,更好的划分特征空间,以对长尾数据进行更有效地分类。
-
公开(公告)号:CN114913531A
公开(公告)日:2022-08-16
申请号:CN202210492865.9
申请日:2022-05-07
Applicant: 中国科学院信息工程研究所
IPC: G06V30/148 , G06V30/19 , G06V10/82 , G06N3/08 , G06N3/04
Abstract: 本发明公开了一种面向场景文本检测的文本检测器训练方法及文本检测方法。本发明的训练方法包括:1)使用训练数据集对所选文本检测器进行预训练;2)使用预训练获得的文本检测器参数对设定模型UNITS的每一分支进行初始化;其中,所述分支的模型结构与所述文本检测器结构一致;3)根据UNITS中设定的无监督训练策略,使用无标注的真实数据对UNITS进行无监督训练,同时使用训练数据集对UNITS进行有监督训练,更新UNITS的模型参数;4)使用步骤3)最终所得UNITS的模型参数对所述文本检测器初始化,然后使用有标注的目标数据集对初始化后的所述文本检测器进行有监督训练得到最终训练后的文本检测器。
-
公开(公告)号:CN114861766A
公开(公告)日:2022-08-05
申请号:CN202210387628.6
申请日:2022-04-13
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于多粒度演化的动态链路预测方法和系统。该方法包括:对动态图的每个时间片下的图进行划分,得到多粒度子图;从多粒度子图中提取节点的结构特征;从多粒度子图中学习图的动态演变规律,得到不同粒度的子图的动态演化特征,并将不同粒度的子图的动态演化特征进行融合,得到节点的动态演化特征;将节点的结构特征与节点的动态演化特征融合,得到包含时空特征的节点表示,根据包含时空特征的节点表示预测未来链路。本发明能够挖掘更丰富的图信息,从而增强对结构特征的提取能力,提高链路预测的准确率;本发明能够充分实现动态特征的融合,增强对动态特征的学习能力,进而提高了链路预测的性能。
-
公开(公告)号:CN110569338B
公开(公告)日:2022-05-03
申请号:CN201910660759.5
申请日:2019-07-22
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种生成式对话系统解码器训练方法及解码方法。本方法为:1)对于问句编码集合中的每一问句编码,使用前向、后向神经网络对该问句编码进行预测分别得到一向量表示结果;2)计算前向、后向神经网络每一步预测结果的差异,作为生成式对话系统编码器的损失函数;3)计算前向、后向神经网络每一步状态的差异,作为二者的局部差异;4)计算前向、后向神经网络所生成向量表示结果的句子向量表示,并计算两句子向量表示的差异,作为二者的整体性差异;5)将局部差异和整体性差异作为惩罚项函数加入损失函数中,得到整体惩罚函数作为生成式对话系统编码器的损失函数;6)采用训练后的前向神经网络对问句编码进行预测,生成回复内容。
-
公开(公告)号:CN114049234A
公开(公告)日:2022-02-15
申请号:CN202111305784.5
申请日:2021-11-05
Applicant: 中国科学院信息工程研究所
IPC: G06Q50/00 , G06N3/04 , G06N3/08 , G06K9/62 , G06F16/9536
Abstract: 本发明涉及基于用户行为与社交关系的用户成长值打分方法和系统。该方法的步骤包括:根据用户原始数据学习不同时间级别的用户行为时序特征,并根据用户发表的内容的影响力得到内容影响力特征,通过将内容影响力特征与用户行为时序特征交互得到融合时序行为的用户特征;使用注意力机制学习用户的不同邻居用户的权值,进而得到用户的权值矩阵;将融合时序行为的用户特征和用户的权值矩阵输入图卷积神经网络,得到用户成长值。本发明解决了社交关系在用户特征学习中利用不充分的问题,提高了用户成长值打分的准确率。
-
公开(公告)号:CN113806630A
公开(公告)日:2021-12-17
申请号:CN202110896075.2
申请日:2021-08-05
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9535 , G06F16/9536 , G06K9/62
Abstract: 本发明公开了一种基于注意力的多视角特征融合跨域推荐方法及装置,包括利用公共用户在源域的域特性特征公共用户与物品在目标域的域特性特征与域特性特征IT、公共用户与物品在源域与目标域之间的潜在可迁移特征与潜在可迁移特征进行融合;基于融合结果进行训练;在最优模型的基础上,获取最优偏好预测集,以对公共用户进行目标域中的物品推荐。本发明解决了源域和目标域之间潜在可迁移特征的捕获问题,对不同类型的特征设置不同的权值,实现不同类型特征的有机结合和充分利用,进而提高推荐系统的性能。
-
公开(公告)号:CN113627479A
公开(公告)日:2021-11-09
申请号:CN202110775393.3
申请日:2021-07-09
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于半监督学习的图数据异常检测方法。本方法为:1)数据分批采样模块将图数据样本进行分批,然后对于每一批图数据样本,以每一图数据样本中的每个边为目标边,依据设定采样跳数h以及每跳所要选取的边数Si对该目标边的邻居进行采样,得到该目标边的h阶邻域信息;2)利用边卷积神经网络依次对每一阶邻域信息加权求和,实现对目标边的邻域信息融合;重构该目标边并计算重构误差;若该目标边的重构误差超过设定阈值,则判定该目标边为异常;3)基于重构误差设计异常检测模型的损失函数,并利用步骤2)处理后的结果对图数据样本的边进行标注后训练异常检测模型;4)利用训练后的异常检测模型对待检测的图数据进行检测。
-
公开(公告)号:CN113626836A
公开(公告)日:2021-11-09
申请号:CN202110775401.4
申请日:2021-07-09
Applicant: 中国科学院信息工程研究所
IPC: G06F21/60 , G06F21/62 , G06F21/64 , G06F16/31 , G06F40/289
Abstract: 本发明公开了一种基于LSM的对称可搜索加密方法及系统。本方法为:1)客户端创建数据库表,将数据集中的数据信息填入相应的字段中;2)为设定加密索引字段构建加密索引,使用对称加密算法加密所述加密字段中的数据,生成验证集合Xset,该验证集合Xset中存储的信息为所述数据集中各文档对应的组合值,其中根据文档i的文档id及文档i的关键字生成文档i的组合值;将加密索引和加密数据上传至服务器端分配的服务器节点;3)客户端利用对称密钥和查询关键字生成对应的查询发送给服务器端;4)服务器端在加密数据库上执行查询操作并将查询结果返回给客户端;5)客户端接收服务器端返回的查询结果并对其进行解密。
-
公开(公告)号:CN110245285B
公开(公告)日:2021-07-13
申请号:CN201910357967.8
申请日:2019-04-30
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9535 , G06N3/04
Abstract: 本发明公开了一种基于异构信息网络的个性化推荐方法,本方法通过基于注意力的特征增强模块对不同元图上用户和物品潜在特征的重要性进行学习,降低了无用的潜在特征对评分预测所带来的干扰,增强了有用潜在特征对评分预测的贡献力;同时利用基于分层次特征交互的评分预测模块对特征间的不同相互关系进行学习,不但考虑用户和物品各自加权潜在特征之间的内在联系,而且考虑用户或物品与其加权潜在特征之间的相关性;然后通过用户和物品间特征的融合,使得各特征间的二阶线性交互关系得到了充分挖掘。本发明通过多层感知机和因子分解机的使用,使得各特征间的高阶非线性交互关系得到了全面利用和高效组合,大大提高了推荐系统的性能。
-
公开(公告)号:CN112883229A
公开(公告)日:2021-06-01
申请号:CN202110256218.3
申请日:2021-03-09
Applicant: 中国科学院信息工程研究所
IPC: G06F16/75 , G06F16/78 , G06F16/783 , G06K9/62
Abstract: 本发明涉及一种基于多特征图注意网络模型的视频‑文本跨模态检索方法和装置。该方法的步骤包括:建立多特征图注意网络模型,用于挖掘视频不同模态特征之间的结构关系,通过不同视频特征之间的高级语义信息交换获得高效的视频特征表示;采用双重约束排序损失函数训练所述多特征图注意网络模型,所述双重约束排序损失函数包含视频‑文本对之间的排序约束函数和单类数据内部的结构约束函数,不仅可以让语义相似的文本和视频在嵌入空间相近,而且能够在嵌入空间中保持原始的结构特性;利用训练完成的所述多特征图注意网络模型进行视频‑文本的跨模态检索。本发明使视频‑文本检索的检索性能得到了显著提升。
-
-
-
-
-
-
-
-
-