-
公开(公告)号:CN103336793A
公开(公告)日:2013-10-02
申请号:CN201310230933.5
申请日:2013-06-09
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明公开了一种个性化论文推荐方法及其系统,其中该方法包括:步骤1,利用科研领域中研究人员撰写学术论文的行为特性,挖掘异质学术网络数据,根据所述异质学术网络数据构建训练数据集,并根据所述训练数据集进行训练得到排序学习模型;步骤2,在线构建用户配置,生成用户感兴趣的候选论文集,根据所述候选论文集并基于所述排序学习模型生成论文推荐结果,基于所述论文推荐结果,按照一定方式生成论文推荐返回给用户;步骤3,在线接收用户反馈,并根据不同的用户反馈行为相应地更新所述论文推荐结果。本发明有效地避免了推荐系统初期的“冷启动”问题,保证了推荐结果的准确率和召回率。
-
公开(公告)号:CN119294469A
公开(公告)日:2025-01-10
申请号:CN202411219818.2
申请日:2024-09-02
Applicant: 中国科学院计算技术研究所 , 苏州空天信息研究院
IPC: G06N3/091 , G06N3/045 , G06F18/214
Abstract: 本发明提供一种面向知识获取的主动学习方法,用于对知识获取模型进行多次迭代训练,每次迭代包括:获取有多个有标签的样本的第一训练集和有多个未标注标签的样本的候选数据集,每个样本为一段文本数据,标签为在知识获取任务中为样本设置的知识类别标签;获取预设的查询函数,该函数用于计算样本对训练模型的价值量化值,样本的价值量化值是预设的不确定性指标和多个预设指标的加权和,多个预设指标包括动量指标、方差指标和损失值指标中任意两个或三个;根据利用查询函数计算的多个未标注标签的样本各自的价值量化值,选择有价值的样本,对其标注标签后添加到第一训练集,得到第二训练集;利用第二训练集训练模型根据文本数据进行知识类别预测。
-
公开(公告)号:CN119204013A
公开(公告)日:2024-12-27
申请号:CN202411218721.X
申请日:2024-09-02
Applicant: 中国科学院计算技术研究所 , 苏州空天信息研究院
IPC: G06F40/295 , G06F40/284 , G06F16/35 , G06F18/241 , G06N3/042 , G06N3/0455 , G06N3/048 , G06N3/096 , G06N3/0442
Abstract: 本发明提供了一种基于原型网络门控机制的类增量知识获取方法,包括获取待预测的文本;将文本输入经知识获取领域的类增量学习方法训练得到的编码模块,得到各词元的特征向量,并各词元的特征向量构建每个知识单元的单元表示;利用预设的原型网络门控机制确定各知识单元所属的类别,包括:获取每个知识单元的单元表示与各类别的原型表示之间的相似度,根据相似度筛选部分匹配的专家网络对知识单元进行预测,得到筛选出的专家网络对知识单元是否属于该专家网络对应类别的预测值;对于重叠的知识单元,仅保留其中具有最高预测值的知识单元的预测值;如果一个知识单元在所有类别的预测值都小于预设阈值,则该知识单元不属于任何专家网络所对应的类别。
-
公开(公告)号:CN119089005A
公开(公告)日:2024-12-06
申请号:CN202410995162.7
申请日:2024-07-24
Applicant: 中国科学院计算技术研究所
IPC: G06F16/901 , G06F16/903 , G06F16/906
Abstract: 本发明提出了一种大规模高维向量最近邻数据检索方法和装置,面对当前包含海量信息的向量数据集,尽管现有向量查询索引创建方案能给出基于静态数据集的高指向性查询索引,在面临有大批量新增数据加入时缺乏高效的更新方法,难以维持查询索引的指向性。本发明提出了基于改进乘积量化的大规模高维向量查询索引的创建及动态更新方法,在保证较高的查询精度同时将更新消耗限制在较低水平,并维持更新后查询索引较高的指向性。
-
公开(公告)号:CN118551761A
公开(公告)日:2024-08-27
申请号:CN202310176248.2
申请日:2023-02-24
Applicant: 中国科学院计算技术研究所
IPC: G06F40/295 , G06F40/30 , G06N5/02 , G06F16/35 , G06N3/084 , G06N3/047 , G06N3/0464
Abstract: 本发明提出一种基于主动学习的文本关系抽取方法和系统,包括:从文档库中筛选出所有和知识库中实体对相异的新实体对;使用噪声预测模型筛除所有新实体对中的噪声数据,得到中间实体对,使用关系预测模型对所有中间实体对进行打分,为得分高于阈值的中间实体打标注,形成新关系数据集;合并新关系数据集、重标注数据集和清洁数据集,形成远程监督关系抽取数据集;使用K个具有不同噪声转换矩阵的句子编码器分别拟合句子的向量表示在各标签类型上的噪声分布,以将真实标签的语义表征映射到噪声标签的语义表征空间中,得到句子的预测标签,其中K为标签类型总数;基于训练完成后的K个句子编码器产生的预测结果,得到目标句子中实体对的文本关系。
-
公开(公告)号:CN118070868A
公开(公告)日:2024-05-24
申请号:CN202410293163.7
申请日:2024-03-14
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于边缘计算架构的模型结构化剪枝方法及装置,该方法包括:根据集群中每一边缘设备的硬件资源信息,对边缘设备进行分组;对于同一组的边缘设备,将神经网络加速器在该边缘设备硬件的实际运行时间与内存资源消耗作为资源约束条件,对该边缘设备上部署的神经网络模型进行剪枝;校准修剪后的神经网络模型。该方法提高了计算设备的硬件处理速度,降低了内存消耗,进而提升了计算机系统的内部性能。
-
公开(公告)号:CN117353891A
公开(公告)日:2024-01-05
申请号:CN202311183915.6
申请日:2023-09-14
Applicant: 中国科学院计算技术研究所
IPC: H04L9/00 , H04L9/40 , H04L9/32 , H04L67/1097 , G06F21/60 , G06F21/64 , G06F40/289
Abstract: 本发明提供了一种去中心化的数据交易平台,包括:元数据管理模块,被配置为:获取卖方待售的数据对应的元数据以及数据对应的加密数据,所述元数据包括数据描述信息和卖方地址;数据查重模块,被配置为:根据所述数据对应的加密数据以及已有数据对应的加密数据以非解密状态进行数据查重,确定所述待售的数据的重复率,所述重复率影响所述数据的评分;数据交易模块,被配置为:在买方根据所述待售的数据的元数据和评分确定向卖方购买数据后,在卖方和买方之间建立基于智能合约的数据传输支付协议并通过加密信道传输数据。
-
公开(公告)号:CN116541569A
公开(公告)日:2023-08-04
申请号:CN202310539720.4
申请日:2023-05-15
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9035 , G06Q50/00 , G06F16/901
Abstract: 本发明提供了一种社交网络图的处理方法,包括:获取包括第一社交网络图和第二社交网络图的待处理网络图,以及两个图对应的初始锚点对集合;针对所述第一社交网络图和所述第二社交网络图分别提取两个图的节点结构信息;根据所述两个图的节点结构信息采用启发式的过滤规则基于多种相似度计算方式从所述初始锚点对集合中筛选出满足预设相似性要求的初始锚点对,得到经过滤的初始锚点对集合,其中,至少部分相似度计算方式依据两个图中能表征邻居结构的相关特征来计算相似度;基于所述节点结构信息和所述经过滤的初始锚点对集合确定所述第一社交网络图和所述第二社交网络图中节点间的关联关系。
-
公开(公告)号:CN111738003B
公开(公告)日:2023-06-06
申请号:CN202010541415.5
申请日:2020-06-15
Applicant: 中国科学院计算技术研究所
IPC: G06F40/295 , G06N3/0464 , G06N3/08
Abstract: 本发明实施例提供了命名实体识别模型训练方法、命名实体识别方法和介质,本发明考虑先用源领域标记数据和目标领域未标记数据集对第一训练模型进行训练,基于第一训练模型的参数设置第二训练模型,再用目标领域标记数据集对第二训练模型进行微调,从而得到最终的命名实体识别模型,由此,避免了需要大量标记目标领域的样本用于训练的问题。
-
公开(公告)号:CN115761414A
公开(公告)日:2023-03-07
申请号:CN202211536222.6
申请日:2022-12-01
Applicant: 中国科学院计算技术研究所
IPC: G06V10/774 , G06V10/82
Abstract: 本发明提出一种鲁棒数据集蒸馏方法,包括:在原训练数据集中进行随机采样,作为初始化的蒸馏数据集;对该原训练数据集进行随机采样,得到原样本采样集;为该原样本采样集添加对抗扰动,得到扰动样本采样集;分别计算该扰动样本采样集与该蒸馏数据集的特征表示或网络梯度,以该特征表示或网络梯度的差异作为损失函数;根据该损失函数反向传播对该蒸馏数据集进行优化更新,不断迭代优化过程,直至损失函数收敛,保存当前蒸馏数据集作为最终的鲁棒蒸馏数据集。以该鲁棒蒸馏数据集代替该原训练数据集,训练目标深度神经网络模型完成图像识别分类。本发明将对抗鲁棒特性蒸馏到鲁棒蒸馏数据集,从而提升蒸馏数据集训练得到模型的鲁棒性。
-
-
-
-
-
-
-
-
-