一种个性化论文推荐方法及其系统

    公开(公告)号:CN103336793A

    公开(公告)日:2013-10-02

    申请号:CN201310230933.5

    申请日:2013-06-09

    Abstract: 本发明公开了一种个性化论文推荐方法及其系统,其中该方法包括:步骤1,利用科研领域中研究人员撰写学术论文的行为特性,挖掘异质学术网络数据,根据所述异质学术网络数据构建训练数据集,并根据所述训练数据集进行训练得到排序学习模型;步骤2,在线构建用户配置,生成用户感兴趣的候选论文集,根据所述候选论文集并基于所述排序学习模型生成论文推荐结果,基于所述论文推荐结果,按照一定方式生成论文推荐返回给用户;步骤3,在线接收用户反馈,并根据不同的用户反馈行为相应地更新所述论文推荐结果。本发明有效地避免了推荐系统初期的“冷启动”问题,保证了推荐结果的准确率和召回率。

    一种面向知识获取的主动学习方法

    公开(公告)号:CN119294469A

    公开(公告)日:2025-01-10

    申请号:CN202411219818.2

    申请日:2024-09-02

    Abstract: 本发明提供一种面向知识获取的主动学习方法,用于对知识获取模型进行多次迭代训练,每次迭代包括:获取有多个有标签的样本的第一训练集和有多个未标注标签的样本的候选数据集,每个样本为一段文本数据,标签为在知识获取任务中为样本设置的知识类别标签;获取预设的查询函数,该函数用于计算样本对训练模型的价值量化值,样本的价值量化值是预设的不确定性指标和多个预设指标的加权和,多个预设指标包括动量指标、方差指标和损失值指标中任意两个或三个;根据利用查询函数计算的多个未标注标签的样本各自的价值量化值,选择有价值的样本,对其标注标签后添加到第一训练集,得到第二训练集;利用第二训练集训练模型根据文本数据进行知识类别预测。

    一种大规模高维向量最近邻数据检索方法及装置

    公开(公告)号:CN119089005A

    公开(公告)日:2024-12-06

    申请号:CN202410995162.7

    申请日:2024-07-24

    Abstract: 本发明提出了一种大规模高维向量最近邻数据检索方法和装置,面对当前包含海量信息的向量数据集,尽管现有向量查询索引创建方案能给出基于静态数据集的高指向性查询索引,在面临有大批量新增数据加入时缺乏高效的更新方法,难以维持查询索引的指向性。本发明提出了基于改进乘积量化的大规模高维向量查询索引的创建及动态更新方法,在保证较高的查询精度同时将更新消耗限制在较低水平,并维持更新后查询索引较高的指向性。

    一种基于主动学习的文本关系抽取方法及系统

    公开(公告)号:CN118551761A

    公开(公告)日:2024-08-27

    申请号:CN202310176248.2

    申请日:2023-02-24

    Abstract: 本发明提出一种基于主动学习的文本关系抽取方法和系统,包括:从文档库中筛选出所有和知识库中实体对相异的新实体对;使用噪声预测模型筛除所有新实体对中的噪声数据,得到中间实体对,使用关系预测模型对所有中间实体对进行打分,为得分高于阈值的中间实体打标注,形成新关系数据集;合并新关系数据集、重标注数据集和清洁数据集,形成远程监督关系抽取数据集;使用K个具有不同噪声转换矩阵的句子编码器分别拟合句子的向量表示在各标签类型上的噪声分布,以将真实标签的语义表征映射到噪声标签的语义表征空间中,得到句子的预测标签,其中K为标签类型总数;基于训练完成后的K个句子编码器产生的预测结果,得到目标句子中实体对的文本关系。

    一种去中心化的数据交易平台
    57.
    发明公开

    公开(公告)号:CN117353891A

    公开(公告)日:2024-01-05

    申请号:CN202311183915.6

    申请日:2023-09-14

    Abstract: 本发明提供了一种去中心化的数据交易平台,包括:元数据管理模块,被配置为:获取卖方待售的数据对应的元数据以及数据对应的加密数据,所述元数据包括数据描述信息和卖方地址;数据查重模块,被配置为:根据所述数据对应的加密数据以及已有数据对应的加密数据以非解密状态进行数据查重,确定所述待售的数据的重复率,所述重复率影响所述数据的评分;数据交易模块,被配置为:在买方根据所述待售的数据的元数据和评分确定向卖方购买数据后,在卖方和买方之间建立基于智能合约的数据传输支付协议并通过加密信道传输数据。

    一种社交网络图的处理方法
    58.
    发明公开

    公开(公告)号:CN116541569A

    公开(公告)日:2023-08-04

    申请号:CN202310539720.4

    申请日:2023-05-15

    Abstract: 本发明提供了一种社交网络图的处理方法,包括:获取包括第一社交网络图和第二社交网络图的待处理网络图,以及两个图对应的初始锚点对集合;针对所述第一社交网络图和所述第二社交网络图分别提取两个图的节点结构信息;根据所述两个图的节点结构信息采用启发式的过滤规则基于多种相似度计算方式从所述初始锚点对集合中筛选出满足预设相似性要求的初始锚点对,得到经过滤的初始锚点对集合,其中,至少部分相似度计算方式依据两个图中能表征邻居结构的相关特征来计算相似度;基于所述节点结构信息和所述经过滤的初始锚点对集合确定所述第一社交网络图和所述第二社交网络图中节点间的关联关系。

    一种鲁棒数据集蒸馏方法及系统
    60.
    发明公开

    公开(公告)号:CN115761414A

    公开(公告)日:2023-03-07

    申请号:CN202211536222.6

    申请日:2022-12-01

    Abstract: 本发明提出一种鲁棒数据集蒸馏方法,包括:在原训练数据集中进行随机采样,作为初始化的蒸馏数据集;对该原训练数据集进行随机采样,得到原样本采样集;为该原样本采样集添加对抗扰动,得到扰动样本采样集;分别计算该扰动样本采样集与该蒸馏数据集的特征表示或网络梯度,以该特征表示或网络梯度的差异作为损失函数;根据该损失函数反向传播对该蒸馏数据集进行优化更新,不断迭代优化过程,直至损失函数收敛,保存当前蒸馏数据集作为最终的鲁棒蒸馏数据集。以该鲁棒蒸馏数据集代替该原训练数据集,训练目标深度神经网络模型完成图像识别分类。本发明将对抗鲁棒特性蒸馏到鲁棒蒸馏数据集,从而提升蒸馏数据集训练得到模型的鲁棒性。

Patent Agency Ranking