一种基于多层图收缩和反向可达图采样的稀疏社交网络影响最大化方法及装置

    公开(公告)号:CN118193795A

    公开(公告)日:2024-06-14

    申请号:CN202410351628.X

    申请日:2024-03-26

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于多层图收缩和反向可达图采样的稀疏社交网络影响最大化方法及装置。首先对原图进行逐层收缩,得到一个结构相近,但规模更小的缩略图;然后对缩略图求解影响最大化算法,得到一个近似的种子节点集合;最后对缩略图逐层展开,恢复至原图,同时将种子节点集合逐层展开并调优,进行用户感兴趣的主题信息推送。相较影响最大化领域的现有算法,本发明可以有效地求解节点个数巨大的稀疏社交网络,通过收缩提高图结构的稠密程度,解决传统反向可达图采样算法中单次采样局部性过强、对图结构整体覆盖能力弱的问题,从而大幅降低采样所需的时空开销,同时本发明具有实现简单、近似能力良好、可扩展性强的优点。

    基于分布式的连续时间动态图神经网络训练方法及系统

    公开(公告)号:CN117875391A

    公开(公告)日:2024-04-12

    申请号:CN202410039382.2

    申请日:2024-01-10

    Abstract: 本发明公开了一种基于分布式的连续时间动态图神经网络训练方法及系统,包括以下步骤:将用于训练的动态社交网络图数据进行子图划分、批次划分、校准以及采样,得到若干个批次的动态社交网络采样子图数据,由每个节点的获取历史时序嵌入和历史交互消息得到每个节点的时序嵌入,当完成一个批次训练过程后,利用每个节点的时序嵌入以及动态社交网络采样子图数据的边特征进行聚合计算,得到每个节点的更新交互消息。本发明的方法通过提供图划分存储、分布式内存同步机制、分布式子图采样和编码‑解码器训练,将单机的连续时间动态图神经网络模型拓展到分布式场景下,解决了在大数据情况下内存资源不足的问题。

    时序图的图数据管理方法
    13.
    发明公开

    公开(公告)号:CN117149843A

    公开(公告)日:2023-12-01

    申请号:CN202310886631.7

    申请日:2023-07-19

    Applicant: 浙江大学

    Abstract: 本发明公开了一种时序图的图数据管理方法。该方法将携带时序信息的图数据以时序属性图形式组织起来,通过一套建模规则存储在Neo4j图数据库中,借助Neo4j图数据库所提供的成熟的图数据管理方法,可以查询和更新时序图数据。时序属性图用对象节点表示实体,用属性节点描述实体,用值节点表示属性节点的值,用边表示实体间的关系。时序属性图帮助图数据与时态信息有机结合,并通过约束增强了时序图数据的完整性,能够捕捉图数据随时间的变化。针对时间维度,本发明研究了时序图的查询和更新需求,包括时序图模式匹配、时序路径查询和时间窗口限定等,提供的查询和更新语法可以显著降低代码量和编写难度,优化时序图数据分析的业务逻辑并提高执行效率。

    一种基于多样性的动态影响力传播种子最小化方法

    公开(公告)号:CN115659007A

    公开(公告)日:2023-01-31

    申请号:CN202211151849.X

    申请日:2022-09-21

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于多样性的动态影响力传播种子最小化方法,基于一个双向自适应贪婪算法的框架,采用基于鞅的影响力最大化算法(IMM)和基于鞅的多样性影响力最大化算法(DIMM)实现,算法核心是使用一种随机产生反向影响草图(RI‑Sketch)的采样方法,用于估计影响力扩散和多样性函数增益,具有良好的近似保证。本发明解决了如何以最小的成本在最少时间内使得影响力传播达到特定阈值的问题,克服了传统方法不能有效考虑多样性问题以及算法本身缺乏动态选择过程的弊端,可以在一定的扩散模型下有效选取合适的种子集合。

    物品推荐方法、装置、计算机设备和存储介质

    公开(公告)号:CN119444350A

    公开(公告)日:2025-02-14

    申请号:CN202411404341.5

    申请日:2024-10-09

    Abstract: 本申请涉及一种物品推荐方法、装置、计算机设备和存储介质,其中,该方法包括:获取训练数据集,训练数据集为包含各样本用户与各样本物品之间交互信息的文档数据或文本数据;针对预先建立的推荐模型,构建基于预设瑞丽散度系数和可学习的用户个性化阈值参数的推荐损失函数;将训练数据集输入推荐模型,基于推荐损失函数训练推荐模型,得到训练完备的推荐模型;推荐模型的输出为文档关于特定物品的预测评分,或文本关于特定物品的预测评分;将目标用户与目标物品之间的历史交互数据输入推荐模型,得到关于目标物品的预测评分,基于各预测评分的排序进行物品推荐。通过本申请,解决了无法向用户准确推荐物品的问题,实现了向用户准确推荐物品。

    图神经网络训练方法、装置、设备和可读存储介质

    公开(公告)号:CN119398094A

    公开(公告)日:2025-02-07

    申请号:CN202411303419.4

    申请日:2024-09-18

    Abstract: 本申请涉及一种图神经网络训练方法、装置、设备和可读存储介质。所述方法包括:获取图结构的多个训练边集和待训练的图神经网络;确定每个训练边集各条边中每个节点的邻居节点集;通过确定邻居节点集中每个邻居节点的邻居位置编码信息和结构位置编码信息,以及对节点间的共同邻居进行扩展,得到共同邻居编码信息;根据结构位置编码信息和共同邻居编码信息对图神经网络进行训练,在满足预设训练条件的情况下,结束训练得到训练好的图神经网络;获取待处理图结构,将待处理的图结构输入至训练好的图神经网络,得到待处理图结构的预测结果。采用本方法能够提高预测的准确性。

    模型验证方法、装置、计算机设备和存储介质

    公开(公告)号:CN119251626A

    公开(公告)日:2025-01-03

    申请号:CN202411161452.8

    申请日:2024-08-22

    Abstract: 本申请涉及一种模型验证方法、装置、计算机设备和存储介质,方法包括:获取生成模型基于第一噪声和第一文本生成的第一合成图,以及生成模型基于第二噪声和第二文本生成的第二合成图;根据第一模型对第一合成图的预测结果和第一噪声,得到第一目标噪声,并根据第二模型对第二合成图的预测结果和第二噪声,得到第二目标噪声;获取生成模型基于第一目标噪声和第一文本生成的第三合成图,以及基于第二目标噪声和第二文本生成的第四合成图;通过比较第一模型对第三合成图的预测结果和第二模型对第四合成图的预测结果,判断第一模型是否对生成模型进行知识窃取,采用本方法能够准确验证第一模型是否对生成模型的合成图数据集进行知识窃取。

    融合图扩散卷积与分组聚合特征的欺诈识别方法和装置

    公开(公告)号:CN118194088A

    公开(公告)日:2024-06-14

    申请号:CN202410297915.7

    申请日:2024-03-15

    Applicant: 浙江大学

    Abstract: 本发明公开了一种融合图扩散卷积与分组聚合特征的欺诈识别方法和装置。该方法包括提取原图结构,对原图进行图结构增强获得两跳图,输入到分类模型,包括对图按照关系类型划分关系子图,对各关系子图做特征分组聚合,对各关系子图分组聚合后的特征做图扩散卷积,再将各关系子图扩散卷积后的特征做关系聚合得到最终特征并通过全连接层输出预测结果。本发明的图扩散卷积除了聚合原图的分组邻域节点特征,还聚合了图结构增强生成的二跳图的分组邻域节点特征,充分利用了图的结构信息,关系信息,分组信息。本发明在欺诈检测领域的应用,能有效提高对欺诈的识别能力,有很大的实用价值。

    一种基于深度哈希编码和多任务预测的逃费车辆相似图片检索方法

    公开(公告)号:CN116108217B

    公开(公告)日:2023-12-19

    申请号:CN202211327218.9

    申请日:2022-10-27

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于深度哈希编码和多任务预测的逃费车辆相似图片检索方法。其特征在于,以resnet50作为特征提取器,分别输入到车辆id、车型、颜色预测模块和哈希码生成模块四个分支同时训练。哈希码生成模块可以生成不同长度的哈希编码,车型和颜色预测模块分别对车型和颜色进行预测。该方法同时对车型预测、颜色预测、哈希编码生成模块进行优化,可以实现基于属性的粗粒度检索和基于不同层次哈希码的细粒度检索。针对逃费车辆,首先可以从数据库中针对粗粒度属性特征筛选出匹配的图片,再根据由短到长的哈希码不断进行更加精细化的检索。由粗到精的检索方法和哈希编码的方式大大提高检索速度和检索效率。

    时间序列在线决策模型的数据处理和模型训练的优化方法

    公开(公告)号:CN116205625A

    公开(公告)日:2023-06-02

    申请号:CN202310111434.8

    申请日:2023-02-07

    Applicant: 浙江大学

    Abstract: 本发明公开了一种时间序列在线决策模型的数据处理和模型训练的优化方法。本发明通过多源传感器获取蒸汽锅炉的水位、过热蒸汽温度及压力、烟气氧量与炉膛负压等时序数据;数据处理时,首先将各时序数据中浮点类型的精度统一,然后等比例放大为整型数据,根据设定的时间间隔完成多源时序数据的插值和时间序列对齐;汇总后的时序数据使用压缩算法,以时间戳为主键,压缩存储至数据库中;决策时读取数据库中的压缩数据,解压后构建特征向量,输入模型,在线决策模型计算后输出决策信息;运维人员根据模型决策结果及时调整锅炉外部输入设备的参数,以及是否要停机设备保养。本方法简化了决策模型的复杂度,进一步提升了决策效率和存储效率。

Patent Agency Ranking