-
公开(公告)号:CN115344607A
公开(公告)日:2022-11-15
申请号:CN202210933381.3
申请日:2022-08-04
Applicant: 之江实验室
IPC: G06F16/2453 , G06F16/2455 , G06F9/50 , G06F16/901
Abstract: 本发明属于图数据挖掘领域,公开了一种面向图数据的批量流式边点混合切分方法,设计了一种基于点流数据的批量划分策略,提出了一种优化负载和通讯代价的目标函数,通过计算目标函数确定批量流数据的初始点切分。同时,本方法通过计算现有切分和将流数据节点的分身节点加入到次有切分后的切分增益,决定是否保留分身。除此之外,本发明既解决了点划分的信息丢失,又避免了边切分的信息冗余,在进行点切分和边切分时,都可以并行处理。
-
公开(公告)号:CN115329166A
公开(公告)日:2022-11-11
申请号:CN202210851507.2
申请日:2022-07-19
Applicant: 之江实验室
IPC: G06F16/906 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种多元异步时序数据分类方法,提出了一种新颖的时间感知双注意力和记忆增强网络,通过将注意和记忆结合起来,有效地模拟不规则、异步、稀疏采样的多元异步时间序列数据中复杂的相互作用,并设计了随机生成插补模块,构建一个双任务学习体系,实现缺失值插补和分类网络的协同统一。本发明在对异步时序数据缺失值插补和分类的过程中,能够有效挖掘数据隐含的相关性,挖掘有意义的潜在语义,并充分利用序列数据中的辅助信息,从未标记的数据中发现有意义的模式。同时考虑异步时序数据缺失值插补和分类两个任务之间的相互作用,有助于缓解误差传播问题,捕捉相互影响,提高模型的准确性。
-
公开(公告)号:CN115146708A
公开(公告)日:2022-10-04
申请号:CN202210641407.7
申请日:2022-06-08
Applicant: 之江实验室
Abstract: 本发明属于数据挖掘异常检测技术领域,公开了一种基于生成式对抗主动学习的离群点检测方法,该方法步骤为:S1、输入数据;S2、训练生成模型并生成样本;S3、训练主动学习分类模型并筛选生成样本;S4、训练判别模型;S5、执行异常检测操作。本发明针对异常检测中常见的数据样本标签数量有限和正负样本不均匀分布等问题,采用基于生成式对抗主动学习的技术方法,生成多样的、信息丰富的、有代表性的样本,实现更准确的离群点检测。
-
公开(公告)号:CN114943019A
公开(公告)日:2022-08-26
申请号:CN202210448476.6
申请日:2022-04-27
Applicant: 之江实验室
IPC: G06F16/903 , G06F16/901
Abstract: 本发明属于图数据挖掘技术领域,公开了一种基于双层权重网络随机游走的top 非重叠多样化社区发现方法,包括如下步骤:步骤一:属性图数据、参数输入;步骤二:构造结构紧密性权重网络;步骤三:构造属性多样化增益权重网络;步骤四:基于双层权重网络的标签传播;步骤五:计算多样化社区度量,排序输出前个结果。本发明通过在原属性图基础上构造紧密度权重网络和属性多样化增益权重网络,实现在社区挖掘的过程中同时使用结构紧密和属性多样化双重约束。本方法在设计辅助网络权重时,通过引入几个超参数,使得算法具有灵活性和泛化性,可以根据实际应用的需要来调节属性约束和结构约束所占的比重。
-
公开(公告)号:CN114693427A
公开(公告)日:2022-07-01
申请号:CN202210222726.4
申请日:2022-03-07
Applicant: 之江实验室
Abstract: 本发明涉及金融信贷反欺诈领域,公开了一种金融信贷反欺诈方法,该方法利用信贷中的数据构建多关系时序网络,并对网络中节点特征进行转化,使得表征向量保留原有数据特征的同时,还保留了原数据的角色信息;使用邻居聚合的方法将不同关系不同时间下的网络节点特征进行更新,并添加对应的异步时间戳信息;最后使用门控循环后期融合模型对不同关系各个时间步的特征进行融合,获得融合后的信贷申请者的图节点联合特征,对申请者是否是消费套现或信用卡套现进行准确地判断,达到高效信贷反欺诈的效果。
-
公开(公告)号:CN114399039A
公开(公告)日:2022-04-26
申请号:CN202111541216.5
申请日:2021-12-16
IPC: G06N3/08
Abstract: 本发明公开了一种不确定的数据交互图中挖掘子图的方法及装置,输入不确定图、度数限制、概率临界值,不确定图用于表示连接关系不稳定的多个结点之间的关系,度数限制、概率临界值用于获取满足特定限制的子图;对不确定图进行剪枝;对剪枝后的不确定子图的每个结点,求出其出现的概率;对剪枝后的不确定子图中的每个结点进行遍历,当结点出现的概率小于概率临界值时,将结点从剪枝后的不确定子图中移除。采用本发明能够充分考虑了现实场景中数据的不稳定性对子图概率造成的波动,提高了子图挖掘的稳定性;同时使用三种剪枝算法,减少计算量,在相同挖掘场景下对比其他挖掘子图的算法大大降低了资源的消耗。
-
公开(公告)号:CN114333027A
公开(公告)日:2022-04-12
申请号:CN202111671593.0
申请日:2021-12-31
IPC: G06V40/16 , G06K9/62 , G06V10/764 , G06V10/774 , G06V10/74
Abstract: 本发明公开了基于联合和交替学习框架的跨域新类人脸表情识别方法,包括:A、建立基本类表情数据集和复合类表情数据集;B、构建用于表情数据识别的情感‑相似度网络;C、对步骤B中的情感分支进行训练全部基本类表情数据的分类模型;D、对步骤B中的相似度分支进行学习表情数据可迁移的特征和度量;E、构建二阶段的联合和交替学习学习框架进行训练情感‑相似度网络,以提高模型对新类表情的泛化能力;F、在复合类表情数据集上采样N个类,使每类包含K个有标签样本作为支持集,每类Q个样本作为查询集,然后基于经训练的相似度分支对查询集进行新类表情分类准确率的计算;本方案是一种灵活且贴近实际需求的解决新类人脸表情识别问题的方案。
-
公开(公告)号:CN113658716A
公开(公告)日:2021-11-16
申请号:CN202110851425.3
申请日:2021-07-27
Applicant: 之江实验室
IPC: G16H50/80 , G06F16/215 , G06F16/26 , G06F16/29
Abstract: 本发明属于公共卫生服务技术领域,具体涉及一种基于约束子图计算的新冠肺炎感染人群分析方法及系统,该方法步骤为:S1、新冠数据收集与清洗;S2、构建新冠肺炎场景下的人群图模型;S3、分析计算人群被感染概率指数;S4、发现潜在的感染人群并输出。本发明采用约束子图计算挖掘技术,综合多方面感染因素,通过定义计算被感染概率指数的方法,更有效的挖掘出潜在的新冠肺炎感染人群;基于被感染概率指数指标,设计新冠肺炎感染人群分析系统,设定不同级别的防疫应对举措,精确通知到管理部门和个体人群,为公共卫生防疫工作提供极大的助力,降低新冠感染概率,保护公众生命安全。
-
公开(公告)号:CN113282415A
公开(公告)日:2021-08-20
申请号:CN202110570428.X
申请日:2021-05-25
Abstract: 本发明公开了一种分布式环境下的带标签图模式匹配方法,分布式环境中的主节点对数据图进行划分并将每份节点数据分别发送至每个从节点,同时将带标签模式图分发到每个从节点,从节点会根据本地数据的存储情况和通信状况动态选择匹配路径,得到图模式匹配结果后反馈至主节点,由主节点对所有图模式匹配结果进行聚合后输出。本发明在使用以任务为中心的图计算模式的同时,充分考虑到了分布式环境中存在的负载均衡问题,以便充分利用分布式环境中每台机器的CPU算力,可以有效提高图模式匹配的效率。
-
公开(公告)号:CN113255895A
公开(公告)日:2021-08-13
申请号:CN202110632199.X
申请日:2021-06-07
Abstract: 本发明涉及一种基于图神经网络表示学习的结构图对齐方法和多图联合数据挖掘方法。该方法对训练数据中的图进行子图采样;通过有标注的已经对齐的节点对,利用图神经网络学习子图中节点的低维向量表示;根据子图中节点的低维向量表示计算节点之间的相似度,并以相似度作为依据对图进行对齐,最终获得训练好参数的图神经网络;在推测阶段,对待对齐的两图通过训练好的图神经网络得到每个节点的低维向量表示,进而计算节点之间的相似度,并以相似度作为依据对两图进行对齐,进而利用对齐后的多图数据进行联合数据挖掘。本发明在有监督的设置下,考虑了模型的表达性能,损失函数设置,以及表示向量空间约束和可扩展性,实现了对已有方法的提升。
-
-
-
-
-
-
-
-
-