异常账户识别方法、装置、介质及计算机设备

    公开(公告)号:CN118172063A

    公开(公告)日:2024-06-11

    申请号:CN202410362283.8

    申请日:2024-03-27

    Abstract: 本发明提出一种异常账户识别方法、装置、介质及计算机设备,所述方法包含:获取账户训练集,构建账户关系图,该账户关系图包含多个账户节点,两账户节点之间构成一条表示两账户之间行为关系的行为边;将该账户关系图划分为多个不同的训练环境,训练异常识别模型,该异常识别模型输出预测异常账户;其中,每一训练环境所包含的账户节点和行为边的连接方式保持与该账户关系图一致。该方法在预测准确度上取得了显著的提升效果。

    一种分布式的趋同行为挖掘方法与系统

    公开(公告)号:CN108563715A

    公开(公告)日:2018-09-21

    申请号:CN201810271602.9

    申请日:2018-03-29

    Abstract: 本发明涉及一种分布式的趋同行为挖掘方法和系统,包括:获取由四元组数据组成的数据集合,四元组数据包括对象、事件、时间点和权重,将数据集合按照事件类型划分为多个事件集合;为事件集合构建索引树,根据事件集合中的时间点确定索引树的时间总长,根据线段树划分法将时间总长拆分为时间段,索引树的每个节点对应时间段中每个对象的权重和,存储索引树至分布式数据库;获取待查询对象的待查询事件和待查询时间段,在分布式数据库查找与待查询事件相对应的索引树,作为待查询索引树,在待查询索引树中查询待查询时间段中每个对象的权重和,作为待查询对象的趋同程度,选择趋同程度最高的对象作为挖掘结果。

    一种基于并行自动编码机的特征学习方法及系统

    公开(公告)号:CN105825269B

    公开(公告)日:2018-06-26

    申请号:CN201610147007.5

    申请日:2016-03-15

    Abstract: 本发明提供一种基于并行自动编码机的特征学习方法,包括:1)管理机执行Map操作,为各个工作机规划任务并将任务分发给每个工作机;其中,各个工作机的任务一致,均是基于所输入的数据对自动编码机的权值矩阵进行训练;所述权值矩阵包含了所述自动编码机的所有权值;2)每个工作机分别读取该工作机对应的部分数据集;3)各个工作机并行地执行管理机所分发的任务,对自动编码机的权值矩阵进行训练,然后每个工作机将它所训练的权值矩阵反馈给管理机;4)管理机执行Reduce操作,对各个工作机反馈的权值矩阵进行算数平均。本发明能够更加高效地实现特征学习;能够将并行自动编码机的数据处理的时间复杂度由二次复杂度降为线性复杂度。

    内容推荐方法、装置、电子设备、存储介质和程序产品

    公开(公告)号:CN116932878A

    公开(公告)日:2023-10-24

    申请号:CN202210359744.7

    申请日:2022-04-06

    Abstract: 本申请实施例公开了一种内容推荐方法、装置、电子设备、存储介质和程序产品;本申请实施例获取待推荐对象的个性化标识以及所述待推荐对象的对象特征;拼接所述个性化标识以及所述对象特征,得到拼接后的对象特征;对所述拼接后的对象特征进行编码,得到初始编码向量;通过所述个性化标识对应的目标参数,调整所述初始编码向量,得到目标向量;确定所述目标向量对应的目标内容,并将所述目标内容推荐至所述待推荐对象。由此,本方案可以在内容推荐过程中,增加对个性化标识的关注,提供与个性化标识相关的推送内容,满足待推荐对象的推荐需求,提升推送内容的准确性。

    一种基于频繁交易模式的异常账户检测方法及系统

    公开(公告)号:CN110717828B

    公开(公告)日:2022-09-30

    申请号:CN201910846523.0

    申请日:2019-09-09

    Abstract: 本发明提出一种基于频繁交易模式的异常账户检测方法及系统,包括:获取区块链中数字货币交易的时间图,其中时间图中节点为交易账户,时间图中节点间的边代表交易账户间的货币交易方向和交易时间,剔除时间图中每条边的交易时间,得到交易图;挖掘时间图中各交易模式出现的次数,确定时间图的频繁模式,统计节点对在频繁模式中出现的次数作为两个账户之间的高阶相似度,集合所有高阶相似度得到高阶相似度矩阵;基于高阶相似度矩阵对交易图中的节点进行聚类处理,得到由属于同一簇的节点构成的交易子图,并通过分类网络对交易子图进行分类,输出分类结果。以实现给定一段时间的交易记录和感兴趣的交易模式,给出与给定交易模式相关的账户簇。

    语言处理方法、装置、设备及存储介质

    公开(公告)号:CN110147881A

    公开(公告)日:2019-08-20

    申请号:CN201810206125.8

    申请日:2018-03-13

    Abstract: 本发明是关于一种语言处理方法、装置、设备及存储介质,属于数据处理技术领域。所述方法包括:将源语句进行预处理,生成第一向量;从第一参考向量集中,获取与第一向量间相似度大于第一阈值的第一参考向量;利用第一神经网络,对第一向量及第一参考向量进行解码处理,确定与源语句对应的目标语句,其中,所述第一参考向量集中的参考向量,为在所述第一神经网络训练阶段,对训练数据中的问题语句学习后生成的向量。由此,实现了在进行语言处理过程中,使得神经网络的解码过程,融入了当前源语句与训练样本间的关联关系,从而提高了获取的目标语句的准确性,有效改善了语言处理装对低频源语句处理的准确性。

    描述型多维度事件序列的并行频繁情节挖掘方法与系统

    公开(公告)号:CN106203631B

    公开(公告)日:2019-04-30

    申请号:CN201610524750.8

    申请日:2016-07-05

    Abstract: 本发明提出描述型多维度事件序列的并行频繁情节挖掘方法与系统,涉及互联网技术领域,该方法包括按照事件属性将所述事件序列分为多个事件子序列,对每个事件子序列进行挖掘,并将挖掘结果进行存储,将相同的事件子序列进行计数累加,将计数结果小于预设阈值的事件子序列过滤,生成事件子序列集合;以待扩展情节为前缀,连接所述事件子序列集合中任一项所述事件子序列,生成新的情结,计算所述新的情结的发生,并存储到发生集合,通过递归对所述新的情结进行扩展。本发明实现了子序列之间挖掘的完全并行,即在多节点同时计算各子序列的所有情节及其发生集合,最终合并所有子序列的挖掘结果获得全局频繁情节。

    一种面向大数据的分布式主题发现方法及系统

    公开(公告)号:CN103593418A

    公开(公告)日:2014-02-19

    申请号:CN201310526790.2

    申请日:2013-10-30

    CPC classification number: G06F17/30194 G06F17/30705 G06F17/30731

    Abstract: 本发明涉及一种面向大数据的分布式主题发现系统及方法,包含三个并行处理过程,每个过程均由映射、组合、化简三个功能模块中的一个或多个组合而成,对每个输入文档的特征向量进行正规化,并且对构成该文档的每个词在本文档中出现次数进行计数;在映射功能模块端将每个文档作为一个原始类并对文档频率计数,在组合模块端对映射模块端产生的原始类进行本地聚类,生成局部类,在化简模块端对来自多个远端物理节点组合产生的局部类进行聚类,生成全局类;对第二个映射/化简过程产生全局类的内部关键词进行打分和排序,输出用户所需的K个高分关键词表达主题。从而处理TB级数据,并且计算能力线性上升,真正实现分布式计算,提高性能和效率。

    一种并行的垂直交叉网络数据采集方法及系统

    公开(公告)号:CN103258017A

    公开(公告)日:2013-08-21

    申请号:CN201310146080.7

    申请日:2013-04-24

    Inventor: 敖翔 何清 庄福振

    Abstract: 本发明提供一种并行的垂直交叉网络数据采集方法及系统,方法包括:S1确定采集方式,若是普通URL列表采集方式根据URL列表直接下载待下载网页数据及其元数据,若是垂直交叉采集方式利用交叉关键字列表检索待下载页,并下载该网页数据及其元数据;S2定时更新任务,对已下载的网页中第一层到当前层的所有网页进行扫描检查,当新下载的页面最后修改时间大于已下载的页面最后修改时间时,对该新下载的页面重新进行数据采集,更新网页数据记录。本发明避掉了多线程技术的一些潜在风险和代价,降低了多线程并行采集的潜在风险与代价,可以实现海量数据更稳定、更高效的并行采集,提高了数据读取和查询的效率。

Patent Agency Ranking