一种基于BERT模型的话题检测方法、设备及存储介质

    公开(公告)号:CN113806528A

    公开(公告)日:2021-12-17

    申请号:CN202110769245.0

    申请日:2021-07-07

    Abstract: 本发明涉及一种基于BERT模型的话题检测方法与装置、设备及存储介质,包括步:(1)使用BERT模型对原始数据中的文本进行编码,将可变长度文本转换为固定长度的文本特征向量;(2)对文本特征向量依次进行归一化、卷积、池化处理,得到文本特征向量;(3)计算文本特征向量之间的相似度,对相似的文本特征向量去重;(4)使用文本特征向量分类器对文本特征向量进行分类,剔除垃圾信息;(5)利用X‑means算法对剔除垃圾信息后的文本特征向量聚类,输出文本聚类结果。本发明很好地对文本数据进行话题检测,话题检测对舆情分析、新闻热门话题追踪、热门话题检测、突发话题检测以及事件检测等应用场景具有重要意义。

    一种基于动态阈值的时间序列数据序列模式挖掘方法

    公开(公告)号:CN110609857B

    公开(公告)日:2021-03-05

    申请号:CN201910811085.4

    申请日:2019-08-30

    Abstract: 本发明属于数据处理技术领域,涉及一种序列模式的挖掘方法。该方法包括:利用时间窗口对原始序列进行划分,形成时间序列集;扫描时间序列集,获取一项式集合;根据频繁一项式定义采用动态阈值对一项式进行筛选,将非频繁的项从序列集中删除,得到频繁一项式集;从频繁一项式集中的第一项开始以所述的第一项为前缀构造后缀,对后缀进行频繁多项式的挖掘,满足频繁多项式定义的项为频繁项,当后缀为空时,挖掘结束;遍历频繁一项式集合,迭代进行上一步操作,直到频繁一项式集合被遍历完成,得到频繁项集合。本发明的方法,在识别频繁一项式时,采用了动态变化的支持度阈值;不仅对不同序列之间频繁出现的模式进行挖掘,也挖掘一个序列内部频繁出现的模式。

    一种面向流网络的角色划分系统及其工作方法、介质

    公开(公告)号:CN112163848A

    公开(公告)日:2021-01-01

    申请号:CN202010995079.1

    申请日:2020-09-21

    Abstract: 本发明涉及一种角色划分系统及其工作方法、介质,包括数据采集模块、有向加权网络获取模块、嵌入模块及聚类模块;数据采集模块用于获取转账数据;有向加权网络获取模块用于将转账数据表示成有向加权网络;嵌入模块用于首先为每一个节点抽取两张无向子图,然后采用GraphWave算法结构性嵌入,最后整合结构性嵌入和节点的出入流量差得到节点嵌入;聚类模块用改进的自组织映射神经网络对上一步得到的节点嵌入进行聚类,得到节点的角色划分。本发明能快速地发现一个经济组织的角色组成,结合经验找到可能是高级成员的角色。

    一种基于图卷积网络的异常账户检测方法

    公开(公告)号:CN111882446A

    公开(公告)日:2020-11-03

    申请号:CN202010738675.1

    申请日:2020-07-28

    Abstract: 本发明涉及一种基于图卷积网络的异常账户检测方法,属于网络安全技术领域,通过对账户交易数据进行预处理,得到真正需要的有效数据。然后对交易数据按照一定标准进行聚类,得到高中低三种不同的消费能力人群,根据消费情况对人员分组来识别账户异常情况。分组处理后,构建金融网络,采用GCN对异常账户进行分类。分类处理后,得到异常账户和正常账户,应用KNN对异常账户进行识别,找到与该异常账户异常情况最为相似的现有异常账户,通过比对进行风险分析,确定异常情况和异常原因。能够快速、准确的识别出拥有异常交易行为的账户,并为之匹配异常行为最为相似的现有样本,帮助工作人员锁定目标,迅速判断账户风险。

    一种基于协议栈的暴破攻击识别方法和装置

    公开(公告)号:CN111654499A

    公开(公告)日:2020-09-11

    申请号:CN202010495022.5

    申请日:2020-06-03

    Abstract: 本发明涉及一种基于协议栈的暴破攻击识别方法和装置,识别方法,包括:获取发送来的数据包中会话信息和时间戳;更新会话时间戳map,新数据包时间戳入队;根据该会话队列信息识别暴破;二次更新会话时间戳map,最旧数据包时间戳出队;更新系统日志。本发明有效地为工控生产企业进行实时流量监测,防护机制灵活。本发明实现了暴破攻击指标的自定义功能,用户只需修改配置文件中的协议列表、时间间隔和最高建流次数即可定义暴破攻击的满足条件。此外,还可以根据不同的环境和需求设置工作模式,实现高精度和高性能识别模式的相互转换。

    一种基于金融时间序列特征的异常交易识别方法,设备及可读存储介质

    公开(公告)号:CN109165950A

    公开(公告)日:2019-01-08

    申请号:CN201810909752.8

    申请日:2018-08-10

    Abstract: 本发明提供一种基于金融时间序列特征的异常交易识别方法,设备及可读存储介质,能够利用疑似异常或与某些确定异常账号相关的大量待检测金融交易流水信息数据,通过神经网络模型自适应提取金融时间序列特征,然后基于神经网络中线性层和softmax层的运算进行待检测交易账号是否为传销账号的分类识别。本发明提出的异常金融交易识别方法能够基于SoftSeq2Seq-Attention神经网络模型自适应提取金融时间序列特征,一定程度上减少了劳动密集型特征工程的投入。利用较单一类型的金融交易流水数据和较少的特征,能够取得很好的异常金融账号检测识别效果。

Patent Agency Ranking