-
公开(公告)号:CN113806528A
公开(公告)日:2021-12-17
申请号:CN202110769245.0
申请日:2021-07-07
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及一种基于BERT模型的话题检测方法与装置、设备及存储介质,包括步:(1)使用BERT模型对原始数据中的文本进行编码,将可变长度文本转换为固定长度的文本特征向量;(2)对文本特征向量依次进行归一化、卷积、池化处理,得到文本特征向量;(3)计算文本特征向量之间的相似度,对相似的文本特征向量去重;(4)使用文本特征向量分类器对文本特征向量进行分类,剔除垃圾信息;(5)利用X‑means算法对剔除垃圾信息后的文本特征向量聚类,输出文本聚类结果。本发明很好地对文本数据进行话题检测,话题检测对舆情分析、新闻热门话题追踪、热门话题检测、突发话题检测以及事件检测等应用场景具有重要意义。
-
公开(公告)号:CN112860898A
公开(公告)日:2021-05-28
申请号:CN202110279525.3
申请日:2021-03-16
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06F40/30
Abstract: 本发明涉及一种短文本框聚类方法、系统、设备及存储介质,该方法包括:对原始短文本进行预处理;提取短文本特征词;将短文本特征词转换为短文本特征向量;先初始化聚类中心,然后将聚类中心映射到LSH表中;再根据短文本到聚类中心的文本相似度,选择若干个候选类;根据哈希值选择短文本特征向量的簇集合;重新计算短文本特征向量的簇集合的新聚类中心;循环执行直到新聚类中心不再发生变化,输出文本聚类结果。本发明中,采用WMD‑IP距离作为文本相似度,考虑词向量的位置,这样便可更充分的利用词语的语义信息,减少中间计算过程的复杂度,提高短文本框聚类结果的精度。
-
公开(公告)号:CN112163848A
公开(公告)日:2021-01-01
申请号:CN202010995079.1
申请日:2020-09-21
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及一种角色划分系统及其工作方法、介质,包括数据采集模块、有向加权网络获取模块、嵌入模块及聚类模块;数据采集模块用于获取转账数据;有向加权网络获取模块用于将转账数据表示成有向加权网络;嵌入模块用于首先为每一个节点抽取两张无向子图,然后采用GraphWave算法结构性嵌入,最后整合结构性嵌入和节点的出入流量差得到节点嵌入;聚类模块用改进的自组织映射神经网络对上一步得到的节点嵌入进行聚类,得到节点的角色划分。本发明能快速地发现一个经济组织的角色组成,结合经验找到可能是高级成员的角色。
-
公开(公告)号:CN111882446A
公开(公告)日:2020-11-03
申请号:CN202010738675.1
申请日:2020-07-28
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
Abstract: 本发明涉及一种基于图卷积网络的异常账户检测方法,属于网络安全技术领域,通过对账户交易数据进行预处理,得到真正需要的有效数据。然后对交易数据按照一定标准进行聚类,得到高中低三种不同的消费能力人群,根据消费情况对人员分组来识别账户异常情况。分组处理后,构建金融网络,采用GCN对异常账户进行分类。分类处理后,得到异常账户和正常账户,应用KNN对异常账户进行识别,找到与该异常账户异常情况最为相似的现有异常账户,通过比对进行风险分析,确定异常情况和异常原因。能够快速、准确的识别出拥有异常交易行为的账户,并为之匹配异常行为最为相似的现有样本,帮助工作人员锁定目标,迅速判断账户风险。
-
公开(公告)号:CN111797177A
公开(公告)日:2020-10-20
申请号:CN202010638794.X
申请日:2020-07-06
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F16/28 , G06F16/2458 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种用于异常金融账号检测的金融时间序列分类方法及应用,该方法能够从异常金融账户和正常金融账户的交易流水数据中构建并扩充金融账户的金融时间序列数据集,使用堆叠多个Block(其中每个Block中包含LocalBiLSTM、Self-Attention、残差连接、Layer Normalization、Position-wise Feed-Forward Networks)的神经网络模型从金融时间序列中同时提取序列的局部和全局模式特征,最后使用softmax分类层进行金融时间序列的分类,最终实现对异常金融账号的检测功能。
-
公开(公告)号:CN111654499A
公开(公告)日:2020-09-11
申请号:CN202010495022.5
申请日:2020-06-03
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: H04L29/06
Abstract: 本发明涉及一种基于协议栈的暴破攻击识别方法和装置,识别方法,包括:获取发送来的数据包中会话信息和时间戳;更新会话时间戳map,新数据包时间戳入队;根据该会话队列信息识别暴破;二次更新会话时间戳map,最旧数据包时间戳出队;更新系统日志。本发明有效地为工控生产企业进行实时流量监测,防护机制灵活。本发明实现了暴破攻击指标的自定义功能,用户只需修改配置文件中的协议列表、时间间隔和最高建流次数即可定义暴破攻击的满足条件。此外,还可以根据不同的环境和需求设置工作模式,实现高精度和高性能识别模式的相互转换。
-
公开(公告)号:CN111652233A
公开(公告)日:2020-09-11
申请号:CN202010495757.8
申请日:2020-06-03
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06K9/34 , G06K9/40 , G06N3/04 , G06F16/951
Abstract: 本发明涉及一种针对复杂背景的文本验证码自动识别方法,包括:验证码去噪模块通过循环生成式对抗网络去除真实验证码的复杂安全特征;字符分割模块使用图像处理算法将整体验证码图片分割为单个字符;分割后的字符送入文本识别网络得到最终输出。本发明提出的文本验证码自动识别方法可以快速有效的识别带有背景噪声、字符扭曲、边缘模糊的文本类型验证码,具有高度泛化性和可移植性,可以简单的嵌入到爬虫算法中,解决数据获取过程中遇到的验证码问题。
-
公开(公告)号:CN110377354B
公开(公告)日:2020-09-01
申请号:CN201910482536.4
申请日:2019-06-04
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
Abstract: 本发明属于软件应用技术领域,涉及软件操作序列的生成方法。一种软件操作序列自动生成方法,包括以下步骤:获取软件的动作集和状态集;输入动作集、状态集和初始策略作为初始要素,采用强化学习法自动生成软件操作序列。本发明的软件操作序列自动生成方法,可以实现软件各种操作行为的自学习,针对软件的不同功能,学习生成相应的操作序列,学习完毕后,得出每个状态下可进行的动作序列的最优值,以完成指定软件的功能。
-
公开(公告)号:CN110351251B
公开(公告)日:2020-09-01
申请号:CN201910534090.5
申请日:2019-06-20
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: H04L29/06 , G06F16/9035
Abstract: 本发明属于电通讯技术领域,涉及一种工控设备资产探测方法。一种基于过滤技术的工控设备资产探测方法,包括:首先使用Shodan过滤出目标网段中未被识别为工控设备的IP;对所述IP使用主动探测进行扫描,将主动探测的结果存入数据库,此时数据库中就是所需要的探测结果。本发明提出的基于过滤技术的工控资产设备探测方法,能够对目标网段中的工控设备进行较为全面的探测,为资产探测过程提供了新思路。
-
公开(公告)号:CN107786554B
公开(公告)日:2019-08-02
申请号:CN201710997699.7
申请日:2017-10-24
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
Abstract: 本发明涉及一种自动检测IPsec协议中间人攻击的方法与装置,包括步骤如下:(1)在IPsec建立安全隧道时,在客户端或服务器端获取各数据报的发送、返回时间;(2)计算相邻两个数据报之间的时间间隔;(3)计算相邻两个数据报之间的时间间隔的方差;(4)比较方差与设置阈值的大小,如果方差大于设置阈值,则发出中间人攻击警报,提醒工作人员进行处理;否则,则认为是正常连接;本发明提出的自动检测IPsec中间人攻击的方法和装置,可以在IKE协商阶段就对IPsec流量是否遭受中间人攻击进行识别,以便工作人员尽早发现,及时处理。
-
-
-
-
-
-
-
-
-