-
公开(公告)号:CN112084451A
公开(公告)日:2020-12-15
申请号:CN202010972271.9
申请日:2020-09-16
Applicant: 哈尔滨工业大学
IPC: G06F16/958 , G06F40/14 , G06K9/00
Abstract: 本发明是一种基于视觉分块的网页LOGO提取系统及方法,属于计算机网络领域,尤其涉及网页LOGO提取及视觉识别分析技术,目的是为解决网页视觉识别分析不稳定,准确率不高,实际应用效果不好等问题;本发明包括页面数据提取模块、分隔符探测模块和页面布局重构模块各模块之间呈递进逻辑连接,通过页面数据提取模块用于所需特征量的提取;分隔符探测模块负责分隔符的添加以及规则化分割;页面布局重构模块用于将页面内容重新布局重构,使得网页视觉识别率得到提高,该方法提取更为健壮的视觉特征,有更好的鲁棒性,同时具有更高的准确度。
-
公开(公告)号:CN118349866A
公开(公告)日:2024-07-16
申请号:CN202410449202.8
申请日:2024-04-15
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 郭一澄 , 刘立坤 , 胡智超 , 史建焘 , 葛蒙蒙 , 苗钧重 , 郭明昊 , 高展鹏 , 王钲皓 , 张森 , 陈东鑫 , 程明明 , 张垚 , 张靖宇 , 李岱林 , 傅言晨 , 周杰
IPC: G06F18/23213 , H04L9/40 , H04L61/4511
Abstract: 本发明公开了一种移动应用SNI信息大规模细粒度分类算法,属于网络安全技术领域。解决了现有技术中传统的域名分类方法难以在大规模的SNI结果中剔除无效SNI信息并提取相关特征SNI的问题;本发明基于统计特征对SNI提取结果中确定为无效信息的二级域名进行删除,根据得到的初筛无效二级域名在APP出现的次数,基于预设的阈值条件对特征字符串去重,得到第一次去重结果并采用K‑Means聚类对其去重两次,得到第三次去重结果;遍历第三次去重结果中的重复的SNI数据,对不相似APP的二级域名的SNI去重,对所得结果数据清洗,得到最终特征SNI结果。本发明有效提取了APP的特征SNI,可以应用于加密流量特征识别。
-
公开(公告)号:CN114372267B
公开(公告)日:2024-05-28
申请号:CN202111340418.3
申请日:2021-11-12
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
Inventor: 余翔湛 , 刘立坤 , 陈巍 , 史建焘 , 葛蒙蒙 , 叶麟 , 于喜东 , 王永强 , 冯帅 , 赵跃 , 王久金 , 宋赟祖 , 郭明昊 , 胡智超 , 苗钧重 , 刘凡 , 李精卫 , 石开宇 , 韦贤葵 , 孔德文 , 羿天阳 , 刘奉哲 , 李竑杰
IPC: G06F21/56 , G06F16/955 , G06F16/951 , G06F16/9535 , G06F40/284 , G06F40/216
Abstract: 本发明提出一种基于静态域的恶意网页识别检测方法、计算机及存储介质,属于网页识别检测技术领域。包括步骤一、实时监听网页流量,提取HTTP头部的URL地址;步骤二、将URL地址与黑名单库中存储的URL地址进行匹配;步骤三、解析匹配失败的网页流量;步骤四、爬取解析后的网页流量中的JS、CSS文件;步骤五、提取目标网页的网页指纹;步骤六、识别网页流量;步骤七、比较两个网页的URL地址;若URL地址相同,说明流量中的网页为正常网页,保存匹配日志;若URL地址不同,说明流量中的网页为恶意网页,进行阻断。解决不能适用于实际应用中实时检测的需要的技术问题。实现了降低网页匹配过程的时间成本的技术效果。
-
公开(公告)号:CN115022049B
公开(公告)日:2024-05-14
申请号:CN202210634083.4
申请日:2022-06-06
Applicant: 哈尔滨工业大学
Inventor: 刘立坤 , 余翔湛 , 史建焘 , 车佳臻 , 张晓慧 , 葛蒙蒙 , 苗钧重 , 刘凡 , 李精卫 , 韦贤葵 , 石开宇 , 郭明昊 , 冯帅 , 赵跃 , 宋赟祖 , 王久金
IPC: H04L9/40 , H04L41/142 , H04L41/16 , G06F18/22 , G06F18/241 , G06F18/2415 , G06N3/0464 , G06N3/047 , G06N3/084
Abstract: 本发明提出一种基于计算马氏距离的分布外网络流量数据检测方法,属于数据检测技术领域。包括以下步骤:S1.原始网络流量的预处理和分类模型的预训练;S2.在预训练分类模型的基础上,获取新样本X与已知类别中最相似类别;S3.计算新样本x与最相似类别实例的马氏距离;S4.设定分布外数据阈值,分布外数据阈值采用实验的方式确定,对原网络流量数据加入小量的扰动数据,计算原网络流量数据与处理后的数据的马氏距离作为阈值的值。判断是否属于分布外数据。本发明提高了分类器分类结果的置信度。解决现有技术中存在基于计算相似度的检测方法的计算距离不具有唯一性导致的置信度低的技术问题。
-
公开(公告)号:CN117827512A
公开(公告)日:2024-04-05
申请号:CN202311814864.2
申请日:2023-12-27
Applicant: 哈尔滨工业大学
Inventor: 胡智超 , 余翔湛 , 刘立坤 , 史建焘 , 葛蒙蒙 , 苗钧重 , 郭明昊 , 陈东鑫 , 高展鹏 , 郭一澄 , 王钲皓 , 程明明 , 张森 , 李岱林 , 张垚 , 张靖宇 , 傅言晨 , 周杰 , 牟铎
IPC: G06F11/07
Abstract: 本发明公开了一种快速可溯源的多维异常事件根因分析算法,属于数据分析技术领域。解决了现有技术中传统的异常根因分析算法准确率低且兼容性差的问题;本发明通过异常检测筛选出与异常相关的事件,对与异常相关的事件进行初始化并整合为异常相关事件集合;对异常相关事件集合进行聚合约束,根据事件的聚合约束以及关联关系建立了完整的事件聚合图作为统一的事件描述框架;在完整的事件聚合图上搜索定位根因异常事件,通过异常传播与溯源、搜索根因候选节点和根因剪枝,得到最终的根因异常集合。本发明有效地提高了多维异常事件根因分析算法的准确率和兼容性,适用于基础指标和派生指标,可以应用于多维异常事件的快速可溯源根因分析。
-
公开(公告)号:CN117806865A
公开(公告)日:2024-04-02
申请号:CN202311814861.9
申请日:2023-12-27
Applicant: 哈尔滨工业大学
Inventor: 胡智超 , 余翔湛 , 刘立坤 , 史建焘 , 葛蒙蒙 , 苗钧重 , 郭明昊 , 高展鹏 , 陈东鑫 , 王钲皓 , 郭一澄 , 张森 , 程明明 , 张垚 , 李岱林 , 傅言晨 , 张靖宇 , 牟铎 , 周杰
IPC: G06F11/07 , G06F18/2413 , G06F18/2415
Abstract: 本发明公开了一种基于K近邻高斯混合模型的在线异常检测算法,属于在线异常检测技术领域。解决了现有技术中传统的流式数据在线异常检测算法存在的依赖训练数据以及不易区分异常数据和分布偏移的问题;本发明在高斯混合模型的基础上采用了K近邻的方法进行优化,将数据点的更新范围限制在局部,设计了动态维护高斯成分的机制,根据新增数据的K近邻和高斯成分的生命周期,动态的新增和删除高斯成分,有效的支持了异常点的检测和分布偏移的自适应,异常检测通过搜索查找到多个高斯成分构成最优决策集对上下文观测数据完成异常评价。本发明有效降低了异常点对全局的影响,消除了对全量样本数据的依赖,可以应用于流式数据在线异常检测。
-
公开(公告)号:CN116743473B
公开(公告)日:2024-02-06
申请号:CN202310783622.5
申请日:2023-06-29
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 刘立坤 , 王久金 , 史建焘 , 胡智超 , 葛蒙蒙 , 羿天阳 , 龚家兴 , 李竑杰 , 刘奉哲 , 孔德文 , 程明明 , 郭一澄 , 张森 , 高展鹏 , 王钲皓
IPC: H04L9/40
Abstract: 本发明提出一种基于并行度量学习的入侵检测方法,属于入侵检测技术领域。一种基于并行度量学习的入侵检测方法由嵌入模块、度量模块和分类器组成模型;嵌入模块用于接收五元组数据,度量模块用于获得预测相似度,分类器用于获取预测类别;具体实现过程:S1.训练模型;S2.将网络流量输入模型中,模型输出识别结果,若网络流量为非入侵流量,输出结果为0,否则,输出结果为1。解决现有技术中模型的识别效率低实时性差的技术问题;本发明只需利用嵌入模块对网络流量进行特征提取,再将所提取的特征输入分类器中,即可获得最终的识别结果,无需再和支持集中的样本一一比较,可大幅提升识别效率和识别准确率。
-
公开(公告)号:CN116776248A
公开(公告)日:2023-09-19
申请号:CN202310746661.8
申请日:2023-06-21
Applicant: 哈尔滨工业大学
Inventor: 胡智超 , 余翔湛 , 冯帅 , 刘立坤 , 史建焘 , 葛蒙蒙 , 孔德文 , 羿天阳 , 龚家兴 , 李竑杰 , 刘奉哲 , 王钲皓 , 郭一澄 , 张森 , 程明明 , 高展鹏
IPC: G06F18/2415 , G06F18/213 , G06F18/214
Abstract: 本发明提出一种基于虚拟对数的分布外检测方法,属于分布外检测技术领域。包括:S1.对流量进行特征提取,作为样本特征;S2.将样本特征输入到分类模型中,输出模型原始输出;S3.对样本特征进行特征分解;S4.令虚拟对数等于样本特征在主空间上的特征残差,加入到模型原始输出;S5.结合模型原始输出计算softmax函数值,将输入的多维向量的每一维映射到(0,1)区间的值,值的累积和为1;将虚拟对数所在维度对应的函数值,作为样本的分布外得分;S6.设置分布外阈值,判断输入样本是否为分布外样本。解决依赖单一输入源,检测精确度不高的问题。兼顾样本原始特征又利用深度学习模型学习到的知识,不需要重新训练模型。
-
公开(公告)号:CN112084451B
公开(公告)日:2022-09-30
申请号:CN202010972271.9
申请日:2020-09-16
Applicant: 哈尔滨工业大学
IPC: G06F16/958 , G06F40/14 , G06V30/412 , G06V30/414
Abstract: 本发明是一种基于视觉分块的网页LOGO提取系统及方法,属于计算机网络领域,尤其涉及网页LOGO提取及视觉识别分析技术,目的是为解决网页视觉识别分析不稳定,准确率不高,实际应用效果不好等问题;本发明包括页面数据提取模块、分隔符探测模块和页面布局重构模块各模块之间呈递进逻辑连接,通过页面数据提取模块用于所需特征量的提取;分隔符探测模块负责分隔符的添加以及规则化分割;页面布局重构模块用于将页面内容重新布局重构,使得网页视觉识别率得到提高,该方法提取更为健壮的视觉特征,有更好的鲁棒性,同时具有更高的准确度。
-
公开(公告)号:CN114679606A
公开(公告)日:2022-06-28
申请号:CN202210354186.5
申请日:2022-04-02
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 刘立坤 , 史建焘 , 李精卫 , 葛蒙蒙 , 张晓慧 , 苗钧重 , 刘凡 , 韦贤葵 , 石开宇 , 王久金 , 冯帅 , 赵跃 , 宋赟祖 , 郭明昊 , 车佳臻
IPC: H04N21/234 , H04N21/44 , G06K9/62
Abstract: 本发明提出一种基于Burst特征的视频流量识别方法、系统、电子设备及存储介质,属于日志异常检测技术领域。包括以下步骤:步骤一、捕获视频流量,对视频流量进行预处理;步骤二、获取经过预处理视频流量的Burst特征和Burst序列对应的时序特征;步骤三、将Burst特征和时序特征提取后的数据作为单个视频的指纹,对数据进行分类从而识别视频流量。本发明主要针对于基于DASH协议构建的视频平台传输的视频流进行视频识别,通过每个视频独有的Burst特征进行二次特征提取,分析Brst序列中的时序特征。并创建LightGBM模型对单个视频的时序特征进行识别。解决了无法细粒度的对视频流量进行识别的技术问题。
-
-
-
-
-
-
-
-
-