-
公开(公告)号:CN117806865B
公开(公告)日:2024-06-18
申请号:CN202311814861.9
申请日:2023-12-27
Applicant: 哈尔滨工业大学
Inventor: 胡智超 , 余翔湛 , 刘立坤 , 史建焘 , 葛蒙蒙 , 苗钧重 , 郭明昊 , 高展鹏 , 陈东鑫 , 王钲皓 , 郭一澄 , 张森 , 程明明 , 张垚 , 李岱林 , 傅言晨 , 张靖宇 , 牟铎 , 周杰
IPC: G06F11/07 , G06F18/2413 , G06F18/2415
Abstract: 本发明公开了一种基于K近邻高斯混合模型的在线异常检测算法,属于在线异常检测技术领域。解决了现有技术中传统的流式数据在线异常检测算法存在的依赖训练数据以及不易区分异常数据和分布偏移的问题;本发明在高斯混合模型的基础上采用了K近邻的方法进行优化,将数据点的更新范围限制在局部,设计了动态维护高斯成分的机制,根据新增数据的K近邻和高斯成分的生命周期,动态的新增和删除高斯成分,有效的支持了异常点的检测和分布偏移的自适应,异常检测通过搜索查找到多个高斯成分构成最优决策集对上下文观测数据完成异常评价。本发明有效降低了异常点对全局的影响,消除了对全量样本数据的依赖,可以应用于流式数据在线异常检测。
-
公开(公告)号:CN115022049A
公开(公告)日:2022-09-06
申请号:CN202210634083.4
申请日:2022-06-06
Applicant: 哈尔滨工业大学
Inventor: 刘立坤 , 余翔湛 , 史建焘 , 车佳臻 , 张晓慧 , 葛蒙蒙 , 苗钧重 , 刘凡 , 李精卫 , 韦贤葵 , 石开宇 , 郭明昊 , 冯帅 , 赵跃 , 宋赟祖 , 王久金
Abstract: 本发明提出一种基于计算马氏距离的分布外网络流量数据检测方法,属于数据检测技术领域。包括以下步骤:S1.原始网络流量的预处理和分类模型的预训练;S2.在预训练分类模型的基础上,获取新样本X与已知类别中最相似类别;S3.计算新样本x与最相似类别实例的马氏距离;S4.设定分布外数据阈值,分布外数据阈值采用实验的方式确定,对原网络流量数据加入小量的扰动数据,计算原网络流量数据与处理后的数据的马氏距离作为阈值的值。判断是否属于分布外数据。本发明提高了分类器分类结果的置信度。解决现有技术中存在基于计算相似度的检测方法的计算距离不具有唯一性导致的置信度低的技术问题。
-
公开(公告)号:CN114844840A
公开(公告)日:2022-08-02
申请号:CN202210450541.9
申请日:2022-04-26
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 刘立坤 , 史建焘 , 叶麟 , 张晓慧 , 葛蒙蒙 , 苗钧重 , 刘凡 , 韦贤葵 , 李精卫 , 石开宇 , 王久金 , 冯帅 , 赵跃 , 宋赟祖 , 郭明昊 , 车佳臻
IPC: H04L47/2441 , G06N3/04 , G06N3/08
Abstract: 一种基于计算似然比的分布外网络流量数据检测方法,属于网络流量数据检测领域。为提高网络流量数据识别的精准度和置信度的问题。本发明提取网络流量特征:原始流量为pcap包,根据五元组划分为不同的数据流,设置为提取数据包长度序列、计算包到达时间间隔序列,将以上序列保存并生成CSV文件,作为模型训练的原始训练数据;使用原始训练数据训练原始分类模型,采用深度学习算法长短期记忆网络进行原始分类模型的训练,得到原始训练数据训练出的模型,生成扰动数据,采用加入高斯白噪声的方法生成扰动数据,训练扰动模型,得到扰动数据训练出的模型,计算似然比,判断分布外数据。本发明网络流量数据识别的精准度和置信度高。
-
公开(公告)号:CN114969598B
公开(公告)日:2025-03-18
申请号:CN202210470323.1
申请日:2022-04-28
Applicant: 哈尔滨工业大学
Inventor: 刘立坤 , 余翔湛 , 史建焘 , 叶麟 , 葛蒙蒙 , 张晓慧 , 苗钧重 , 刘凡 , 李精卫 , 石开宇 , 韦贤葵 , 王久金 , 冯帅 , 赵跃 , 宋赟祖 , 郭明昊 , 车佳臻
IPC: G06F16/958 , G06F9/445
Abstract: 本发明提出涉及基于隐藏插件CSS泄漏的浏览器指纹防御方法、电子设备及存储介质,属于浏览器指纹防御技术领域。包括以下步骤:S1.收集提炼插件的CSS,并保存在本地;S2.控制隐藏或显示的安装插件向网页引入的CSS,所述安装插件向网页引入的CSS包括layout无关属性的隐藏和layout相关属性的隐藏。S3.完成随机化插件。本发明不仅能够隐藏我们真实的安装插件信息,还能够抵御浏览器指纹识别,保护用户的隐私信息,通过随机化安装的插件,主动抵御网站收集插件作为指纹信息;解决现有技术中存在的防御指纹方法灵活性不高、性能差和防御性不强的技术问题。
-
公开(公告)号:CN118349866B
公开(公告)日:2025-02-14
申请号:CN202410449202.8
申请日:2024-04-15
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 郭一澄 , 刘立坤 , 胡智超 , 史建焘 , 葛蒙蒙 , 苗钧重 , 郭明昊 , 高展鹏 , 王钲皓 , 张森 , 陈东鑫 , 程明明 , 张垚 , 张靖宇 , 李岱林 , 傅言晨 , 周杰
IPC: G06F18/23213 , H04L9/40 , H04L61/4511
Abstract: 本发明公开了一种移动应用SNI信息大规模细粒度分类算法,属于网络安全技术领域。解决了现有技术中传统的域名分类方法难以在大规模的SNI结果中剔除无效SNI信息并提取相关特征SNI的问题;本发明基于统计特征对SNI提取结果中确定为无效信息的二级域名进行删除,根据得到的初筛无效二级域名在APP出现的次数,基于预设的阈值条件对特征字符串去重,得到第一次去重结果并采用K‑Means聚类对其去重两次,得到第三次去重结果;遍历第三次去重结果中的重复的SNI数据,对不相似APP的二级域名的SNI去重,对所得结果数据清洗,得到最终特征SNI结果。本发明有效提取了APP的特征SNI,可以应用于加密流量特征识别。
-
公开(公告)号:CN118410483A
公开(公告)日:2024-07-30
申请号:CN202410498504.4
申请日:2024-04-24
Applicant: 哈尔滨工业大学
Inventor: 刘立坤 , 郭一澄 , 余翔湛 , 胡智超 , 史建焘 , 郭明昊 , 葛蒙蒙 , 苗钧重 , 程明明 , 张森 , 陈东鑫 , 王钲皓 , 高展鹏 , 周杰 , 傅言晨 , 李岱林 , 张靖宇 , 张垚
Abstract: 本发明公开了一种基于启发式动态分析的移动应用网络信息提取方法,属于网络信息安全技术领域。解决了现有技术中传统的动态网络分析方法和静态网络分析方法难以实现全面地对APP提取有效网络特征信息的问题;本发明通过逆向待分析应用的apk文件获取程序源码,遍历所得逆向结果中同网络信息相关的关键位置,提取输出静态启发信息及静态网络特征数据;基于随机动作点击和控件坐标生成原始流量,并通过基于代理的方法实现常用协议流量实时解密,对明密文流量中相关协议特征参数进行提取获得动态网络特征数据,对静态网络字符串变量结果和动态网络分析结果进行清洗,输出最终结果。本发明有效提升了流量生成和分析的效率,可以应用于APP测试。
-
公开(公告)号:CN114372267A
公开(公告)日:2022-04-19
申请号:CN202111340418.3
申请日:2021-11-12
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
Inventor: 余翔湛 , 刘立坤 , 陈巍 , 史建焘 , 葛蒙蒙 , 叶麟 , 于喜东 , 王永强 , 冯帅 , 赵跃 , 王久金 , 宋赟祖 , 郭明昊 , 胡智超 , 苗钧重 , 刘凡 , 李精卫 , 石开宇 , 韦贤葵 , 孔德文 , 羿天阳 , 刘奉哲 , 李竑杰
IPC: G06F21/56 , G06F16/955 , G06F16/951 , G06F16/9535 , G06F40/284 , G06F40/216
Abstract: 本发明提出一种基于静态域的恶意网页识别检测方法、计算机及存储介质,属于网页识别检测技术领域。包括步骤一、实时监听网页流量,提取HTTP头部的URL地址;步骤二、将URL地址与黑名单库中存储的URL地址进行匹配;步骤三、解析匹配失败的网页流量;步骤四、爬取解析后的网页流量中的JS、CSS文件;步骤五、提取目标网页的网页指纹;步骤六、识别网页流量;步骤七、比较两个网页的URL地址;若URL地址相同,说明流量中的网页为正常网页,保存匹配日志;若URL地址不同,说明流量中的网页为恶意网页,进行阻断。解决不能适用于实际应用中实时检测的需要的技术问题。实现了降低网页匹配过程的时间成本的技术效果。
-
公开(公告)号:CN118713900A
公开(公告)日:2024-09-27
申请号:CN202410920732.6
申请日:2024-07-10
Applicant: 哈尔滨工业大学
Inventor: 刘立坤 , 龚家兴 , 余翔湛 , 胡智超 , 史建焘 , 苗钧重 , 郭明昊 , 葛蒙蒙 , 程明明 , 张森 , 陈东鑫 , 王钲皓 , 高展鹏 , 郭一澄 , 鲁宇 , 周杰 , 傅言晨 , 李岱林 , 张靖宇 , 张垚
IPC: H04L9/40
Abstract: 本发明公开了一种基于数据包长度分布的动态低开销流量混淆方法,属于防御加密流量指纹检测技术领域。解决了现有技术中传统的流量混淆方法动态性不足且资源开销大的问题;本发明结合基于分布的数据包长度映射方法以及基于分割和堆叠的数据包修改方法,最终提出一个基于数据包长度分布的动态低开销流量混淆方法,对于一个数据包序列中的每个数据包,首先通过基于分布的数据包长度映射方法获得目标数据包长度,然后利用基于分割和堆叠的数据包修改方法将数据包修改为目标长度,最终得到混淆之后的数据包序列。本发明有效避免了对数据包修改过程中引入填充数据的操作,降低了额外的带宽开销,可以应用于在实际网络环境下混淆流量。
-
公开(公告)号:CN114844840B
公开(公告)日:2024-04-02
申请号:CN202210450541.9
申请日:2022-04-26
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 刘立坤 , 史建焘 , 叶麟 , 张晓慧 , 葛蒙蒙 , 苗钧重 , 刘凡 , 韦贤葵 , 李精卫 , 石开宇 , 王久金 , 冯帅 , 赵跃 , 宋赟祖 , 郭明昊 , 车佳臻
IPC: H04L47/2441 , G06N3/0442 , G06N3/084
Abstract: 一种基于计算似然比的分布外网络流量数据检测方法,属于网络流量数据检测领域。为提高网络流量数据识别的精准度和置信度的问题。本发明提取网络流量特征:原始流量为pcap包,根据五元组划分为不同的数据流,设置为提取数据包长度序列、计算包到达时间间隔序列,将以上序列保存并生成CSV文件,作为模型训练的原始训练数据;使用原始训练数据训练原始分类模型,采用深度学习算法长短期记忆网络进行原始分类模型的训练,得到原始训练数据训练出的模型,生成扰动数据,采用加入高斯白噪声的方法生成扰动数据,训练扰动模型,得到扰动数据训练出的模型,计算似然比,判断分布外数据。本发明网络流量数据识别的精准度和置信度高。
-
公开(公告)号:CN114969598A
公开(公告)日:2022-08-30
申请号:CN202210470323.1
申请日:2022-04-28
Applicant: 哈尔滨工业大学
Inventor: 刘立坤 , 余翔湛 , 史建焘 , 叶麟 , 葛蒙蒙 , 张晓慧 , 苗钧重 , 刘凡 , 李精卫 , 石开宇 , 韦贤葵 , 王久金 , 冯帅 , 赵跃 , 宋赟祖 , 郭明昊 , 车佳臻
IPC: G06F16/958 , G06F9/445
Abstract: 本发明提出涉及基于隐藏插件CSS泄漏的浏览器指纹防御方法、电子设备及存储介质,属于浏览器指纹防御技术领域。包括以下步骤:S1.收集提炼插件的CSS,并保存在本地;S2.控制隐藏或显示的安装插件向网页引入的CSS,所述安装插件向网页引入的CSS包括layout无关属性的隐藏和layout相关属性的隐藏。S3.完成随机化插件。本发明不仅能够隐藏我们真实的安装插件信息,还能够抵御浏览器指纹识别,保护用户的隐私信息,通过随机化安装的插件,主动抵御网站收集插件作为指纹信息;解决现有技术中存在的防御指纹方法灵活性不高、性能差和防御性不强的技术问题。
-
-
-
-
-
-
-
-
-