-
公开(公告)号:CN118523948A
公开(公告)日:2024-08-20
申请号:CN202410729180.0
申请日:2024-06-06
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 陈东鑫 , 葛蒙蒙 , 高展鹏 , 刘立坤 , 胡智超 , 史建焘 , 程明明 , 郭一澄 , 王钲皓 , 张森 , 傅言晨 , 牟铎 , 周杰 , 张靖宇 , 李岱林 , 张垚
IPC: H04L9/40 , H04L47/2441 , G06F18/24 , G06F18/214 , G06N3/096
Abstract: 本发明提出一种基于大语言模型的加密网络流量分类方法,属于网络安全技术领域。本发明提出了基于BERT的开源大语言模型的基础上,通过双向流级别的网络流量测信道特征文本数据(数据包长度)作为预训练数据,训练能够利用开放域未标记流量数据学习具有较强泛化能力的表示的基座模型,并在下流任务中,通过较少数量的带标签的具体分类数据,完成快速迁移学习,增强了模型的适应能力。本发明比起使用不具有可读意义的数据包载荷作为训练样本,使用了数据包长度序列作为测信道特征,够学习到加密网络流量的行为模式;本发明比起使用专家提出的有限特征,通过数据包长度即可完美刻画加密网络流量行为模式。
-
公开(公告)号:CN117827512B
公开(公告)日:2024-07-26
申请号:CN202311814864.2
申请日:2023-12-27
Applicant: 哈尔滨工业大学
Inventor: 胡智超 , 余翔湛 , 刘立坤 , 史建焘 , 葛蒙蒙 , 苗钧重 , 郭明昊 , 陈东鑫 , 高展鹏 , 郭一澄 , 王钲皓 , 程明明 , 张森 , 李岱林 , 张垚 , 张靖宇 , 傅言晨 , 周杰 , 牟铎
IPC: G06F11/07
Abstract: 本发明公开了一种快速可溯源的多维异常事件根因分析算法,属于数据分析技术领域。解决了现有技术中传统的异常根因分析算法准确率低且兼容性差的问题;本发明通过异常检测筛选出与异常相关的事件,对与异常相关的事件进行初始化并整合为异常相关事件集合;对异常相关事件集合进行聚合约束,根据事件的聚合约束以及关联关系建立了完整的事件聚合图作为统一的事件描述框架;在完整的事件聚合图上搜索定位根因异常事件,通过异常传播与溯源、搜索根因候选节点和根因剪枝,得到最终的根因异常集合。本发明有效地提高了多维异常事件根因分析算法的准确率和兼容性,适用于基础指标和派生指标,可以应用于多维异常事件的快速可溯源根因分析。
-
公开(公告)号:CN116896469B
公开(公告)日:2023-12-08
申请号:CN202310879927.6
申请日:2023-07-18
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 葛蒙蒙 , 宋赟祖 , 刘立坤 , 史建焘 , 胡智超 , 孔德文 , 羿天阳 , 龚家兴 , 李竑杰 , 刘奉哲 , 程明明 , 郭一澄 , 张森 , 高展鹏 , 王钲皓
IPC: H04L9/40
Abstract: 本发明公开了一种基于Burst序列的加密代理应用识别的方法,属于加密代理应用识别技术领域。解决了现有技术中加密代理应用识别方法过于依赖未加密数据包头部字段的问题;本发明首先对加密代理隧道下的网络流进行分割划分获得应用流量片段,随后从应用流量片段中提取出Burst时序特征向量序列用于表征应用类型间的差异信息,最后将Burst时序特征向量序列输入双向LSTM网络进行学习,构建引入注意力机制的Burst‑ATT‑BiLST模型,得到加密代理应用的分类识别结果。本发明能够有效识别加密代理应用流量,且在加密代理应用流量识别中的鲁棒性更好,更适用于识别加密代理应用流量。
-
公开(公告)号:CN116668186A
公开(公告)日:2023-08-29
申请号:CN202310879928.0
申请日:2023-07-18
Applicant: 哈尔滨工业大学
Inventor: 刘立坤 , 余翔湛 , 宋赟祖 , 史建焘 , 胡智超 , 葛蒙蒙 , 李竑杰 , 刘奉哲 , 孔德文 , 羿天阳 , 龚家兴 , 张森 , 程明明 , 高展鹏 , 王钲皓 , 郭一澄
IPC: H04L9/40
Abstract: 本发明公开了一种基于多视角特征和集成学习的加密代理协议识别的方法,属于加密代理协议识别技术领域。解决了现有技术中加密代理协议识别方法无法清晰表征完整加密代理协议网络流的问题;本发明包括以下步骤:S1.构建多视角特征提取算法提取时空相关特征、连接管理特征、流量封装特征、认证模式特征和流量混淆特征,将每个网络流提取出的一个135维特征向量的集合作为数据样本集;S2.采用SMOTE过采样算法对数据样本集插值,得到SMOTE平衡数据样本集;S3.根据SMOTE平衡数据样本集构建集成学习分类模型MvBoost,得到加密代理协议分类识别结果。本发明能够对加密代理协议进行有效识别,避免了模型因数据训练变差。
-
公开(公告)号:CN116668182A
公开(公告)日:2023-08-29
申请号:CN202310837529.8
申请日:2023-07-10
Applicant: 哈尔滨工业大学
Inventor: 葛蒙蒙 , 余翔湛 , 赵跃 , 刘立坤 , 史建焘 , 胡智超 , 刘奉哲 , 羿天阳 , 龚家兴 , 李竑杰 , 孔德文 , 高展鹏 , 程明明 , 郭一澄 , 王钲皓 , 张森
IPC: H04L9/40
Abstract: 本发明公开了一种基于多流上下文关系的加密应用行为流量检测方法,属于流量检测技术领域。解决了现有技术中加密应用行为流量检测方法在处理复杂网络环境下局限性较大的问题;本发明包括以下步骤:S1.定义多流和多流关系,构建多流结构;S2.对给定的多流结构进行多流结构匹配;具体的:S21.计算出整体多流相似度和单流相似度,得到单流匹配集合;S22.计算出给定的多流结构和给定的待匹配多流的多流相似度;S23.根据选择的阈值判断给定的多流结构和给定的待匹配多流是否匹配成功;S3.定义上下文关系,构建上下文结构;S4.对给定的待匹配多流队列进行多流队列匹配;本发明提高了行为流量检测的准确性,可以应用于流量检测。
-
公开(公告)号:CN114679606B
公开(公告)日:2023-05-09
申请号:CN202210354186.5
申请日:2022-04-02
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 刘立坤 , 史建焘 , 李精卫 , 葛蒙蒙 , 张晓慧 , 苗钧重 , 刘凡 , 韦贤葵 , 石开宇 , 王久金 , 冯帅 , 赵跃 , 宋赟祖 , 郭明昊 , 车佳臻
IPC: H04N21/234 , H04N21/44 , G06V10/764 , G06V10/774
Abstract: 本发明提出一种基于Burst特征的视频流量识别方法、系统、电子设备及存储介质,属于日志异常检测技术领域。包括以下步骤:步骤一、捕获视频流量,对视频流量进行预处理;步骤二、获取经过预处理视频流量的Burst特征和Burst序列对应的时序特征;步骤三、将Burst特征和时序特征提取后的数据作为单个视频的指纹,对数据进行分类从而识别视频流量。本发明主要针对于基于DASH协议构建的视频平台传输的视频流进行视频识别,通过每个视频独有的Burst特征进行二次特征提取,分析Brst序列中的时序特征。并创建LightGBM模型对单个视频的时序特征进行识别。解决了无法细粒度的对视频流量进行识别的技术问题。
-
公开(公告)号:CN113656073B
公开(公告)日:2022-09-27
申请号:CN202110947992.9
申请日:2021-08-18
Applicant: 哈尔滨工业大学
Abstract: 本发明提出一种大模式集下基于并行调度模式重组方法、计算机及存储介质,属于人工智能技术领域具体包括,首先,对模式集划分为模式子集,选取最优划分模式子集作为结果;其次,利用优化的遗传退火算法将模式子集调度到多核中;再其次,对模式子集进行评估,判断是否需要对运行时间长的子集进行二次重组,最后,根据评估结果,对不满足评估条件的模式子集进行模式重组。本发明能够适应长度分布不同的多种模式集特征,细粒度地对模式集划分、调度、评估与重组。解决现有技术中存在的检测预定义模式集运行时间长的技术问题。实现了检测预定义模式集运行时间短的效果。
-
公开(公告)号:CN112804251A
公开(公告)日:2021-05-14
申请号:CN202110136774.7
申请日:2021-02-01
Applicant: 哈尔滨工业大学
IPC: H04L29/06
Abstract: 一种基于userId的Android应用流量过滤方法与系统,属于网络安全技术领域。本发明包括以下步骤:步骤一、从Android设备中读取指定应用的userId;步骤二、使用iptables给指定userId打上流标签;步骤三、编写iptables规则,将带有所述流标签的userId的INPUT、OUTPUT数据包放入NFLOG消息池中,并为所述NFLOG消息池指定一个标号;步骤四、从所述NFLOG消息池中获取目标userId对应的纯净流量集。本发明解决了应用流量混杂在一个网络中导致应用网络流量无法进行准确分析的问题。
-
公开(公告)号:CN112084451A
公开(公告)日:2020-12-15
申请号:CN202010972271.9
申请日:2020-09-16
Applicant: 哈尔滨工业大学
IPC: G06F16/958 , G06F40/14 , G06K9/00
Abstract: 本发明是一种基于视觉分块的网页LOGO提取系统及方法,属于计算机网络领域,尤其涉及网页LOGO提取及视觉识别分析技术,目的是为解决网页视觉识别分析不稳定,准确率不高,实际应用效果不好等问题;本发明包括页面数据提取模块、分隔符探测模块和页面布局重构模块各模块之间呈递进逻辑连接,通过页面数据提取模块用于所需特征量的提取;分隔符探测模块负责分隔符的添加以及规则化分割;页面布局重构模块用于将页面内容重新布局重构,使得网页视觉识别率得到提高,该方法提取更为健壮的视觉特征,有更好的鲁棒性,同时具有更高的准确度。
-
公开(公告)号:CN118349866A
公开(公告)日:2024-07-16
申请号:CN202410449202.8
申请日:2024-04-15
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 郭一澄 , 刘立坤 , 胡智超 , 史建焘 , 葛蒙蒙 , 苗钧重 , 郭明昊 , 高展鹏 , 王钲皓 , 张森 , 陈东鑫 , 程明明 , 张垚 , 张靖宇 , 李岱林 , 傅言晨 , 周杰
IPC: G06F18/23213 , H04L9/40 , H04L61/4511
Abstract: 本发明公开了一种移动应用SNI信息大规模细粒度分类算法,属于网络安全技术领域。解决了现有技术中传统的域名分类方法难以在大规模的SNI结果中剔除无效SNI信息并提取相关特征SNI的问题;本发明基于统计特征对SNI提取结果中确定为无效信息的二级域名进行删除,根据得到的初筛无效二级域名在APP出现的次数,基于预设的阈值条件对特征字符串去重,得到第一次去重结果并采用K‑Means聚类对其去重两次,得到第三次去重结果;遍历第三次去重结果中的重复的SNI数据,对不相似APP的二级域名的SNI去重,对所得结果数据清洗,得到最终特征SNI结果。本发明有效提取了APP的特征SNI,可以应用于加密流量特征识别。
-
-
-
-
-
-
-
-
-