-
公开(公告)号:CN116204193A
公开(公告)日:2023-06-02
申请号:CN202310123840.6
申请日:2023-02-16
Applicant: 北京理工大学
IPC: G06F8/41 , G06F18/2415 , G06F18/214 , G06F18/21 , G06N3/04 , G06N3/08
Abstract: 本发明涉及强化指令执行语义的二进制函数相似性检测方法,属于网络安全技术领域。本发明首先通过IDA获取二进制函数的汇编代码基本块;其次利用Word2vec提取基本块的指令特征,同时根据执行语义表对基本块中的特定指令进行标注,并按照执行顺序生成指令执行语义表示序列;然后将指令特征及指令执行语义表示融合生成基本块嵌入,再基于基本块嵌入利用图嵌入网络生成二进制函数嵌入;最后利用孪生网络进行二进制函数相似性检测。本发明针对现有基本块嵌入生成方法未充分利用指令执行语义的问题,提出了一种基本块指令执行语义表示方法,强化指令执行语义特征,提升二进制函数相似性检测的准确率。
-
公开(公告)号:CN112199613B
公开(公告)日:2023-03-03
申请号:CN202011099728.6
申请日:2020-10-13
Applicant: 北京理工大学
IPC: G06F16/955 , G06F16/951 , G06F40/14 , G06F16/35
Abstract: 本发明涉及融合DOM拓扑和文本属性的产品URL自动定位方法,属于计算机与信息科学技术领域。本发明首先将网站转成DOM解析树结构,获取DOM解析树下各节点的文本属性并给节点添加标签属性;然后通过递归遍历DOM标签树,构建出节点带有产品标签属性的树形图,将树形图转换为包含DOM解析树拓扑结构的节点向量集w;并通过doc2vec将各节点下的文本属性转换成文本向量h;最后用学习到的融合DOM拓扑信息的节点向量、文本向量[w,h]结合标签属性,训练节点分类模型,完成URL自动定位。本发明融合DOM拓扑、文本属性,在现有方法的基础上自动学习页面的提取规则,提高方法的自适应能力,有效的解决了现有方法鲁棒性差、准确率低、工作量大的缺点,具有较高的实用价值和社会价值。
-
公开(公告)号:CN115062402A
公开(公告)日:2022-09-16
申请号:CN202210536133.5
申请日:2022-05-17
Applicant: 北京理工大学
IPC: G06F30/15 , G06F30/27 , G06F119/10
Abstract: 本发明涉及数据驱动的列车级位加速度提取方法,属于计算机与信息科学技术领域。本发明首先利用噪声与正常样本在训练过程中的不同损失变化模式,优化样本学习顺序。然后将自采样学习分别引入AdaBoost和梯度提升学习提出SSAdaBoost和SSGB稳健学习方法,建立目标列车性能估计模型,挖掘含噪运行数据中的专车性能知识,拟合加速度与速度、级位序列(隐含延时特性)、坡度等特征间的映射函数。最后利用“查询样本”控制级位序列、延时等特征影响,建立性能表,实现对目标特征与标签间量化关系抽取。弥补了现有方法推荐速度的跟踪难度大,控车级位频繁切换产生额外能耗问题。抽取性能与实际性能相似,可用于建立与受控列车匹配的性能约束,提升推荐速度优化效果。
-
公开(公告)号:CN115056829A
公开(公告)日:2022-09-16
申请号:CN202210533015.9
申请日:2022-05-16
Applicant: 北京理工大学
Abstract: 本发明涉及多车型连续学习的列车运动状态估计方法,属于计算机与人工智能技术领域。首先通过特征抽取方法确定列车运行数据的基础特征集合,针对每一特征的样本关系构建单层图结构,根据特征关联关系组合单层图为多重图;其次,基于神经气体网络学习多重图的拓扑结构,并使用多车型运行数据对拓扑结构迭代更新;然后,对多重图的层内与层间关系进行数据聚合,并根据多车型知识拓扑结构生成样本的关系编码;最后,通过非线性变换组合基础特征,并与样本的关系编码结合,用于预测列车的运动状态。本发明将单一车型运行数据与多车型知识拓扑相结合,实现在真实运行数据有限的条件下多车型运行数据的连续建模与运动状态估计。
-
公开(公告)号:CN115048527A
公开(公告)日:2022-09-13
申请号:CN202210537384.5
申请日:2022-05-17
Applicant: 北京理工大学
IPC: G06F16/36 , G06F16/901 , G06F40/295
Abstract: 本发明涉及融合动态知识和事理逻辑的列车故障分析决策方法,属于自然语言处理和机器学习领域,本发明首先提取列车故障现象描述文本中的故障事件,融合时序动态知识和事理逻辑关系构建知识图谱;然后利用结合多头注意力机制的图转换网络对知识图谱进行编码,生成知识图谱的优先级向量表示;最后用一个结合注意力机制的解码器,根据编码结果从提前构建的解决方案词表中选取关键操作序列形成解决方案。由于本发明增加了对故障事件时序动态知识和事理逻辑关系的建模,提升了针对故障现象所分析生成解决方案的有效性和准确性。
-
公开(公告)号:CN115048442A
公开(公告)日:2022-09-13
申请号:CN202210536796.7
申请日:2022-05-17
Applicant: 北京理工大学
IPC: G06F16/25 , G06F16/901 , G06F40/30 , G06N3/04
Abstract: 本发明涉及一种用于主机入侵检测的系统调用序列数据增强方法,属于计算机与网络空间安全领域。本发明首先利用少数类样本构建系统调用序列对数据库;之后将序列数据转换成图结构数据,以更好地表征系统调用之间的关系;然后使用基于多头注意力机制的图转换网络和LSTM网络分别构建图编码器和序列解码器,学习系统调用序列行为语义中包含的时序依赖关系;最后,基于系统调用时序依赖关系循环生成少数类系统调用序列样本,以实现对少数类样本的数据增强。本发明能够弥补现有系统调用数据增强方法未充分挖掘利用序列信息,导致生成序列与原序列语义不一致的问题,生成反映样本序列关系的增强样本,有效提高主机入侵检测的检测准确率。
-
公开(公告)号:CN113222775B
公开(公告)日:2022-08-05
申请号:CN202110607064.8
申请日:2021-05-28
Applicant: 北京理工大学
Abstract: 本发明涉及融合多模态信息及权重张量的用户身份关联方法,属于机器学习领域。主要为了解决目前用户身份关联方法中使用的用户信息单一,忽略其他模态信息和需要大量的标注数据的问题。本发明收集用户多模态特征信息并进行预处理,构建社交网络用户数据集;然后,使用规则匹配方法获得初始用户匹配矩阵和候选集过滤器;最后通过Transformer编码器和改进的基于权重张量分解的张量融合方法得到用户多模态特征的联合嵌入,使用Triplet Network结构迭代更新Transformer编码器权值,根据两个用户的联合嵌入表示相似性和设定的阈值判断两个用户是否匹配,输出最终用户匹配矩阵。
-
公开(公告)号:CN112231703B
公开(公告)日:2022-08-05
申请号:CN202011239328.0
申请日:2020-11-09
Applicant: 北京理工大学
Abstract: 本发明涉及一种结合API模糊处理技术的恶意软件对抗样本生成方法,属于计算机与信息科学技术领域。本发明首先向原始的API调用序列中插入无关的API向量,初步实现恶意软件特征功能的混淆;然后对样本实施函数调用重定向的混淆操作,隐藏API的函数功能;最后,把修改后的样本馈送到恶意软件分类器,检查它是否实现了错误分类,利用遗传算法解决优化问题。本发明具有更高的实用性,更符合现实需求;相比于面向黑盒的对抗样本生成方法,本发明不仅没有破坏恶意软件原始的功能,而且在欺骗恶意软件分类器时具有高成功率,极大改善了无法平衡对抗样本欺骗成功率低和恶意软件功能被破坏的问题。
-
公开(公告)号:CN114546827A
公开(公告)日:2022-05-27
申请号:CN202210039842.2
申请日:2022-01-14
Applicant: 北京理工大学
IPC: G06F11/36
Abstract: 本发明涉及二进制程序灰盒模糊测试的用例自适应生成方法,属于软件测试和漏洞挖掘领域。本发明提出一种新的用于衡量二进制编码序列差异的距离度量,用于计算已执行用例与每个候选种子的距离,旨在扩大不同长度编码序列之间的差异;同时,提出一种自适应用例执行效果的测试用例的生成方法和种子变异策略,若用例触发缺陷或新的程序执行路径,则选取与该用例距离最近的候选种子用例,并赋予该种子用例所用变异规则更高的权值,提高该规则后续被选取的可能性,否则选取距离最远的种子用例,采用原变异策略生成新用例。本发明提出一种解决软件模糊测试领域中测试用例的随机生成具有盲目性的方法,提高了用例生成的时间效率,能够发现更多软件缺陷。
-
公开(公告)号:CN112235288B
公开(公告)日:2022-05-17
申请号:CN202011089853.9
申请日:2020-10-13
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于GAN的NDN网络入侵检测方法,属于计算机与信息科学技术领域。主目的是为了解决NDN网络中,统计方法泛化能力较差以及因恶意流量类样本数据过少,导致针对CPA攻击和IFA攻击的入侵检测困难的问题。本发明首先对从NDN网络路由节点获取的统计信息,使用变分高斯混合模型进行标准化预处理;其次使用基于条件GAN的方法对特定类别的样本进行数据增强,扩充表格型数据样本中恶意样本的数量;然后使用增强后的数据集训练深度神经网络分类器;最后分类器监测经由路由的流量统计信息判别恶意入侵攻击类型。本发明对CPA、IFA攻击监测效果较好。
-
-
-
-
-
-
-
-
-