-
公开(公告)号:CN119204011B
公开(公告)日:2025-05-23
申请号:CN202411190945.4
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06F16/35 , G06N3/0455 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种基于预训练模型的网络安全命名实体识别数据增广方法,属于网络数据安全技术领域。解决了现有技术中传统的网络安全命名实体识别数据增广方法易导致识别文本语义错误的问题;本发明给定标注集合和输入序列,根据标注规则生成标注序列,对输入序列进行分句处理;对输入序列的文本片段的长度进行替换,得到片段集合;根据标注集合,对片段集合进行掩码操作,得到新片段集合,利用BERT模型对新片段集合进行预测,得到增广后的数据集;使用BERT模型计算得到连续概率并搜索相邻句子概率矩阵打乱句子顺序,得到最终增广后的数据集。本发明有效提升了所生成增广数据的质量,减少了过拟合现象,可以应用于数据增广。
-
公开(公告)号:CN119892690A
公开(公告)日:2025-04-25
申请号:CN202510034953.8
申请日:2025-01-09
Applicant: 哈尔滨工业大学
IPC: H04L43/0823 , H04L9/32
Abstract: 一种基于DNSKEY平滑变更的权威服务器异常变更检测方法和系统,属于DNS安全领域。本发明基于DNSKEY不会随着域名的权威服务器变更而直接更新的规则,使用受信的DS记录验证DNSKEY,从而检验域名权威服务器变更的真实性,准确识别权威服务器异常变更。构建了基于DNSKEY平滑变更的权威服务器异常变更检测系统,能够对域名进行定时检测,准确识别域名权威服务器的异常变更,避免了域名在受到恶意篡改后对互联网用户产生不良影响。
-
公开(公告)号:CN118734846B
公开(公告)日:2025-01-14
申请号:CN202410745744.X
申请日:2024-06-11
Applicant: 哈尔滨工业大学
IPC: G06F40/284 , G06F40/216 , G06F16/3332 , G06F16/334 , G06F16/335 , G06F16/35 , G06Q50/18 , G06N5/022
Abstract: 本发明提出一种法律文本知识提取方法,属于法律文本知识提取技术领域。包括:对待提取文本进行分词操作,将每个类别中的所有文档聚合成一个长文本,过滤法律停用词,生成每个类别关键词集合;搜索每个类别中与原类别共有关键词最多的相似类别加入关键词集合中;筛选每个类别和其相似类别中的独有关键词和共有关键词加入关键词集合中,以及筛选独有关键词和共有关键词中的偏置词加入关键词集合中。为了解决缺少法律领域的知识提取法方法的问题,本发明分别给出了基于人工干涉的知识提取方案以及无需人工干涉的自动化知识提取方案,对准确性和效率需求不同的场景提供个性化解决方案。
-
公开(公告)号:CN119167935A
公开(公告)日:2024-12-20
申请号:CN202411190954.3
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/211 , G06F16/33 , G06N3/0442 , G06N3/08
Abstract: 基于提示学习思想的网络安全命名实体识别模型构建方法、电子设备及存储介质,属于网络安全命名实体识别技术领域。为解决提取信息在面对具体的网络安全实体识别任务时直接应用的问题,本发明采集网络安全数据,得到网络空间安全数据序列,基于标注规则设置标注集合、生成标注序列,所述标注规则包括被标注数据的实体类型及被标注数据不属于任何实体;基于标注规则,对网络空间安全数据序列进行分割处理,然后对应生成标注子序列,得到处理后的网络空间安全数据;定义数据增广规则,对处理后的网络空间安全数据进行数据增广,得到数据增广的网络空间安全数据集;对预训练模型中进行继续预训练和微调操作,得到网络安全命名实体识别数据提取模型。
-
公开(公告)号:CN118916739A
公开(公告)日:2024-11-08
申请号:CN202410944911.3
申请日:2024-07-15
Applicant: 哈尔滨工业大学
IPC: G06F18/24 , G06F18/25 , G06F18/214 , G06F18/10 , G06F16/9536 , G06Q50/00 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及了一种基于编解码结构的用户生成内容目标立场联合检测方法及系统,涉及社交媒体的立场检测。本发明解决了立场检测任务的人工依赖问题,又消除了错误级联现象。技术要点:将预处理后的社交媒体文本数据输入编码器,编码器由序列编码器和经过微调的情感编码器构成,对查询向量之间使用自注意力机制,动态计算每个查询向量与其他查询向量的关联程度,从而更好地捕捉不同查询向量之间的依赖关系;然后,将编码器输出的序列特征输入解码器中,与查询向量做交叉注意力机制;将所有融合了序列特征的查询向量输入目标‑立场聚合层;将聚合后的查询向量与编码器输出的情感特征输入目标立场对解码层,首先通过注意力机制为查询向量与情感特征赋值权重,之后将两种特征进行拼接,得到最终的特征向量;将最终特征表示输入由两个全连接神经网络组成的解码器中以输出目标以及立场的预测结果。本发明应用于社交网络分析中。
-
公开(公告)号:CN116775127B
公开(公告)日:2024-05-28
申请号:CN202310598471.6
申请日:2023-05-25
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于RetroWrite框架的静态符号执行插桩方法,属于计算机技术领域。解决了现有技术中符号执行插桩方法在闭源程序运行时开销较大的问题;本发明包括以下步骤:S1.访问闭源的C/C++程序中的各个用户自定义函数;S2.访问函数中的各个基本块;S3.顺序访问指令;S4.进行指令级插桩,为赋值、调用、运算和条件类指令进行功能插桩;S5.进行基本块插桩,在基本块的出口进行辅助插桩;S6.进行函数级插桩,在函数的入口和出口进行辅助插桩。本发明面向闭源程序通用高效,有效降低了运行时非求解开销,在扩展使用范围的同时,提高了混合模糊测试的速度,可以应用于软件测试。
-
公开(公告)号:CN117879968A
公开(公告)日:2024-04-12
申请号:CN202410163731.1
申请日:2024-02-05
Applicant: 哈尔滨工业大学
Abstract: 本发明提出一种多维度工业网络行为异常检测方法,属于网络行为检测技术领域。包括:S1.建构多视图关联分析的行为分析模型;S2.建构多维跨域共享学习模型,以工控网络多维度视图及共享节点嵌入作为输入,以新的共享节点嵌入作为输出;S3.建构单域特定学习模型,使模型在多个维度上对异常进行评估和检测;S4.在多个维度上进行单视图特定学习,强化学习各维度上的嵌入信息,并根据各维度嵌入特征重建预测行为值,根据预测行为与实际行为的偏差计算各维度上的异常得分;S5.设置异常得分阈值,当异常得分在异常得分阈值内,进行异常告警。解决缺乏多维度识别和理解网络行为、处理高维数据的效率差的问题。
-
公开(公告)号:CN114158049B
公开(公告)日:2024-03-26
申请号:CN202111528957.X
申请日:2021-12-14
Applicant: 哈尔滨工业大学 , 安天科技集团股份有限公司
Abstract: 本发明提出一种蓝牙通信的身份识别方法、系统、计算机及存储介质,属于蓝牙通信的身份识别技术领域。面对蓝牙主设备向从设备发出的大量的流量,通过流量分析区分操作流量、操作白噪声以及伴随白噪声的平滑操作的数据流量,提取操作白噪声以及与白噪声相连的平滑操作的时钟抖动数据流量并分别进行组合;对组合后的两类时钟抖动数据流量分别进行傅里叶变换,得到数据长度相等且原始特征不变的时钟抖动数据。利用核主成分分析将时钟抖动数据流量投影到二维平面,进行特征深入挖掘,实现对蓝牙通信用户精细特征挖掘和个人识别。解决现有技术中存在的用户画像所需时间长、难度大、效率低的技术问题。
-
公开(公告)号:CN110866245B
公开(公告)日:2023-11-07
申请号:CN201911106259.3
申请日:2019-11-13
Applicant: 哈尔滨工业大学 , 电子科技大学广东电子信息工程研究院
Abstract: 本发明属于计算机安全的技术领域,具体涉及一种维护虚拟机文件安全的检测方法,包括运行虚拟机的文件驱动,对虚拟机的磁盘进行记录,提取虚拟机中的新增文件或修改文件,对新增文件或修改文件进行安全检测。本发明对新增文件和修改文件检测的安全性强,有效地提高了文件轮询检测的效率。此外,本发明还提供了一种维护虚拟机文件安全的检测系统。
-
公开(公告)号:CN113656073B
公开(公告)日:2022-09-27
申请号:CN202110947992.9
申请日:2021-08-18
Applicant: 哈尔滨工业大学
Abstract: 本发明提出一种大模式集下基于并行调度模式重组方法、计算机及存储介质,属于人工智能技术领域具体包括,首先,对模式集划分为模式子集,选取最优划分模式子集作为结果;其次,利用优化的遗传退火算法将模式子集调度到多核中;再其次,对模式子集进行评估,判断是否需要对运行时间长的子集进行二次重组,最后,根据评估结果,对不满足评估条件的模式子集进行模式重组。本发明能够适应长度分布不同的多种模式集特征,细粒度地对模式集划分、调度、评估与重组。解决现有技术中存在的检测预定义模式集运行时间长的技术问题。实现了检测预定义模式集运行时间短的效果。
-
-
-
-
-
-
-
-
-