-
公开(公告)号:CN118733767A
公开(公告)日:2024-10-01
申请号:CN202410745742.0
申请日:2024-06-11
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F16/33 , G06F16/335 , G06F40/216 , G06F40/284 , G06F18/214
Abstract: 本发明提出一种基于可解释扰动策略的中文法律对抗文本生成方法,属于对抗文本生成技术领域。包括:对法律文本进行法律知识提取;基于法律知识为文本中每个词语的重要性进行打分并排序;为待添加扰动的文本选择需要执行的扰动策略;执行扰动策略生成法律对抗文本。本发明解决了现有技术中存在缺少面向法律罪名分类任务的对抗文本生成方法的技术问题。本发明首先提取每类罪名的主要特征作为先验知识,然后将先验知识与强化相似标签和弱化原标签两种扰动策略结合,通过强化与原标签相似的标签的独有特征或弱化原标签自身的独有特征来生成对抗文本,这使得对抗文本的生成过程具有可解释性。
-
公开(公告)号:CN118585779A
公开(公告)日:2024-09-03
申请号:CN202410688597.7
申请日:2024-05-30
Applicant: 哈尔滨工业大学 , 安天科技集团股份有限公司
IPC: G06F18/21 , G06F18/214 , G06F40/284 , G06F40/242 , G06F40/247
Abstract: 本发明提出基于ORS面向软标签输出深度学习模型鲁棒性评估方法,属于鲁棒性评估技术领域。包括生成对抗文本,并使用对抗文本攻击目标模型,基于ORS计算目标模型的鲁棒性分数,评估鲁棒性。对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。利用文本对应的真值标签上的置信度计算重要性分数,若重要性分数大于0,则说明文本中的词语对真值标签有正向影响,即词语为文本中重要词语,反之词语为文本中非重要词语;为输出为软标签的目标模型的鲁棒性评估提供了一种可行的解决方案,解决了当前鲁棒性评估方法中评价指标不全面的问题,并量化了输出为软标签的深度学习模型的鲁棒性评估标准。
-
公开(公告)号:CN117436449B
公开(公告)日:2024-07-09
申请号:CN202311442418.3
申请日:2023-11-01
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F16/35 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/047 , G06N3/084 , G06N3/092
Abstract: 一种基于多源域适应和强化学习的众包命名实体识别模型及系统,属于众包命名实体识别技术领域。本发明为了解现有的使用域适应模型解决众包问题的方法往往没有充分考虑标注者的可靠性导致低质量标注者的数据对模型训练产生负面影响、以及现有众包命名实体识别方法在处理低质量标注者提交的极低质量数据时存在困难等问题。通过考虑标注者可靠性生成合成的专家表示,并采用基于强化学习的实例选择器丢弃低质量的标注,从而提高命名实体识别模型在众包数据集上的性能,本发明加深了对众包命名实体识别领域适应方法中标注者可靠性的理解,提出了一种基于强化学习的数据预处理实例选择器,并展示了其在解决众包标注中的命名实体识别挑战方面的有效性。本发明用于在无监督众包数据中高效地提取命名实体信息。
-
公开(公告)号:CN118070774A
公开(公告)日:2024-05-24
申请号:CN202410353286.5
申请日:2024-03-26
Applicant: 哈尔滨工业大学
IPC: G06F40/194 , G06F40/242 , G06F40/216
Abstract: 一种基于目标信息识别的用户生成内容立场检测方法及系统,涉及社交网络数据处理技术领域。本发明为了解决现有的用户生成内容立场检测或识别方法需要花费大量人工成本去标注目标信息,并且仅有的类似方法在目标识别阶段往往需要大规模数据对模型进行训练或微调,导致样本数据质量会直接影响目标识别的性能和准确率的问题。技术要点:首先从给定社交媒体文本中抽取出具有代表性的关键词;然后通过余弦相似度计算关键词与目标集合中特定目标之间的相似度,并根据相似度将确定文本所针对的目标对象;最后基于识别出的目标对象,采用多任务BERTweet模型来检测文本与该目标对象之间的立场关系。本发明所提出的基于目标信息识别的用户生成内容立场检测方法可有效减少人工成本,从而提高了立场检测方法在实际应用中的可行性和实用性。
-
公开(公告)号:CN117436449A
公开(公告)日:2024-01-23
申请号:CN202311442418.3
申请日:2023-11-01
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F16/35 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/047 , G06N3/084 , G06N3/092
Abstract: 一种基于多源域适应和强化学习的众包命名实体识别模型及系统,属于众包命名实体识别技术领域。本发明为了解现有的使用域适应模型解决众包问题的方法往往没有充分考虑标注者的可靠性导致低质量标注者的数据对模型训练产生负面影响、以及现有众包命名实体识别方法在处理低质量标注者提交的极低质量数据时存在困难等问题。通过考虑标注者可靠性生成合成的专家表示,并采用基于强化学习的实例选择器丢弃低质量的标注,从而提高命名实体识别模型在众包数据集上的性能,本发明加深了对众包命名实体识别领域适应方法中标注者可靠性的理解,提出了一种基于强化学习的数据预处理实例选择器,并展示了其在解决众包标注中的命名实体识别挑战方面的有效性。本发明用于在无监督众包数据中高效地提取命名实体信息。
-
公开(公告)号:CN113779567B
公开(公告)日:2022-09-13
申请号:CN202111061684.2
申请日:2021-09-10
Applicant: 哈尔滨工业大学
Abstract: 本发明提出一种面向DPI多核的缓存丢失攻击的防御方法、计算机及存储介质,属于智能防御技术领域。建立多核的算法攻击防御框架,将所有业务线程逻辑上划分为常规线程和攻击线程。流量经负载调度模块分发给常规线程,常规线程运行常用模式匹配算法进行模式匹配。当攻击检测模块检测到缓存攻击时,将攻击流下发给负载调度模块,其将攻击后续流转移到攻击线程处理。常规线程和攻击线程的数量可以根据CPU的压力情况进行自动切换,同时,将自己的线程变更后的类型反馈给负载调度模块,在负载调度模块对反馈确认前,将线程间已经收到的报文进行交换,避免报文的丢失。解决现有技术存在的DPI系统受到攻击时,处理严重延迟或丢包的技术问题。
-
公开(公告)号:CN115022079A
公开(公告)日:2022-09-06
申请号:CN202210795166.1
申请日:2022-07-07
Applicant: 奇安信科技集团股份有限公司 , 哈尔滨工业大学
IPC: H04L9/40 , H04L41/069
Abstract: 本申请提供了一种攻击数据处理方法、装置、电子设备和计算机存储设备,其中,该方法包括:根据获得的多条警报数据,确定出该多条警报数据中的各条警报数据之间的相关度;根据该各条警报数据之间的相关度,确定出警报关系网;根据该警报关系网,确定出攻击数据。可以实现对各类警报数据之间的关联,分析出攻击情况。
-
公开(公告)号:CN114844840A
公开(公告)日:2022-08-02
申请号:CN202210450541.9
申请日:2022-04-26
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 刘立坤 , 史建焘 , 叶麟 , 张晓慧 , 葛蒙蒙 , 苗钧重 , 刘凡 , 韦贤葵 , 李精卫 , 石开宇 , 王久金 , 冯帅 , 赵跃 , 宋赟祖 , 郭明昊 , 车佳臻
IPC: H04L47/2441 , G06N3/04 , G06N3/08
Abstract: 一种基于计算似然比的分布外网络流量数据检测方法,属于网络流量数据检测领域。为提高网络流量数据识别的精准度和置信度的问题。本发明提取网络流量特征:原始流量为pcap包,根据五元组划分为不同的数据流,设置为提取数据包长度序列、计算包到达时间间隔序列,将以上序列保存并生成CSV文件,作为模型训练的原始训练数据;使用原始训练数据训练原始分类模型,采用深度学习算法长短期记忆网络进行原始分类模型的训练,得到原始训练数据训练出的模型,生成扰动数据,采用加入高斯白噪声的方法生成扰动数据,训练扰动模型,得到扰动数据训练出的模型,计算似然比,判断分布外数据。本发明网络流量数据识别的精准度和置信度高。
-
公开(公告)号:CN114785575A
公开(公告)日:2022-07-22
申请号:CN202210363284.5
申请日:2022-04-07
Applicant: 哈尔滨工业大学 , 中国电子科技集团公司第五十四研究所
Abstract: 本发明提出一种安全网关及其创建方法、用户访问内部服务的方法、电子设备及存储介质,属于访问控制技术领域。包括隐身网关、统一认证中心和应用网关;所述隐身网关用于检测客户端的硬件设备特征合法性;所述统一认证中心用于验证用户身份,确定用户访问的系统;所述应用网关用于为用户提供服务;通过对防火墙动态添加和删除规则,实现对客户的动态授权,在默认情况下不信任任何人员和设备,对用户的每一次访问请求进行评估,只有当用户的信息符合所配置的安全策略时才可对指定用户开放访问权限,实现了边界的动态授权,解决了现有技术中存在的防火墙的边界安全防护能力不足的技术问题。
-
公开(公告)号:CN108563491B
公开(公告)日:2022-03-29
申请号:CN201810344939.8
申请日:2018-04-17
Applicant: 哈尔滨工业大学 , 国家计算机网络与信息安全管理中心
IPC: G06F9/455
Abstract: 本发明提供一种基于虚拟机的自省自动化管理、配置与自省方法包括1)根据操作系统的操作进程的调用执行过程,筛选出需复用的系统调用从而形成傀儡系统调用,所述傀儡系统调用由目标虚拟机执行;所述目标虚拟机包括控制模块、数据交换模块以及系统调用控制模块;2)注入目标虚拟机系统调用3)保护虚拟机系统调用执行,4)隔离虚拟机内存,包括:从目标虚拟机外部跟踪目标虚拟机的VCPU调度和操作目标虚拟机内存;本方法能更加加大加强安全性,目标虚拟机执行的傀儡系统调用代码取自安全的内核镜像,复用的傀儡系统不需要依赖目标虚拟机的内核完整性。
-
-
-
-
-
-
-
-
-