-
公开(公告)号:CN118070774A
公开(公告)日:2024-05-24
申请号:CN202410353286.5
申请日:2024-03-26
Applicant: 哈尔滨工业大学
IPC: G06F40/194 , G06F40/242 , G06F40/216
Abstract: 一种基于目标信息识别的用户生成内容立场检测方法及系统,涉及社交网络数据处理技术领域。本发明为了解决现有的用户生成内容立场检测或识别方法需要花费大量人工成本去标注目标信息,并且仅有的类似方法在目标识别阶段往往需要大规模数据对模型进行训练或微调,导致样本数据质量会直接影响目标识别的性能和准确率的问题。技术要点:首先从给定社交媒体文本中抽取出具有代表性的关键词;然后通过余弦相似度计算关键词与目标集合中特定目标之间的相似度,并根据相似度将确定文本所针对的目标对象;最后基于识别出的目标对象,采用多任务BERTweet模型来检测文本与该目标对象之间的立场关系。本发明所提出的基于目标信息识别的用户生成内容立场检测方法可有效减少人工成本,从而提高了立场检测方法在实际应用中的可行性和实用性。
-
公开(公告)号:CN117436449A
公开(公告)日:2024-01-23
申请号:CN202311442418.3
申请日:2023-11-01
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F16/35 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/047 , G06N3/084 , G06N3/092
Abstract: 一种基于多源域适应和强化学习的众包命名实体识别模型及系统,属于众包命名实体识别技术领域。本发明为了解现有的使用域适应模型解决众包问题的方法往往没有充分考虑标注者的可靠性导致低质量标注者的数据对模型训练产生负面影响、以及现有众包命名实体识别方法在处理低质量标注者提交的极低质量数据时存在困难等问题。通过考虑标注者可靠性生成合成的专家表示,并采用基于强化学习的实例选择器丢弃低质量的标注,从而提高命名实体识别模型在众包数据集上的性能,本发明加深了对众包命名实体识别领域适应方法中标注者可靠性的理解,提出了一种基于强化学习的数据预处理实例选择器,并展示了其在解决众包标注中的命名实体识别挑战方面的有效性。本发明用于在无监督众包数据中高效地提取命名实体信息。
-
公开(公告)号:CN113779567B
公开(公告)日:2022-09-13
申请号:CN202111061684.2
申请日:2021-09-10
Applicant: 哈尔滨工业大学
Abstract: 本发明提出一种面向DPI多核的缓存丢失攻击的防御方法、计算机及存储介质,属于智能防御技术领域。建立多核的算法攻击防御框架,将所有业务线程逻辑上划分为常规线程和攻击线程。流量经负载调度模块分发给常规线程,常规线程运行常用模式匹配算法进行模式匹配。当攻击检测模块检测到缓存攻击时,将攻击流下发给负载调度模块,其将攻击后续流转移到攻击线程处理。常规线程和攻击线程的数量可以根据CPU的压力情况进行自动切换,同时,将自己的线程变更后的类型反馈给负载调度模块,在负载调度模块对反馈确认前,将线程间已经收到的报文进行交换,避免报文的丢失。解决现有技术存在的DPI系统受到攻击时,处理严重延迟或丢包的技术问题。
-
公开(公告)号:CN115022079A
公开(公告)日:2022-09-06
申请号:CN202210795166.1
申请日:2022-07-07
Applicant: 奇安信科技集团股份有限公司 , 哈尔滨工业大学
IPC: H04L9/40 , H04L41/069
Abstract: 本申请提供了一种攻击数据处理方法、装置、电子设备和计算机存储设备,其中,该方法包括:根据获得的多条警报数据,确定出该多条警报数据中的各条警报数据之间的相关度;根据该各条警报数据之间的相关度,确定出警报关系网;根据该警报关系网,确定出攻击数据。可以实现对各类警报数据之间的关联,分析出攻击情况。
-
公开(公告)号:CN114844840A
公开(公告)日:2022-08-02
申请号:CN202210450541.9
申请日:2022-04-26
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 刘立坤 , 史建焘 , 叶麟 , 张晓慧 , 葛蒙蒙 , 苗钧重 , 刘凡 , 韦贤葵 , 李精卫 , 石开宇 , 王久金 , 冯帅 , 赵跃 , 宋赟祖 , 郭明昊 , 车佳臻
IPC: H04L47/2441 , G06N3/04 , G06N3/08
Abstract: 一种基于计算似然比的分布外网络流量数据检测方法,属于网络流量数据检测领域。为提高网络流量数据识别的精准度和置信度的问题。本发明提取网络流量特征:原始流量为pcap包,根据五元组划分为不同的数据流,设置为提取数据包长度序列、计算包到达时间间隔序列,将以上序列保存并生成CSV文件,作为模型训练的原始训练数据;使用原始训练数据训练原始分类模型,采用深度学习算法长短期记忆网络进行原始分类模型的训练,得到原始训练数据训练出的模型,生成扰动数据,采用加入高斯白噪声的方法生成扰动数据,训练扰动模型,得到扰动数据训练出的模型,计算似然比,判断分布外数据。本发明网络流量数据识别的精准度和置信度高。
-
公开(公告)号:CN114785575A
公开(公告)日:2022-07-22
申请号:CN202210363284.5
申请日:2022-04-07
Applicant: 哈尔滨工业大学 , 中国电子科技集团公司第五十四研究所
Abstract: 本发明提出一种安全网关及其创建方法、用户访问内部服务的方法、电子设备及存储介质,属于访问控制技术领域。包括隐身网关、统一认证中心和应用网关;所述隐身网关用于检测客户端的硬件设备特征合法性;所述统一认证中心用于验证用户身份,确定用户访问的系统;所述应用网关用于为用户提供服务;通过对防火墙动态添加和删除规则,实现对客户的动态授权,在默认情况下不信任任何人员和设备,对用户的每一次访问请求进行评估,只有当用户的信息符合所配置的安全策略时才可对指定用户开放访问权限,实现了边界的动态授权,解决了现有技术中存在的防火墙的边界安全防护能力不足的技术问题。
-
公开(公告)号:CN113760664A
公开(公告)日:2021-12-07
申请号:CN202111060878.0
申请日:2021-09-10
Applicant: 哈尔滨工业大学
Abstract: 本发明提出一种两级阈值攻击检测方法、计算机及存储介质,属于智能检测技术领域。基于I级和II级的两级阈值攻击检测方法,首先,重构模式匹配算法自动机,选择≥4层的所有节点,为每个选择的节点增加被访问次数t、I级阈值L1和II级阈值L2后执行下一步骤,其次,自动机接收待匹配数据T,将I级阈值L1阈值节点比例p1和II级阈值L2阈值节点比例p2设置为0,匹配指针指向T的首字符,执行下一步骤,最后,统计节点访问次数;判断节点访问次数是否超过I级阈值L1和II级阈值L2阈值节点比例p1和节点比例p2,访问次数超过阈值的判定为攻击。解决现有技术无法识别攻击数据DPI系统收到攻击技术问题。
-
公开(公告)号:CN113010882A
公开(公告)日:2021-06-22
申请号:CN202110292042.7
申请日:2021-03-18
Applicant: 哈尔滨工业大学
Abstract: 本发明提出了一种适用于缓存丢失攻击的自定义位置顺序模式匹配算法,涉及一种匹配算法,尤其涉及一种适用于缓存丢失攻击的自定义位置顺序模式匹配算法,通过建立自定义位置顺序的自动机,将当前扫描字符与当前状态节点进行匹配;当前扫描字符与当前状态节点边值或失败指针中的chr匹配成功,自动机沿着边或失败指针跳转到下一个节点,如果新节点为模式自定义顺序的尾节点,即自动机的叶子节点,命中模式,输出OUTPUT表中记录的模式,自动机当前状态跳转到当前节点记录的下一个节点,继续扫描匹配;自定义位置顺序匹配算法解决了模式匹配算法总是向深度扫描,因大量自动机节点不在CPU缓存内,造成缓存命中率低,系统处理性能大幅下降的问题。
-
公开(公告)号:CN112883938A
公开(公告)日:2021-06-01
申请号:CN202110379085.9
申请日:2021-04-08
Applicant: 哈尔滨工业大学
Abstract: 本发明提出了一种基于规范化张量分解的司法案例建模方法,涉及一种司法案例建模方法,尤其涉及一种基于规范化张量分解的司法案例建模方法,属于数据处理技术领域。包括以下步骤:步骤一.将司法案例进行模块分割;步骤二.将司法案例模块中的词汇过滤;步骤三.将司法案例模块矩阵化及张量生成;步骤四.将司法案例的原始张量分解为核张量,完成司法案例建模。解决了现有技术中存在的天然缺陷,不利于提高后续预测算法的准确率的技术问题,实现了无需大量的法律专业知识和人工标注工作,对数据库中词汇和语法信息的依赖性不强,能从各个层面描述司法案例,捕捉不同案例模块间的潜在关联,提高后续案例相关预测算法准确率。
-
公开(公告)号:CN104636189B
公开(公告)日:2018-03-30
申请号:CN201510087347.9
申请日:2015-02-25
Applicant: 哈尔滨工业大学
Abstract: 基于Xen的虚拟机部署系统及方法,属于虚拟机快速部署系统领域。现有的Xen虚拟机快速部署系统无法应用于大规模云环境需求,并且无法动态改变虚拟机的软件环境和IP地址的问题。本发明根据用户需求,采用JSP网页服务器、Tomcat网页服务器、MySQL数据库的组合作为前端系统的前端和管理系统,前端服务器与用户交互,并根据交互获得的用户需求的配置参数信息,采用Libvirt控制库的通信形式向负载服务器发出不同指令,前端系统选取镜像模板库中的增量镜像采用增量虚拟机的部署方式一键化部署不同操作系统、一键化部署不同应用的虚拟机;根据用户需求信息自动化配置虚拟机IP地址;基于部署的不同操作系统、部署的不同应用的虚拟机,能够让用户控制虚拟机的生命周期;还能够动态改变虚拟机的软件环境。
-
-
-
-
-
-
-
-
-