-
公开(公告)号:CN111858649A
公开(公告)日:2020-10-30
申请号:CN202010779077.9
申请日:2020-08-05
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F16/245 , G06F16/25 , G06F16/28 , G06K9/62
Abstract: 本发明涉及一种基于本体映射的异构数据融合方法,属于数据处理技术领域,通过数据库系统情况,构建元数据字典,进一步得出局部本体模型,然后对局部模式下本体和全局本体进行相似度计算,得到相似度,根据相似度判断出融合情况,将数据进行映射,实现异构数据融合。本发明通过先建立元数据字典的形式将数据字段进行标准化,然后利用图卷积网络自动学习计算出相似度,省去了数学计算的所带来的误差,准确率更高,最后通过制定的映射规则进行字段映射,避免了低效率的人工筛选,精准映射,数据融合匹配度更高。
-
公开(公告)号:CN109101494A
公开(公告)日:2018-12-28
申请号:CN201810909436.0
申请日:2018-08-10
Applicant: 哈尔滨工业大学(威海)
IPC: G06F17/27
Abstract: 本发明提供一种用于中文句子语义相似度计算的方法,设备以及计算机可读存储介质,对字级别词向量进行预训练;基于句子语义相似度训练集表示句子向量;提取手工特征;基于TCN的神经网络计算,输出句子之间的语义相似度结果。对中文句子不进行分词处理,构建字级别的词向量,用时间卷积网络分别对两个句子进行时间卷积操作提取特征向量,结合手工提取的特征,然后将两个句子的特征向量和手工特征拼接起来,最后计算出两个句子语义相似度。可以很好地避免分词结果的误差传播,也解决了lstm训练速度慢、cnn只有局部特征的问题,可以很好地完成中文句子语义相似度的计算。
-
公开(公告)号:CN104142985A
公开(公告)日:2014-11-12
申请号:CN201410352349.1
申请日:2014-07-23
Applicant: 哈尔滨工业大学(威海)
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明公开了一种半自动化的垂直爬虫生成工具及方法,该半自动化的垂直爬虫生成方法包括:用户可以选择新建或采用lex-yacc技术打开模板,对模板文件进行词法与语法分析,维护符号表,构造出语法分析树;通过寻找词法与语法分析的规律,以及对整个分析过程中数据的存储与处理,根据模板内容构造出树形模板结构;根据要抽取的内容,在树形模板结构中增加、修改或删除模板节点,节点信息中包含跳转关系、XPath表达式、数据存储方式内容;保存模板;该半自动化的垂直爬虫生成工具包括:爬虫自动生成工具模块、爬虫模块。本发明由自动生成模板内容代替人工手动配置模板,使配置模板变得更加方便快捷,可以大大节省相关人员的工作量。
-
公开(公告)号:CN115061434B
公开(公告)日:2024-09-06
申请号:CN202210615137.2
申请日:2022-06-01
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G05B19/418
Abstract: 一种面向大规模工控场景的攻击路径并行规划系统及方法,其包括场景信息建模模块、攻击图生成及可视化模块、攻击图更新模块;场景信息建模模块用于获取拓扑信息和漏洞信息并进行编译;攻击图生成及可视化模块用于获取攻击路径生成攻击图并以图形展示;攻击图更新模块用于检测设备更新,并针对更新规划路径,将规划路径与攻击路径合并形成攻击图,其解决了现有针对攻击图生成方法领域依赖问题,以及针对工控场景改变时,攻击图需重新生成的问题,可广泛应用于大数据处理领域。
-
公开(公告)号:CN116827641A
公开(公告)日:2023-09-29
申请号:CN202310797491.6
申请日:2023-06-30
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: H04L9/40 , H04L12/40 , G06N3/0464 , G06N3/08
Abstract: 本申请提供了一种车载CAN总线异常流量检测溯源方法及系统,其解决了现有的车载网异常检测方法无法实现异常ECU溯源的技术问题;包括:获取CAN总线流量数据并处理生成节点特征矩阵、特征邻接矩阵和CAN ID与发送源ECU的映射表;将节点特征矩阵、特征邻接矩阵输入图卷积网络GCN进行学习训练;根据训练好的图卷积网络GCN和CAN ID与发送源ECU的映射表,对异常ECU进行溯源。本申请广泛应用于车载网异常检测技术领域。
-
公开(公告)号:CN116318825A
公开(公告)日:2023-06-23
申请号:CN202310031347.1
申请日:2023-01-10
Applicant: 哈尔滨工业大学(威海) , 东风畅行科技股份有限公司
Abstract: 本申请涉及车联网安全技术领域,具体为一种轻量级车载T‑BOX网络入侵检测探针,包括态势感知模块、日志管理模块、日志上报模块和配置管理模块,态势感知模块首先读入配置管理模块攻击检测相关配置,然后捕获T‑Box数据总线上的网络流量,态势感知模块检测网络流量中的可能的攻击行为,并将检测结果输送至日志管理模块。本申请支持DDoS攻击、恶意端口扫描等数十种网络入侵行为检测,检测灵活高效,占用计算和存储资源少;软件环境依赖少,交叉编译部署较为简单,为资源受限的硬件平台提供网络安全态势感知服务,进而为车辆联网、车联网智能化提供网络安全保障,应用前景十分广泛。
-
公开(公告)号:CN111882446B
公开(公告)日:2023-05-16
申请号:CN202010738675.1
申请日:2020-07-28
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06Q40/08 , G06N3/0464 , G06F18/214 , G06F18/2413 , G06F18/23
Abstract: 本发明涉及一种基于图卷积网络的异常账户检测方法,属于网络安全技术领域,通过对账户交易数据进行预处理,得到真正需要的有效数据。然后对交易数据按照一定标准进行聚类,得到高中低三种不同的消费能力人群,根据消费情况对人员分组来识别账户异常情况。分组处理后,构建金融网络,采用GCN对异常账户进行分类。分类处理后,得到异常账户和正常账户,应用KNN对异常账户进行识别,找到与该异常账户异常情况最为相似的现有异常账户,通过比对进行风险分析,确定异常情况和异常原因。能够快速、准确的识别出拥有异常交易行为的账户,并为之匹配异常行为最为相似的现有样本,帮助工作人员锁定目标,迅速判断账户风险。
-
公开(公告)号:CN116009844A
公开(公告)日:2023-04-25
申请号:CN202310031337.8
申请日:2023-01-10
Applicant: 哈尔滨工业大学(威海) , 东风畅行科技股份有限公司
IPC: G06F8/34 , G06F8/38 , G06F3/0486
Abstract: 本申请属于车联网数据分析系统技术领域,具体是一种支持可视化拖拽进行车联网数据融合分析的产学研一体化平台,包括节点管理模块、数据流构建模块、程序运行连接模块和开发者社区模块。本申请的一体化平台能够将学术研究、教学平台与产业应用集成在一起,实现产学研一体化,对于业务人员来说,解决了业务人员在使用数据分析系统时难以定制化算法行为和难以复用已有组件的问题;对于科学研究人员来说,解决了研究人员将所研发的算法难以实际落地到业务系统中的问题;对于教师与学生来说,解决了运行环境不匹配、算法逻辑难以直观展示的问题。
-
公开(公告)号:CN111858649B
公开(公告)日:2022-06-17
申请号:CN202010779077.9
申请日:2020-08-05
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F16/245 , G06F16/25 , G06F16/28 , G06K9/62
Abstract: 本发明涉及一种基于本体映射的异构数据融合方法,属于数据处理技术领域,通过数据库系统情况,构建元数据字典,进一步得出局部本体模型,然后对局部模式下本体和全局本体进行相似度计算,得到相似度,根据相似度判断出融合情况,将数据进行映射,实现异构数据融合。本发明通过先建立元数据字典的形式将数据字段进行标准化,然后利用图卷积网络自动学习计算出相似度,省去了数学计算的所带来的误差,准确率更高,最后通过制定的映射规则进行字段映射,避免了低效率的人工筛选,精准映射,数据融合匹配度更高。
-
公开(公告)号:CN112860898B
公开(公告)日:2022-05-27
申请号:CN202110279525.3
申请日:2021-03-16
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06F40/30
Abstract: 本发明涉及一种短文本框聚类方法、系统、设备及存储介质,该方法包括:对原始短文本进行预处理;提取短文本特征词;将短文本特征词转换为短文本特征向量;先初始化聚类中心,然后将聚类中心映射到LSH表中;再根据短文本到聚类中心的文本相似度,选择若干个候选类;根据哈希值选择短文本特征向量的簇集合;重新计算短文本特征向量的簇集合的新聚类中心;循环执行直到新聚类中心不再发生变化,输出文本聚类结果。本发明中,采用WMD‑IP距离作为文本相似度,考虑词向量的位置,这样便可更充分的利用词语的语义信息,减少中间计算过程的复杂度,提高短文本框聚类结果的精度。
-
-
-
-
-
-
-
-
-