-
公开(公告)号:CN106802888A
公开(公告)日:2017-06-06
申请号:CN201710023520.8
申请日:2017-01-12
Applicant: 北京航空航天大学
Abstract: 本发明提供一种词向量训练方法和装置,其中词向量训练方法包括:获取新增词汇库,新增词汇库中的词汇与旧词汇库中的词汇构成新词汇库,旧词汇库中的词汇对应有旧词向量;对新词汇库中的词汇进行初始化处理,使得新词汇库中属于旧词汇库中的词汇的词向量为旧词向量,新词汇库中属于新增词汇库中的词汇词向量为随机词向量;根据旧词汇库对应的噪声分布和新词汇库对应的噪声分布分别对新词汇库中词汇的词向量进行更新。本发明提供的词向量训练方法和装置,减少了训练词向量时的计算量。
-
公开(公告)号:CN106802888B
公开(公告)日:2020-01-24
申请号:CN201710023520.8
申请日:2017-01-12
Applicant: 北京航空航天大学
IPC: G06F40/284 , G06F16/31
Abstract: 本发明提供一种词向量训练方法和装置,其中词向量训练方法包括:获取新增词汇库,新增词汇库中的词汇与旧词汇库中的词汇构成新词汇库,旧词汇库中的词汇对应有旧词向量;对新词汇库中的词汇进行初始化处理,使得新词汇库中属于旧词汇库中的词汇的词向量为旧词向量,新词汇库中属于新增词汇库中的词汇词向量为随机词向量;根据旧词汇库对应的噪声分布和新词汇库对应的噪声分布分别对新词汇库中词汇的词向量进行更新。本发明提供的词向量训练方法和装置,减少了训练词向量时的计算量。
-
公开(公告)号:CN107391598A
公开(公告)日:2017-11-24
申请号:CN201710522318.X
申请日:2017-06-30
Applicant: 北京航空航天大学
IPC: G06F17/30
Abstract: 本发明公开了一种威胁情报自动生成方法及系统,所述方法包括:获取与工业控制系统安全相关联的数据,所述数据至少包括第一类数据、第二类数据、第三类数据;针对所述第一类数据,对所述数据进行情报处理统计,并基于统计结果进行实体及关系的抽取;将抽取出来的内容存储至图数据库中;针对所述第二类数据,对所述数据进行实体识别,并基于识别结果进行关系抽取;将抽取出来的内容存储至图数据库中;针对所述第三类数据,对所述数据进行情报处理统计,并将统计结果存储至情报数据库中;利用第一类算法对所述图数据库中存储的内容进行分析,以及利用第二类算法对所述情报数据库中存储的内容进行分析,基于分析结果生成威胁情报。
-
公开(公告)号:CN107360145B
公开(公告)日:2020-12-25
申请号:CN201710521614.8
申请日:2017-06-30
Applicant: 北京航空航天大学
Abstract: 本发明公开了一种多节点蜜罐系统及其数据分析方法,所述多节点蜜罐系统包括多个单节点蜜罐系统,所述多个单节点蜜罐系统互联形成网络拓扑结构;所述方法包括:获取各个单节点蜜罐系统的原始数据;利用主成分分析法对所述原始数据进行特征筛选,得到中间数据;对所述中间数据进行聚类分析以及监督学习,得到多个簇,其中,每个簇包括多个实例;在各个所述簇内针对恶意攻击命令进行关联规则提取;将提取出的关联规则作为攻击特征存储至特征标注集中。
-
公开(公告)号:CN107391598B
公开(公告)日:2021-01-26
申请号:CN201710522318.X
申请日:2017-06-30
Applicant: 北京航空航天大学
IPC: G06F16/34 , G06F16/901
Abstract: 本发明公开了一种威胁情报自动生成方法及系统,所述方法包括:获取与工业控制系统安全相关联的数据,所述数据至少包括第一类数据、第二类数据、第三类数据;针对所述第一类数据,对所述数据进行情报处理统计,并基于统计结果进行实体及关系的抽取;将抽取出来的内容存储至图数据库中;针对所述第二类数据,对所述数据进行实体识别,并基于识别结果进行关系抽取;将抽取出来的内容存储至图数据库中;针对所述第三类数据,对所述数据进行情报处理统计,并将统计结果存储至情报数据库中;利用第一类算法对所述图数据库中存储的内容进行分析,以及利用第二类算法对所述情报数据库中存储的内容进行分析,基于分析结果生成威胁情报。
-
公开(公告)号:CN106897265B
公开(公告)日:2020-07-10
申请号:CN201710022458.0
申请日:2017-01-12
Applicant: 北京航空航天大学
IPC: G06F40/284 , G06F40/242 , G06F16/23
Abstract: 本发明提供一种词向量训练方法及装置,属于机器学习技术领域。该词向量训练方法包括:获取新增词汇库,新增词汇库中的词汇与旧词汇库中的词汇构成新词汇库,旧词汇库中的词汇对应有旧词向量;对新词汇库中的词汇进行初始化处理,使得新词汇库中属于旧词汇库中的词汇的词向量为旧词向量,新词汇库中属于新增词汇库中的词汇词向量为随机词向量;根据新词汇库对应的第一哈夫曼树和旧词汇库对应的第二哈夫曼树分别对新词汇库中词汇的词向量进行更新。本发明提供的词向量训练方法及装置,提高了词向量的训练效率。
-
公开(公告)号:CN107391613A
公开(公告)日:2017-11-24
申请号:CN201710538752.7
申请日:2017-07-04
Applicant: 北京航空航天大学
Abstract: 本发明公开了一种工业安全主题多文档自动消歧方法及装置,所述方法包括:创建具有多种维度的DAG主题结构图,所述DAG主题结构图中的全部主题形成主题集合;获取输入的关键词,并采集与所述关键词相关的多个文档,所述多个文档形成文档集合;为所述文档集合中的各个文档标注相应的标签;将所述DAG主题结构图和标注标签后的文档集合,输入多子模函数中,并对所述多子模函数进行优化;根据优化结果,确定出目标主题子集,所述目标主题子集为所述主题集合的子集;基于所述DAG主题结构图,确定与各个文档的标签相关联的主题;针对所述目标主题子集中的各个主题,将与所述主题相关联的文档分为一组。
-
公开(公告)号:CN106897265A
公开(公告)日:2017-06-27
申请号:CN201710022458.0
申请日:2017-01-12
Applicant: 北京航空航天大学
Abstract: 本发明提供一种词向量训练方法及装置,属于机器学习技术领域。该词向量训练方法包括:获取新增词汇库,新增词汇库中的词汇与旧词汇库中的词汇构成新词汇库,旧词汇库中的词汇对应有旧词向量;对新词汇库中的词汇进行初始化处理,使得新词汇库中属于旧词汇库中的词汇的词向量为旧词向量,新词汇库中属于新增词汇库中的词汇词向量为随机词向量;根据新词汇库对应的第一哈夫曼树和旧词汇库对应的第二哈夫曼树分别对新词汇库中词汇的词向量进行更新。本发明提供的词向量训练方法及装置,提高了词向量的训练效率。
-
公开(公告)号:CN107391613B
公开(公告)日:2020-09-11
申请号:CN201710538752.7
申请日:2017-07-04
Applicant: 北京航空航天大学
Abstract: 本发明公开了一种工业安全主题多文档自动消歧方法及装置,所述方法包括:创建具有多种维度的DAG主题结构图,所述DAG主题结构图中的全部主题形成主题集合;获取输入的关键词,并采集与所述关键词相关的多个文档,所述多个文档形成文档集合;为所述文档集合中的各个文档标注相应的标签;将所述DAG主题结构图和标注标签后的文档集合,输入多子模函数中,并对所述多子模函数进行优化;根据优化结果,确定出目标主题子集,所述目标主题子集为所述主题集合的子集;基于所述DAG主题结构图,确定与各个文档的标签相关联的主题;针对所述目标主题子集中的各个主题,将与所述主题相关联的文档分为一组。
-
公开(公告)号:CN107391597B
公开(公告)日:2020-08-07
申请号:CN201710522317.5
申请日:2017-06-30
Applicant: 北京航空航天大学
IPC: G06F16/953 , G06F16/35
Abstract: 本发明公开了一种多元数据采集方法及系统,所述方法包括:对网络进行IP扫描,获取多个IP地址以及与所述IP地址相应的文本信息;通过文本分类器对获取到的所述文本信息进行分类,并基于分类结果确定出与工控安全相关的IP地址,其中,所述与工控安全相关的IP地址包括:数据源的IP地址、工控系统的IP地址;将所述与工控安全相关的IP地址存储至网站库中,并基于所述网站库中的所述数据源的IP地址,通过多源爬虫对与各个IP地址对应的网站进行数据爬取;对爬取到的数据进行结构化处理,并将结构化处理后的数据存储至数据库中。
-
-
-
-
-
-
-
-
-