-
公开(公告)号:CN108647318A
公开(公告)日:2018-10-12
申请号:CN201810443980.0
申请日:2018-05-10
Applicant: 北京航空航天大学 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种基于多源数据的知识融合方法,在融合多个来源的实体数据时,首先分别对每个数据源的属性进行规范化表示,其中包括了同义属性映射和对属性值的数值单位的统一转换,这样对属性的规范化处理可以减少对后续实体比较造成的影响;然后基于实体名和实体属性对实体进行分块聚合,这样仅将同一分块内不同来源的实体作为候选匹配实体对,避免了将两个数据源中所有的实体两两间比较,减少计算复杂度;最后将同一分块内不同来源的实体作为候选实体对,采用实体对齐算法计算实体间的相似度,将匹配得到不同来源中描述同一客观世界的实体对,建立不同数据源之间同一实体的等价链接,并进行实体属性的合并,而对于一个数据源中独有的实体,可以直接添加到知识库中。
-
公开(公告)号:CN107515889A
公开(公告)日:2017-12-26
申请号:CN201710531249.9
申请日:2017-07-03
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F17/30867 , H04L51/16 , H04L51/32
Abstract: 本发明公开了一种微博话题实时监测方法与系统。该方法包括:获取预定时间段内预定话题对应的全部微博数据;统计全部微博数据中预定特征信息的数量;确定预定特征信息的数量在预定特征信息对应的预定高斯分布模型中所处的数量区间范围;根据预定特征信息的数量在其对应的预定高斯分布模型中所处的数量区间范围确定预定话题是否异常。本发明通过确定被监测话题在预定时间段内的预定特征信息的数量在其对应的预定高斯分布模型中所处的数量区间范围来确定被监测话题是否异常,考虑到用户使用微博的时间习惯以及历史同期数据分布情况,排除了周期性活动的干扰,确保异常判断结果的准确性和可靠性。
-
公开(公告)号:CN107480190A
公开(公告)日:2017-12-15
申请号:CN201710560579.0
申请日:2017-07-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30191 , G06F17/30867 , G06F17/30876
Abstract: 本发明公开了一种非人为访问日志的过滤方法及装置,方法包括:过滤掉符合预设条件的访问日志,得到第一标准日志;基于标准日志过滤掉预定时间段内的访问日志,得到第二标准日志;从第一标准日志获取日志中URL前缀,得到前缀集合;依据前缀集合对第二标准日志进行过滤,得到过滤结果日志;本发明的方法及装置,可以快速有效地过滤高频的非人为访问,对提升日志挖掘效率、分析用户行为乃至检测内部安全威胁均具有重要意义。
-
公开(公告)号:CN107239704A
公开(公告)日:2017-10-10
申请号:CN201710374994.7
申请日:2017-05-24
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F21/56
CPC classification number: G06F21/562
Abstract: 本发明公开了一种恶意网页发现方法及装置,所述方法包括:确定每个预先选取的低可信度用户的网页资源访问集合;从确定的访问集合中确定出所有低可信度用户的网页资源访问交集;对所述访问交集中网页资源进行恶意网页检测,根据检测结果,确定恶意网页。本发明有效地解决现有恶意网页分类技术易漏判、准确率低和效率低的问题。
-
公开(公告)号:CN107135281A
公开(公告)日:2017-09-05
申请号:CN201710146433.1
申请日:2017-03-13
Applicant: 国家计算机网络与信息安全管理中心 , 北京信息科技大学
Abstract: 本发明实施例提供一种基于多数据源融合的IP地域类特征提取方法,包括:步骤1、基于现有的IP地址定位数据库,计算每一定位数据库的权威度;步骤2、基于现有的IP地址定位数据库,计算每一定位数据库中定位数据的完整度;步骤3、根据步骤1和步骤2中的每一定位数据库的权威度和每一定位数据库中定位数据的完整度,确定定位数据的可信度;步骤4、根据定位数据的可信度,选取定位数据构建IP地域类特征知识库。
-
公开(公告)号:CN106095928A
公开(公告)日:2016-11-09
申请号:CN201610409465.1
申请日:2016-06-12
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种事件类型识别方法及装置。该方法包括以下步骤:对训练集中所有文本进行分词、提取词性处理后训练词向量空间模型,提取文本的特征,将文本表示为特征向量;对于训练集进行事件类型聚类,训练带有类型聚类正则化项的神经网络模型;对于测试样本同样进行分析、提取词性处理,并利用已经训练好的词向量模型,得到特征表示;利用类型聚类正则化项的神经网络模型进行事件类别识别。借助于本发明的技术方案,能够利用同一群组中的类型共享信息来减轻标注数据不平衡带来的问题。
-
公开(公告)号:CN105207843A
公开(公告)日:2015-12-30
申请号:CN201510535106.6
申请日:2015-08-27
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L12/26
Abstract: 本发明提出了一种网站访问质量检测方法。其包括:在一测试时间段内进行多次随机测试,累计得到对应该测试时间段的历史测试结果;基于用户指定的先验分布和所述历史测试结果,选取被测网站和测试路径,以用于下一测试时间段的有效测试,可以有效挑选测试对象,优化测试策略,提高质量检测的效率。
-
公开(公告)号:CN104881458A
公开(公告)日:2015-09-02
申请号:CN201510266108.X
申请日:2015-05-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/374 , G06F16/35
Abstract: 本发明公开了一种网页主题的标注方法和装置。所述方法包括:基于网页的标题和正文,获得所述网页的主题特征向量;利用预先训练获得的分类器,对所述主题特征向量进行分类处理;判断是否存在所述主题特征向量所属的类型;若是,则将所述网页标注为所述主题特征向量所属的类型;若否,则将所述网页标记为待标注网页;进一步地,对多个待标注网页进行聚类处理;分析出每个聚类集合的类型;将待标注网页标注为其所属的聚类集合的类型。本发明采用有监督的分类方法和无监督的聚类方法级联的方式,自动的从网页中获取主题并标注网页,有效提高了网页主题标注的效率和准确性。
-
公开(公告)号:CN104850947A
公开(公告)日:2015-08-19
申请号:CN201510229723.3
申请日:2015-05-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q10/06
Abstract: 本发明公开了一种网格化多业务流程统一管理方法及装置,包括:基于待处理的业务建立相应的业务处理流程,并通过业务处理流程触发与多个业务系统进行信息交互,实现业务处理流程自动与外部系统交互,从而在业务流程管理中实现与多个业务系统的自动化交互操作。
-
公开(公告)号:CN104850647A
公开(公告)日:2015-08-19
申请号:CN201510284124.1
申请日:2015-05-28
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F16/951 , G06Q50/01
Abstract: 本发明公开了一种微博团体的发现方法及装置,其中,该方法包括:根据微博用户的元信息及微博内容,构建相互独立的特征信息词典;从预定时间段内用户的元信息和微博内容中分词,并基于特征信息词典和提取到的词语确定用户的兴趣特征向量;采用无监督学习方式从兴趣特征向量中确定用户团体信息。本发明实施例为不同种类的信息建立各自独立的特征信息词典,从用户一定时间段内更新的信息中分词,来与特征信息词典中的词语进行比对,进而确定用户的兴趣特征向量,再通过无监督学习方式来确定用户团体信息,通过此过程确定的用户团体信息是具有相同或相似兴趣爱好的团体,具有更准确的推广意义,传播力度大大提高,解决了现有问题。
-
-
-
-
-
-
-
-
-