-
公开(公告)号:CN106156372B
公开(公告)日:2019-07-30
申请号:CN201610799477.X
申请日:2016-08-31
Applicant: 北京北信源软件股份有限公司
IPC: G06F16/9535 , G06F16/9536 , G06F16/35 , G06F16/951 , G06K9/62
Abstract: 本发明提供了一种互联网网站的分类方法及装置,上述方法包括:爬取待分类的互联网网站的网站内容;根据互联网网站所属的应用领域,构建应用领域匹配的原始词典:中文分词词典和停止词词典;根据综合词典,训练原始词典对应的关键词库,并根据关键词库优化原始词典,得到优化中文分词词典及其匹配的优化关键词库;其中,关键词库包括多个网站内容的类别关键词且多个类别关键词均按照其在各个类别中的权重值从大到小的顺序排列设置;根据优化关键词库中的类别关键词对待分类的互联网网站的网站内容进行计算,得到互联网网站的类别;其降低业务分类之间的耦合性以及强化业务分类的独立性,有利于对专业性互联网网站进行分类,提高了分类精度。
-
公开(公告)号:CN106469274A
公开(公告)日:2017-03-01
申请号:CN201610800143.X
申请日:2016-08-31
Applicant: 北京北信源软件股份有限公司
IPC: G06F21/55
CPC classification number: G06F21/552
Abstract: 本申请公开了一种数据窃取风险分析方法及分析系统,其中,所述数据窃取风险分析方法通过利用建立的关键资源数据库对获取的操作行为数据进行筛选,以保留复制操作数据中的关键复制操作及其发生的时间,从而实现只针对关键资源数据库的复制操作的风险分析;然后对所述关键复制操作进行第一次分类处理,获得所述工作时间复制参数、非工作时间复制参数、工作时间间隔参数和非工作时间间隔参数,并将这些参数代入公式(1)中进行计算,以计算结果作为所述用户的复制数据窃取风险值,从而实现根据用户的操作行为数据分析其数据窃取风险值,进而实现对可能发生的数据窃取行为的预警,减少对企业或科研院所利益的损害。
-
公开(公告)号:CN106469274B
公开(公告)日:2019-03-08
申请号:CN201610800143.X
申请日:2016-08-31
Applicant: 北京北信源软件股份有限公司
IPC: G06F21/55
Abstract: 本申请公开了一种数据窃取风险分析方法及分析系统,其中,所述数据窃取风险分析方法通过利用建立的关键资源数据库对获取的操作行为数据进行筛选,以保留复制操作数据中的关键复制操作及其发生的时间,从而实现只针对关键资源数据库的复制操作的风险分析;然后对所述关键复制操作进行第一次分类处理,获得所述工作时间复制参数、非工作时间复制参数、工作时间间隔参数和非工作时间间隔参数,并将这些参数代入公式(1)中进行计算,以计算结果作为所述用户的复制数据窃取风险值,从而实现根据用户的操作行为数据分析其数据窃取风险值,进而实现对可能发生的数据窃取行为的预警,减少对企业或科研院所利益的损害。
-
公开(公告)号:CN106156372A
公开(公告)日:2016-11-23
申请号:CN201610799477.X
申请日:2016-08-31
Applicant: 北京北信源软件股份有限公司
CPC classification number: G06F16/35 , G06F16/9535 , G06K9/6256 , G06K9/6267
Abstract: 本发明提供了一种互联网网站的分类方法及装置,上述方法包括:爬取待分类的互联网网站的网站内容;根据互联网网站所属的应用领域,构建应用领域匹配的原始词典:中文分词词典和停止词词典;根据综合词典,训练原始词典对应的关键词库,并根据关键词库优化原始词典,得到优化中文分词词典及其匹配的优化关键词库;其中,关键词库包括多个网站内容的类别关键词且多个类别关键词均按照其在各个类别中的权重值从大到小的顺序排列设置;根据优化关键词库中的类别关键词对待分类的互联网网站的网站内容进行计算,得到互联网网站的类别;其降低业务分类之间的耦合性以及强化业务分类的独立性,有利于对专业性互联网网站进行分类,提高了分类精度。
-
-
-