-
公开(公告)号:CN113489622B
公开(公告)日:2022-05-13
申请号:CN202110738313.7
申请日:2021-06-30
Applicant: 国家计算机网络与信息安全管理中心 , 南京中新赛克科技有限责任公司
IPC: H04L43/065 , H04L61/3015 , H04L9/40
Abstract: 本发明公开了一种提取网络设备指纹的方法,通过对网络设备的地理位置、设备类型、操作系统等信息进行分组预处理,结合编解码、终端类型、知名端口及服务、开放端口特征、活跃账号的特征信息,进行相似性融合分析,高效识别不同IP对应的同一设备。本发明的有益效果为:结合多维度的信息提取,对虚拟设备进行有效身份标识,达到对虚拟网络中硬件设备的准确识别,可以对网络攻击等行为动作进行快速识别及反应。
-
公开(公告)号:CN113780338A
公开(公告)日:2021-12-10
申请号:CN202110868718.2
申请日:2021-07-30
Applicant: 国家计算机网络与信息安全管理中心 , 南京中新赛克科技有限责任公司
Abstract: 本发明公开了一种基于支持向量机的大数据分析中置信度评价方法及系统,应用于互联网骚扰电话的分析领域,对骚扰电话进行评价;本方法基于支持向量机实现了自动分类的置信度评价,提出了海量数据分析领域中分类评价的解决方案,从而高效、直观对骚扰电话的分类。本方法提供对分析样本进行高效、准确的分类置信度评价。
-
公开(公告)号:CN113780338B
公开(公告)日:2024-04-09
申请号:CN202110868718.2
申请日:2021-07-30
Applicant: 国家计算机网络与信息安全管理中心 , 南京中新赛克科技有限责任公司
IPC: G06F18/2411 , G06Q10/0639 , G06N20/10
Abstract: 本发明公开了一种基于支持向量机的大数据分析中置信度评价方法及系统,应用于互联网骚扰电话的分析领域,对骚扰电话进行评价;本方法基于支持向量机实现了自动分类的置信度评价,提出了海量数据分析领域中分类评价的解决方案,从而高效、直观对骚扰电话的分类。本方法提供对分析样本进行高效、准确的分类置信度评价。
-
公开(公告)号:CN113489622A
公开(公告)日:2021-10-08
申请号:CN202110738313.7
申请日:2021-06-30
Applicant: 国家计算机网络与信息安全管理中心 , 南京中新赛克科技有限责任公司
Abstract: 本发明公开了一种提取网络设备指纹的方法,通过对网络设备的地理位置、设备类型、操作系统等信息进行分组预处理,结合编解码、终端类型、知名端口及服务、开放端口特征、活跃账号的特征信息,进行相似性融合分析,高效识别不同IP对应的同一设备。本发明的有益效果为:结合多维度的信息提取,对虚拟设备进行有效身份标识,达到对虚拟网络中硬件设备的准确识别,可以对网络攻击等行为动作进行快速识别及反应。
-
公开(公告)号:CN119892984A
公开(公告)日:2025-04-25
申请号:CN202510049291.1
申请日:2025-01-13
Applicant: 南京中新赛克科技有限责任公司
IPC: H04M3/436 , H04M3/22 , G06F18/2115 , G06F18/2134 , G06F18/214 , G06F18/243 , G06N20/00
Abstract: 本发明公开了一种基于机器学习的电话引流方法、系统及存储介质,包括构建有害和正常号码的样本特征库;对样本特征库中的特征数据进行预处理,并划分为特征训练集和特征测试集;基于特征训练集,构建决策树;基于特征测试集,对决策树中的决策规则进行筛选,获得在测试集上表现最优的特征组合及特征组合对应的分割阈值;收集新批次呼叫号码,并获取呼叫号码的特征数据,基于最优特征组合及特征组合对应的分割阈值对呼叫号码的特征数据进行识别,从而预测出该呼叫号码是有害号码还是正常号码;定时更新最优特征组合及其对应的分割阈值,确保在有害号码特征发生变化时,同样能实现较好的引流效果。本发明利用机器学习算法对样本特征数据进行分类,并筛选出引流效果最好的特征组合和分割阈值,能够更准确地识别出有害电话,减少误判和漏判。
-
公开(公告)号:CN112749279A
公开(公告)日:2021-05-04
申请号:CN202110060987.6
申请日:2021-01-18
Applicant: 南京中新赛克科技有限责任公司
IPC: G06F16/35 , G06K9/62 , G06F16/31 , G06F16/33 , G06F40/194 , G06F40/284
Abstract: 本发明公开了一种基于文本聚类的主题词提取方法,对文本信息进行分词处理;对干扰词积累形成停用词库,加载文本分词集合;针对处理词文档,计算文档词频TF,计算逆文档词频IDF;新建Kmeans模型,训练出各聚类中心词频及其预测值,使用余弦相似度计算文本词之间相似度;输出Kmeans聚类结果,每个聚类集合;对各个聚类集合进行LDA文档主题预测;针对文档到词的权重分布,提取TOPN主题,形成集合Mi;针对集合Mi,分词后的文本记录词库与集合Mi碰撞。本发明通过多方联合分析,对无监督学习主题提取方法进行有益补充;不依赖现有数据分析平台,适用于各类编程语言;结合Kmeans聚类方法,LDA主题模型分析,个性化碰撞规则,对大数据文本主题词提取进行有效支撑。
-
-
-
-
-