-
公开(公告)号:CN107342077A
公开(公告)日:2017-11-10
申请号:CN201710395341.7
申请日:2017-05-27
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G10L15/063 , G10L15/07 , G10L15/14 , G10L17/04 , G10L17/14 , G10L2015/0631 , G10L2015/0635
Abstract: 本发明涉及一种基于因子分析的说话人分段聚类方法及系统。该方法包括:1)提取训练语音的声学特征,训练高斯混合通用背景模型,进而训练总变化因子模型和高斯概率线性判别分析模型;2)对测试语音进行分段并提取语音片段的声学特征;3)依据高斯混合通用背景模型和总变化因子模型将提取的声学特征映射为总变化量因子,加载高斯概率线性判别分析模型,根据总变化量因子计算任意两语音片段之间的对数似然比得分;4)选择得分最高的两类进行合并,根据层次聚类的方法逐步迭代至收敛,最终输出说话人分段聚类结果。本发明将总变化因子的不确定性引入到高斯概率线性判别分析模型进行训练和打分,能够提升短时语音片段上的基于因子分析的系统性能。
-
公开(公告)号:CN105187403A
公开(公告)日:2015-12-23
申请号:CN201510498610.3
申请日:2015-08-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L29/06
CPC classification number: H04L63/1408 , H04L63/1433
Abstract: 本发明提出一种面向软件定义网络的网络安全性测试方法,包括针对目标软件定义网络的安全性测试框架、安全性测试策略、分类安全性测试方法、项目安全性测试方法和安全性测试步骤。其中,测试框架包括将目标软件定义网络划分为数据、控制、应用和管理四个网络平面,分别对各个网络平面的各个网元、链路以及各个网络平面之间的接口展开安全性测试;测试策略包括对安全性测试框架中的各个单元进行测试的选择和流程编制方法;分类安全性测试方法依据各个单元的类别特点开展不同类型的安全性测试;项目安全性测试方法实现具体的针对目标网元、链路或接口的安全性测试,测试流程定义了完整的针对目标软件定义网络的安全性测试过程和步骤。
-
公开(公告)号:CN102521838B
公开(公告)日:2013-11-27
申请号:CN201110427104.7
申请日:2011-12-19
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种图像检索/匹配方法。该方法首先求取两幅图像的初始匹配特征点集,然后判断并消除误匹配特征点对,再根据正确匹配特征点对的数量判断两幅图像是否匹配;其中,判断是否为误匹配特征点对,包括:在两幅图像中,分别以初始匹配特征点为中心,将图像均划分为两个以上的区域,并对各区域编号;在两幅图像中,分别以其他各初始匹配特征点所处区域的编号构成的矢量来描述该初始匹配特征点的全局特征;对两个矢量进行比较,如果相似度达到要求,则为正确的匹配特征点对。本发明方法不仅适应于图像尺度变化、图像嵌套、视角变化等复杂情况下的图像检索,而且具有较高的检索效率和识别准确率。本发明还相应公开了一种图像检索/匹配系统。
-
公开(公告)号:CN110555146A
公开(公告)日:2019-12-10
申请号:CN201810270472.7
申请日:2018-03-29
Applicant: 中国科学院信息工程研究所
IPC: G06F16/951 , H04L29/08 , H04L29/12
Abstract: 本发明提供一种网络爬虫伪装数据的生成方法,其步骤包括:从浏览器的用户代理useragent字串库中选择一useragent字串,从代理IP资源池中获取一代理IP;利用所述useragent字串和所代理IP访问目标网站,根据cookie获取策略,获取cookie信息并存储于cookie资源池;将所述cookie信息与所述useragent字串、所述代理IP、多个同城代理IP、referer信息关联存储,并打包成伪装数据;根据调度策略将所述伪装数据供外部爬虫程序使用。本发明还提供一种网络爬虫伪装数据的生成系统。
-
公开(公告)号:CN108874852A
公开(公告)日:2018-11-23
申请号:CN201810229800.9
申请日:2018-03-20
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种舆情信息中的个性化垃圾信息过滤方法及系统,该方法的步骤包括:基于通用词库和用户个性化词库,构建内存索引库;对含有舆情信息的原始文档进行分词处理,去除停用词;根据所述内存索引库,对经过上述处理的文档进行识别,识别出垃圾信息和非垃圾信息;将上述非垃圾信息输入到可更新的信息分类模型中,进一步识别出垃圾信息和非垃圾信息;基于通用垃圾识别标注语料和用户个性化垃圾识别标注语料,对所述信息分类模型识别出的非垃圾信息进行垃圾信息和非垃圾信息的标记,生成训练集,用来更新所述信息分类模型。
-
公开(公告)号:CN106909621A
公开(公告)日:2017-06-30
申请号:CN201710035078.0
申请日:2017-01-17
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种提速的基于IPC编码的查询处理方法。该方法把IPC编码下的索引文件视为树形的跳表文件,实现快读略过子树的算法;在处理布尔的求交查询时,根据链表的单调性判断是否略过(skip)某些子树,略过(skip)操作可节省大量时间从而提高线上布尔查询处理速度;在处理排序查询时,使用常见的TAAT处理方式与continue机制,根据ID列表的求交结果的位置可以快速取出对应的频率的索引文件的对应的值,通过略过所有不必要访问的子树的手段提高线上排序查询的处理速度。本发明根据IPC编码的特点优化了查询速度(包括布尔查询与排序查询),优化了检索系统的用户体验。
-
公开(公告)号:CN106909621B
公开(公告)日:2020-02-11
申请号:CN201710035078.0
申请日:2017-01-17
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种提速的基于IPC编码的查询处理方法。该方法把IPC编码下的索引文件视为树形的跳表文件,实现快读略过子树的算法;在处理布尔的求交查询时,根据链表的单调性判断是否略过(skip)某些子树,略过(skip)操作可节省大量时间从而提高线上布尔查询处理速度;在处理排序查询时,使用常见的TAAT处理方式与continue机制,根据ID列表的求交结果的位置可以快速取出对应的频率的索引文件的对应的值,通过略过所有不必要访问的子树的手段提高线上排序查询的处理速度。本发明根据IPC编码的特点优化了查询速度(包括布尔查询与排序查询),优化了检索系统的用户体验。
-
公开(公告)号:CN108073677A
公开(公告)日:2018-05-25
申请号:CN201711063644.5
申请日:2017-11-02
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于人工智能的多级文本多标签分类方法及系统。该方法包括:1)利用神经网络构建多级文本多标签分类模型,并根据该模型得到训练文本的文本类别预测结果;2)根据训练文本中已有的文本类别标注信息与步骤1)得到的训练文本的文本类别预测结果,对多级文本多标签分类模型的参数进行学习,得到参数确定的多级文本多标签分类模型;3)利用参数确定的多级文本多标签分类模型对待分类文本进行分类。本发明只通过文档级的标注信息来推断组成文本的标签,可以很好的应用于组成文本标签难以收集的场景;相对于传统多示例学习方法,本发明引入最少假设,能够更好地拟合实际数据;本发明具有良好的可扩展性。
-
公开(公告)号:CN105049288B
公开(公告)日:2017-10-24
申请号:CN201510452306.5
申请日:2015-07-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于PPPoE网络接入的高集成度网络采集系统及方法。该系统包括一采集服务器,采用支持PPPoE网络接入、支持多用户路由功能的Linux操作系统,并设有如下模块:采集模块,用于获取采集任务,发起HTTP请求,以及接收并处理远端服务器返回的数据;拨号断开模块,用于断开PPPoE线路;拨号连接模块,用于PPPoE线路的拨号连接并配置网络路由;拨号管理模块,用于管理多条PPPoE线路接入并执行PPPoE线路的断线、连接操作;IP管理模块,用于对采集使用的IP进行管理,实现IP注册和IP查询。本发明能够有效突破IP限制、低成本地增加带宽,从而提高互联网数据采集效率。
-
公开(公告)号:CN105049288A
公开(公告)日:2015-11-11
申请号:CN201510452306.5
申请日:2015-07-28
Applicant: 中国科学院信息工程研究所
CPC classification number: H04L43/04 , H04L12/2859 , H04L43/50
Abstract: 本发明涉及一种基于PPPoE网络接入的高集成度网络采集系统及方法。该系统包括一采集服务器,采用支持PPPoE网络接入、支持多用户路由功能的Linux操作系统,并设有如下模块:采集模块,用于获取采集任务,发起HTTP请求,以及接收并处理远端服务器返回的数据;拨号断开模块,用于断开PPPoE线路;拨号连接模块,用于PPPoE线路的拨号连接并配置网络路由;拨号管理模块,用于管理多条PPPoE线路接入并执行PPPoE线路的断线、连接操作;IP管理模块,用于对采集使用的IP进行管理,实现IP注册和IP查询。本发明能够有效突破IP限制、低成本地增加带宽,从而提高互联网数据采集效率。
-
-
-
-
-
-
-
-
-