-
公开(公告)号:CN106294405A
公开(公告)日:2017-01-04
申请号:CN201510264354.1
申请日:2015-05-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/9535 , G06F16/35
Abstract: 本发明公开一种微博子话题演化分析方法及装置,能够准确快速地识别微博子话题,并分析出微博子话题的演化关系。所述方法包括:通过改进的最近邻方法对当前时间窗口中的每个微博话题的特征进行聚类,以根据聚类结果生成相应的子话题;根据当前时间窗口中子话题与上一时间窗口中子话题的相似性确定子话题的演化关系。
-
公开(公告)号:CN111382302B
公开(公告)日:2023-08-11
申请号:CN201811619717.9
申请日:2018-12-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/683 , G06F16/632 , G06F16/61
Abstract: 本发明涉及一种基于变速模板的音频样例检索方法,该方法具体包括:针对长度5秒以上的变速模板的待检音频拆分为多个短音频片段,获取各个短音频片段的二进制音频指纹序列值,查找预先建立的哈希表;查找出各个短音频片段的二进制音频指纹序列值对应的模板音频的音频指纹序列值;计算各个短音频片段和模板音频之间指纹序列差异数D和模板音频与短音频片段之间允许指纹序列差异数的阈值Reject;如果D<Reject,则认为短音频片段与模板音频相似;如果D>Reject,则认为短音频片段存在错误,并提取该短音频片段。
-
公开(公告)号:CN108846364A
公开(公告)日:2018-11-20
申请号:CN201810653311.6
申请日:2018-06-22
Applicant: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
Abstract: 本发明提供了一种基于FPGA的视频特征检测方法,包括:选取视频库中的视频流的特征点簇集;对特征点簇集进行训练,得到分类网络;利用FPGA固化实现分类网络以进行视频特征比对。通过基于FPGA实现神经网络架构,近似SIFT特征和SURF特征,实现视频特征检测。传统的SIFT和SURF算法通过查找特征库的方式进行比对,而本发明实际上在FPGA上通过神经网络完成了特征生成和比对过程,去除了查找特征库的步骤,提高了比对效率。本发明通过结合深度学习技术,优化SIFT和SURF算法,使其适用于大规模系统应用,并采用FPGA硬件技术加速计算过程,由此,规避了海量特征库查找环节,提升了检查效率。
-
公开(公告)号:CN107465643A
公开(公告)日:2017-12-12
申请号:CN201610388592.8
申请日:2016-06-02
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: H04L63/1408 , G06F16/35 , G06K9/6269
Abstract: 本发明为一种基于深度学习的网络流量分类方法,包括(1)网络流量样本数据的获取;(2)网络流量属性的确定,包括:a.网络流量中客户端端口号统计分析;b.网络流量中数据包平均到达时间统计分析;c.网络流量中包含数据包个数统计分析;(3)网络流量样本标记;(4)连续数据的离散化;(5)样本的训练;本发明能够对纷繁复杂的网络流量资源,能够满足高精度的分类要求。
-
公开(公告)号:CN105162663A
公开(公告)日:2015-12-16
申请号:CN201510619088.X
申请日:2015-09-25
Applicant: 中国人民解放军信息工程大学 , 国家计算机网络与信息安全管理中心
IPC: H04L12/26
CPC classification number: H04L43/028 , H04L43/04
Abstract: 本发明属于网络监督领域,具体的涉及一种基于流集的在线流量识别方法,其中硬件部分包括10G骨干线路接入模块、流量筛选模块和数据处理模块,该在线流量识别方法的步骤包括:步骤一:捕捉网络数据流量,提取其报文;步骤二:流集信息表的生成与维护;步骤三:对流集进行检测;步骤四:对流集进行分类。本发明很好地解决了高速链路在线流识别准确度低、效率不高等问题,极大的提高了对高速链路在线流识别的准确性、可靠性和有效性。本申请实施例在多种不同的类型的流量数据上进行验证,该在线流量识别技术比参考算法的分类性能均有不同程度的提升。
-
公开(公告)号:CN104036774A
公开(公告)日:2014-09-10
申请号:CN201410280868.1
申请日:2014-06-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G10L15/06
Abstract: 本发明公开了一种藏语方言识别方法及系统,该方法包括:预先训练语种识别模型,所述语种识别模型包括:多方言DNN并行音素识别器模型、多方言语言模型;接收待识别藏语方言语音信息;提取所述语音信息的声学特征;利用所述多方言DNN并行音素识别器模型获得对应所述声学特征的音素序列;计算各音素序列在每个语言模型上的似然得分;将似然得分最高的语言模型对应的方言作为所述语音信息对应的方言种类。利用本发明,可以提高藏语方言识别效果。
-
公开(公告)号:CN111382302A
公开(公告)日:2020-07-07
申请号:CN201811619717.9
申请日:2018-12-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/683 , G06F16/632 , G06F16/61
Abstract: 本发明涉及一种基于变速模板的音频样例检索方法,该方法具体包括:针对长度5秒以上的变速模板的待检音频拆分为多个短音频片段,获取各个短音频片段的二进制音频指纹序列值,查找预先建立的哈希表;查找出各个短音频片段的二进制音频指纹序列值对应的模板音频的音频指纹序列值;计算各个短音频片段和模板音频之间指纹序列差异数D和模板音频与短音频片段之间允许指纹序列差异数的阈值Reject;如果D<Reject,则认为短音频片段与模板音频相似;如果D>Reject,则认为短音频片段存在错误,并提取该短音频片段。
-
公开(公告)号:CN106297769B
公开(公告)日:2019-07-09
申请号:CN201510280471.7
申请日:2015-05-27
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
IPC: G10L15/02
Abstract: 本发明涉及一种应用于语种识别的鉴别性特征提取方法,包括:在训练阶段为训练集中的语音数据的帧级的音素后验概率特征向量计算F比指标,所述F比指标反映了音素后验概率特征向量中每一维对语种鉴别性的贡献大小;在测试阶段为待测试的语音提取音素后验概率特征向量,并为所提取的音素后验概率特征向量根据F比指标做特征加权。
-
公开(公告)号:CN105897923B
公开(公告)日:2019-04-30
申请号:CN201610373851.X
申请日:2016-05-31
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种APP安装包网络流量识别方法。本方法为:1)将从网络流量中获取的APP安装包发送给在线识别引擎和离线解析引擎;2)离线解析引擎对收到的APP安装包进行解析,得到每一APP安装包信息;如果APP安装包信息符合设定条件,则将该APP安装包信息及其哈希特征保存到映射库中;3)在线识别引擎实时对接收到的APP安装包进行哈希计算,得到其哈希值hseg,然后根据该哈希值hseg查找所述映射库,如果存在对应的记录,则判断该APP安装包为该条记录标记的网络流量。本方法可以大大提高APP安装包识别效率。
-
公开(公告)号:CN105205146B
公开(公告)日:2018-10-30
申请号:CN201510600289.5
申请日:2015-09-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开了一种计算微博用户影响力的方法,属于数据挖掘领域,具体步骤如下:一、收集每日的微博流数据;步骤二、服务器将微博流数据平均分发到多个端口;步骤三、对流数据进行特征提取和并行计算;步骤四、将特征存储;步骤五、过滤不关心用户;步骤六、计算用户影响力;步骤七、存储每日每个用户的影响力。优点在于:该影响力的指标增加了平均数、最高数和爆发度,平均数要求用户发布的每条微博的平均影响力都比较高,避免出现微博数大造成转发量或评论量大,最高数和爆发度分别刻画影响力传播的范围和速度,因此,新增加的指标克服以往指标中存在单一总数不能完整刻画用户影响力的缺陷,能够更深入的解释用户影响力高的原因。
-
-
-
-
-
-
-
-
-