-
公开(公告)号:CN104202656B
公开(公告)日:2017-08-04
申请号:CN201410472027.0
申请日:2014-09-16
Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术有限公司
IPC: H04N21/439 , H04N21/443
Abstract: 本发明提供了一种网络音频MP3流乱序分段解码方法,涉及音频流处理技术领域。本方法从网络中捕获音频MP3数据包,获取MP3数据帧并根据位置信息存储在缓存中,一个session建立一个缓存,当有连续MP3数据帧达到指定大小时,进行音频解码。采用FFmpeg技术进行数据块解码,解码时修改相应的上下文,通过伪装的方式让FFmpeg进行解码。采用具有多个加速单元的独立板卡进行解码,加速单元采用FFmpeg技术实现,从而可实现并行解码。无论网络音频MP3以何种顺序接收,本发明方法均能以固定数量的音频帧为单位拼接并进行最大程度解码,并可支持多数据流并发解码,提高了音频流有效帧数的接收率和解码率。
-
公开(公告)号:CN106034105A
公开(公告)日:2016-10-19
申请号:CN201510102958.6
申请日:2015-03-09
Applicant: 国家计算机网络与信息安全管理中心 , 北京天元特通科技有限公司
IPC: H04L29/06 , H04L12/933
Abstract: 本发明公开一种OpenFlow交换机及处理DDoS攻击的方法,该交换机包括:判断模块,用于以预定周期间隔收集关于数据包处理的统计信息,以判断是否出现分布式拒绝服务DDoS攻击,所述数据包是要在所述OpenFlow交换机中处理的数据包;响应模块,用于在判断出现所述DDoS攻击之后,利用被引入至所述OpenFlow交换机中的所述数据包来感知所述DDoS攻击的特征,并根据所述DDoS攻击的所述所感知特征来处理所述数据包。通过这种方式,能够判断OpenFlow交换机中的DDoS攻击并对DDoS攻击作出响应。
-
公开(公告)号:CN104036774A
公开(公告)日:2014-09-10
申请号:CN201410280868.1
申请日:2014-06-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G10L15/06
Abstract: 本发明公开了一种藏语方言识别方法及系统,该方法包括:预先训练语种识别模型,所述语种识别模型包括:多方言DNN并行音素识别器模型、多方言语言模型;接收待识别藏语方言语音信息;提取所述语音信息的声学特征;利用所述多方言DNN并行音素识别器模型获得对应所述声学特征的音素序列;计算各音素序列在每个语言模型上的似然得分;将似然得分最高的语言模型对应的方言作为所述语音信息对应的方言种类。利用本发明,可以提高藏语方言识别效果。
-
公开(公告)号:CN102761487A
公开(公告)日:2012-10-31
申请号:CN201210242506.4
申请日:2012-07-12
Applicant: 国家计算机网络与信息安全管理中心 , 曙光信息产业(北京)有限公司
Abstract: 本发明公开了一种数据流处理方法和系统,该方法用于借助众核处理器的多个处理核心对数据流进行解码处理,其中,多个处理器核心被划分为多个资源组,该方法包括:将数据流分配给多个资源组中的部分或全部;以及每个资源组对被分配到该资源组的数据流进行解码处理。本发明通过将数据流分配给多个处理核心划分得到的多个资源组中的部分或全部,并在每个资源组中对被分配到该资源组的数据流进行解码处理,从而能够对多个数据流进行并行处理,并且减少各个流的各个片段输入产生的响应延迟以及整个流的响应延迟,提高了处理效率,优化了处理器资源的使用。
-
公开(公告)号:CN109859742B
公开(公告)日:2021-04-09
申请号:CN201910015449.8
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明提供一种说话人分段聚类方法及装置,以解决相关技术中处理短时说话人语音时,性能下降导致说话人聚类效果较差的问题。该方法包括:将待聚类语音划分为多个子语音段;通过权重联合概率线性判别分析WT‑PLDA模型对基于划分得到的各子语音段的I‑vector提取出各子语音段的特征信息W‑vector,所述WT‑PLDA模型的模型参数至少包括:均值向量、说话人子空间的投影矩阵、说话人因子的隐藏变量以及残差因子;通过概率线性判别分析PLDA根据划分后多个子语音段的所述W‑vector对该多个子语音段循环进行多次聚类,直至所述多个子语音段被聚类为两类。本发明提高了说话人的聚类效果。
-
公开(公告)号:CN107506799B
公开(公告)日:2020-04-24
申请号:CN201710780217.2
申请日:2017-09-01
Applicant: 北京大学 , 国家计算机网络与信息安全管理中心
Abstract: 一种基于深度神经网络的样本分类方法,使用包含已定义类别样本的样本集训练待扩展分类模型,获得分类阈值信息;将包含未定义类别样本的样本集送入所述待扩展分类模型,根据所述待扩展分类模型的分类阈值信息确定至少部分所述未定义类别样本;人工标注未定义类别样本;在所述深度神经网络的分类层中增加权值转移矩阵列数,以增加模型识别类别的总数,其中,增加的权值列中包含与全局分类相关的第一信息和与类别间联系相关的第二信息;用人工标注的未定义类别样本增量训练更新后的模型。通过修改深度神经网络分类层权值转移矩阵,从而扩展深度神经网络,使其识别类别数动态增加,从而能处理开集识别问题,更贴近真实识别场景下的应用。
-
公开(公告)号:CN106297819B
公开(公告)日:2019-09-06
申请号:CN201510272422.9
申请日:2015-05-25
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
IPC: G10L21/0224
Abstract: 本发明涉及一种应用于说话人识别的噪声消除方法,包括:利用加噪后语音的声学谱特征时域上相邻的多帧特征来消除特征中噪声的影响。本发明的方法实现了在特征层消除噪声影响;不需要增加额外的训练数据;在系统速度不会大幅降低的情况下可以明显提高系统在在噪声环境下的性能。
-
公开(公告)号:CN109859742A
公开(公告)日:2019-06-07
申请号:CN201910015449.8
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明提供一种说话人分段聚类方法及装置,以解决相关技术中处理短时说话人语音时,性能下降导致说话人聚类效果较差的问题。该方法包括:将待聚类语音划分为多个子语音段;通过权重联合概率线性判别分析WT-PLDA模型对基于划分得到的各子语音段的I-vector提取出各子语音段的特征信息W-vector,所述WT-PLDA模型的模型参数至少包括:均值向量、说话人子空间的投影矩阵、说话人因子的隐藏变量以及残差因子;通过概率线性判别分析PLDA根据划分后多个子语音段的所述W-vector对该多个子语音段循环进行多次聚类,直至所述多个子语音段被聚类为两类。本发明提高了说话人的聚类效果。
-
公开(公告)号:CN108664622A
公开(公告)日:2018-10-16
申请号:CN201810455198.0
申请日:2018-05-14
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于二级倒排表的树状音频特征索引库建立方法,所述音频特征索引库建立方法在数字集成电路芯片中进行以下步骤:步骤1:对音频数据库中的所有特征分段进行粗量化;步骤2:对步骤1中的粗量化残差进行二级粗量化;步骤3:对粗量化残差进行乘积矢量量化;步骤4:插入倒排表。
-
公开(公告)号:CN107305767A
公开(公告)日:2017-10-31
申请号:CN201610236672.1
申请日:2016-04-15
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种应用于语种识别的短时语音时长扩展方法,所述方法包括:对于一条时长较短的待识别语音,首先根据其语音时长确定生成的不同语速语音的数量n;然后根据合成帧移值及n个语速变化率计算生成语音的n个分解帧移;根据分解帧移和合成帧移生成n个不同语速的语音,将n个不同语速的语音与原语音拼接起来,生成一个时长加长的语音。不同语速的语音的语种信息具有互补性,本发明所提出的方法可以显著提升短时语音的语种识别性能。
-
-
-
-
-
-
-
-
-