-
公开(公告)号:CN107305767A
公开(公告)日:2017-10-31
申请号:CN201610236672.1
申请日:2016-04-15
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种应用于语种识别的短时语音时长扩展方法,所述方法包括:对于一条时长较短的待识别语音,首先根据其语音时长确定生成的不同语速语音的数量n;然后根据合成帧移值及n个语速变化率计算生成语音的n个分解帧移;根据分解帧移和合成帧移生成n个不同语速的语音,将n个不同语速的语音与原语音拼接起来,生成一个时长加长的语音。不同语速的语音的语种信息具有互补性,本发明所提出的方法可以显著提升短时语音的语种识别性能。
-
公开(公告)号:CN106297819A
公开(公告)日:2017-01-04
申请号:CN201510272422.9
申请日:2015-05-25
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
IPC: G10L21/0224
Abstract: 本发明涉及一种应用于说话人识别的噪声消除方法,包括:利用加噪后语音的声学谱特征时域上相邻的多帧特征来消除特征中噪声的影响。本发明的方法实现了在特征层消除噪声影响;不需要增加额外的训练数据;在系统速度不会大幅降低的情况下可以明显提高系统在噪声环境下的性能。
-
公开(公告)号:CN104202659A
公开(公告)日:2014-12-10
申请号:CN201410471628.X
申请日:2014-09-16
Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术有限公司
IPC: H04N21/44 , H04N21/443 , H04N19/436
Abstract: 本发明提供了一种网络视频流乱序分段解码方法,涉及视频流处理技术领域。本方法首先从网络中捕获传输来的视频数据包,并为每个视频流建立一个缓存,将数据包按序存在对应的位置,当连续数据包达到指定大小时,进行视频解码。采用FFmpeg技术进行数据块解码,解码时修改相应的上下文,通过伪装的方式让FFmpeg继续解码工作。此外本发明采用具有多个加速单元的独立板卡进行解码,加速单元采用FFmpeg技术实现,从而可实现并行解码。无论网络视频流以何种顺序接收,本发明方法均能以数据块为单位将视频流拼接并进行最大程度解码,并可支持多数据流并发解码;本发明方法提高了视频流有效帧数的接收率和解码率。
-
公开(公告)号:CN103677959A
公开(公告)日:2014-03-26
申请号:CN201310690358.7
申请日:2013-12-16
Applicant: 国家计算机网络与信息安全管理中心 , 浪潮(北京)电子信息产业有限公司
Abstract: 本发明提供一种基于组播的虚拟机集群迁移方法及系统,应用于调度系统领域:上述方法包括以下步骤:当虚拟机进行迁移时,虚拟机集群的迁移请求进入任务池;发送器获取映射表信息并根据任务池任务,调用迁移API,完成虚拟机集群迁移。本发明采用组播的迁移机制和基于综合计算强度的虚拟机放置策略,实现云计算中虚拟机集群迁移,渐少了迁移过程中网络资源的消耗,提高了迁移效率。
-
公开(公告)号:CN109902202B
公开(公告)日:2021-06-22
申请号:CN201910015462.3
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明提供一种视频分类方法及装置,用以解决相关技术中基于显著性引导的分类模型的分类性能较低的问题。该方法包括:提取待分类视频的关键帧;将所述关键帧输入预先根据训练集训练得到的双路神经网络模型,得到所述视频的分类结果以及所述视频的显著图,所述训练集中包括按照视频类型进行分类的视频以及视频显著图,所述双路神经网络模型包括一路用于对所述视频进行分类的第一子神经网络以及一路用于确定所述视频的显著图的第二子神经网络;将得到的所述显著图中置信度高于第一阈值的显著图加入所述训练集;使用所述训练集中的视频显著图重新训练所述第二子神经网络,得到更新后的双路神经网络模型。本发明有效提高了视频分类的性能。
-
公开(公告)号:CN110120230B
公开(公告)日:2021-06-01
申请号:CN201910015466.1
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 哈尔滨工业大学
Abstract: 本发明提供一种声学事件检测方法及装置,用以解决相关技术中声学事件检测精度较低的问题。该方法包括:提取待检测的音频的目标特征,得到第一特征数据;将所述第一特征数据分别输入第一GMM模型以及第二GMM模型,得到第一似然概率以及第二似然概率,所述第一GMM模型基于声学事件的音频的特征数据进行训练得到,所述第二GMM模型基于非声学事件的音频的特征数据进行训练得到;根据所述第一似然概率以及所述第二似然概率依次确定所述待检测的音频中各单位音频的类型,所述类型包括声学事件以及非声学事件;将确定出的相邻的类型为声学事件的单位音频合并;当合并后的音频持续的时长超过阈值时,确定发生声学事件。本发明有效提高了声学事件检测的精度。
-
公开(公告)号:CN108305616B
公开(公告)日:2021-03-16
申请号:CN201810039421.3
申请日:2018-01-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明涉及一种基于长短时特征提取的音频场景识别方法及装置,该方法包括,对输入待识别音频信号进行预处理;对经过预处理后的所述待识别音频信号,进行短时音频特征提取,再进行长时音频特征提取,将所述待识别音频信号的所述长、短时音频特征联合,输入分类模型及其融合模型,进行分类和识别,输出音频场景的识别标签。本发明在常规短时特征提取的基础之上,进一步联合音频场景长时特征,可以表征复杂的音频场景信息,输入分类模型及其融合模型,进行分类和识别,输出音频场景的识别标签,其鲁棒性更强、区分性更好,且能够在更大程度上表征场景数据的整体特性,识别效率高、稳定性强。
-
公开(公告)号:CN112215908A
公开(公告)日:2021-01-12
申请号:CN202011086137.5
申请日:2020-10-12
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
Abstract: 本发明属于计算机视觉领域,具体涉及一种面向压缩域的视频内容比对系统、优化方法、比对方法,旨在为了解决使用全解码信息完成视频内容比对效率不高的问题。本发明比对系统包括:特征学习模块,基于输入视频的多种压缩域信息,分别获取多种模态的特征图;多模态压缩域信息融合模块,对所述特征学习模块输出的多种模态的特征图进行信息融合,得到所述输入视频的融合特征向量;第二模块,配置为获取两个输入视频的融合特征向量的L1距离;分类器为二分类网络,配置为基于所述第二模块输出的L1距离进行比对结果的二分类。本发明可以有效地提取视频内容的高层语义信息,保证了视频内容的比对高速度和高性能。
-
公开(公告)号:CN112000765A
公开(公告)日:2020-11-27
申请号:CN202010013353.0
申请日:2020-01-07
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司
IPC: G06F16/33 , G06F40/126
Abstract: 本发明公开了一种基于智能网元日志的被动域名收集的方法,所述方法包括如下步骤:(1)日志数据收集;(2)被动匹配域名字符串。本发明适合匹配文本字面,具有灵活性、逻辑性和功能性强的优点,同时可以迅速地用极简单的方式达到字符串的复杂控制。
-
公开(公告)号:CN111724022A
公开(公告)日:2020-09-29
申请号:CN202010013216.7
申请日:2020-01-07
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司
IPC: G06Q10/06 , G06F16/245 , H04L12/851
Abstract: 本发明公开了一种基于边缘智能网元日志的用户位置预测方法,所述方法包括如下步骤:系统通过随机抽样算法提取局域网中的流量数据,发送到流量采集服务器端,所述采集服务器利用网络流量采集卡收集发送来的全部流量数据;利用Golang gopacket将所述采集卡接收的数据按过滤条件进行数据包特征提取,然后将过滤出来的流量或特征存储到指定数据库中;依次提取采集到数据包的信息,将数据包聚合为若干流,并入数据流量表;根据自有算法对所述数据流量表中的数据按照已有库进行评分计算,然后把计算结果与已设关键设备评分阈值比对,达到或超过阈值的设备定义为关键设备。该方法能够从流量中有效地提取出关键设备的特征信息,准确识别设备类型。
-
-
-
-
-
-
-
-
-