-
公开(公告)号:CN108806668A
公开(公告)日:2018-11-13
申请号:CN201810590276.8
申请日:2018-06-08
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G10L15/02 , G10L15/06 , G10L15/08 , G10L15/26 , G10L17/02 , G10L17/04 , G10L17/22 , G10L21/0272 , G10L25/87
CPC classification number: G10L15/02 , G10L15/063 , G10L15/08 , G10L15/26 , G10L17/02 , G10L17/04 , G10L17/22 , G10L21/0272 , G10L25/87
Abstract: 本发明公开一种音视频多维度标注与模型优化方法,具体包括如下步骤:首先进行样本管理与分拣,针对输入系统的样本数据进行去重,编号,建立样本标注任务库;音频数据预处理阶段,将任务库的视频数据进行音频抽取,同时完成对音频数据的预处理操作;音频内容分析与特征提取阶段,在完成音频预处理后,并依据后台已配置的标注规范体系进行深度分析输出标签数据;步骤304:视频内容分析与特征提取阶段,通过对视频内容进行图像分析,并依据后台已配置的标注规范体系进行深度分析输出标签数据;步骤305:特征融合与标签生成,将识别特征与标签信息融合,输出该样本的标签结果;人工复核与模型优化,系统产生的标签结果数据会经由人工进行复核确认。
-
公开(公告)号:CN110704186B
公开(公告)日:2022-05-24
申请号:CN201910908595.3
申请日:2019-09-25
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种基于混合计算资源的分布式计算系统,用以合理分配资源,满足计算任务多样性的需求,所述系统包括计算引擎层和资源调度层,其中:所述计算引擎层由多个构建在同一个Spark计算引擎上的深度学习框架组成,针对所述计算引擎层统一封装各个深度学习框架的访问接口;所述资源调度层包括多种异构计算资源,所述异构计算资源包括以下至少一项:CPU、GPU和FPGA;在所述资源调度层,根据待处理任务的任务类型划分不同的任务队列,根据不同物理机搭载的计算资源类型划分不同的逻辑集群,根据待处理任务的任务类,将任务队列中的任务分配到对应的逻辑集群中执行。
-
公开(公告)号:CN109859742B
公开(公告)日:2021-04-09
申请号:CN201910015449.8
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明提供一种说话人分段聚类方法及装置,以解决相关技术中处理短时说话人语音时,性能下降导致说话人聚类效果较差的问题。该方法包括:将待聚类语音划分为多个子语音段;通过权重联合概率线性判别分析WT‑PLDA模型对基于划分得到的各子语音段的I‑vector提取出各子语音段的特征信息W‑vector,所述WT‑PLDA模型的模型参数至少包括:均值向量、说话人子空间的投影矩阵、说话人因子的隐藏变量以及残差因子;通过概率线性判别分析PLDA根据划分后多个子语音段的所述W‑vector对该多个子语音段循环进行多次聚类,直至所述多个子语音段被聚类为两类。本发明提高了说话人的聚类效果。
-
公开(公告)号:CN112258377A
公开(公告)日:2021-01-22
申请号:CN202011088661.6
申请日:2020-10-13
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种鲁棒二值神经网络的构建方法及设备。鲁棒二值神经网络的构建方法,包括:对训练数据进行二值化处理;基于二值化处理后的训练数据,对预设二值神经网络进行训练;对完成训练的预设二值神经网络进行纠错编码。采用本发明,通过对训练数据进行二值化处理,可以将内存占用降低为原有的浮点型权值的1/32;同时,对训练好的二值神经网络进行纠错编码,使得编码后二元神经网络具有抵抗檫除或者错误的噪音干扰,所以编码后的二元神经网络具有很好的鲁棒性。
-
公开(公告)号:CN106970962B
公开(公告)日:2020-08-11
申请号:CN201710170469.3
申请日:2017-03-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/95 , G06F16/953
Abstract: 本发明公开了一种获取搜索引擎搜索结果的方法和装置。所述方法包括:输入待测试的搜索引擎、关键词和页码;将关键词和页码输入搜索引擎对应的搜索引擎模板,获得关键词和页码对应的一级页面地址;将一级页面地址输入到预设的浏览器中,通过浏览器访问一级页面地址,并获取一级页面地址对应一级页面信息和二级页面信息。本发明采用自动化的方式获取搜索引擎的搜索结果,通过预先设置搜索引擎模板的方式,自动获得一级页面地址,并将一级页面地址输入预设的浏览器中,进而通过访问该一级页面地址,自动获得所需的一级页面信息和二级页面信息。通过本发明可以有效提升搜索验证效率和准确率,提高搜索效果以及获得搜索结果的效率。
-
公开(公告)号:CN110704186A
公开(公告)日:2020-01-17
申请号:CN201910908595.3
申请日:2019-09-25
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种基于混合计算资源的分布式计算系统,用以合理分配资源,满足计算任务多样性的需求,所述系统包括计算引擎层和资源调度层,其中:所述计算引擎层由多个构建在同一个Spark计算引擎上的深度学习框架组成,针对所述计算引擎层统一封装各个深度学习框架的访问接口;所述资源调度层包括多种异构计算资源,所述异构计算资源包括以下至少一项:CPU、GPU和FPGA;在所述资源调度层,根据待处理任务的任务类型划分不同的任务队列,根据不同物理机搭载的计算资源类型划分不同的逻辑集群,根据待处理任务的任务类,将任务队列中的任务分配到对应的逻辑集群中执行。
-
公开(公告)号:CN105893157B
公开(公告)日:2019-08-30
申请号:CN201610282320.X
申请日:2016-04-29
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种开放分布式系统资源管理与任务调度系统与方法,本发明通过将开放分布式系统资源管理与任务调度系统分为任务管理器、资源策略优化调度器、资源管理器、以及多个节点管理器,简化中央调度功能,解决了现有技术中的资源管理与调度系统较难直接应用在异构硬件资源环境下管理执行异构任务的问题,能够提供一种管理异构硬件资源并调度执行异构任务的框架,可支持硬件资源的动态变化与不同类型任务的调度管理。
-
公开(公告)号:CN109859742A
公开(公告)日:2019-06-07
申请号:CN201910015449.8
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明提供一种说话人分段聚类方法及装置,以解决相关技术中处理短时说话人语音时,性能下降导致说话人聚类效果较差的问题。该方法包括:将待聚类语音划分为多个子语音段;通过权重联合概率线性判别分析WT-PLDA模型对基于划分得到的各子语音段的I-vector提取出各子语音段的特征信息W-vector,所述WT-PLDA模型的模型参数至少包括:均值向量、说话人子空间的投影矩阵、说话人因子的隐藏变量以及残差因子;通过概率线性判别分析PLDA根据划分后多个子语音段的所述W-vector对该多个子语音段循环进行多次聚类,直至所述多个子语音段被聚类为两类。本发明提高了说话人的聚类效果。
-
公开(公告)号:CN105207843B
公开(公告)日:2019-05-28
申请号:CN201510535106.6
申请日:2015-08-27
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L12/26
Abstract: 本发明提出了一种网站访问质量检测方法。其包括:在一测试时间段内进行多次随机测试,累计得到对应该测试时间段的历史测试结果;基于用户指定的先验分布和所述历史测试结果,选取被测网站和测试路径,以用于下一测试时间段的有效测试,可以有效挑选测试对象,优化测试策略,提高质量检测的效率。
-
公开(公告)号:CN104881458B
公开(公告)日:2019-05-28
申请号:CN201510266108.X
申请日:2015-05-22
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种网页主题的标注方法和装置。所述方法包括:基于网页的标题和正文,获得所述网页的主题特征向量;利用预先训练获得的分类器,对所述主题特征向量进行分类处理;判断是否存在所述主题特征向量所属的类型;若是,则将所述网页标注为所述主题特征向量所属的类型;若否,则将所述网页标记为待标注网页;进一步地,对多个待标注网页进行聚类处理;分析出每个聚类集合的类型;将待标注网页标注为其所属的聚类集合的类型。本发明采用有监督的分类方法和无监督的聚类方法级联的方式,自动的从网页中获取主题并标注网页,有效提高了网页主题标注的效率和准确性。
-
-
-
-
-
-
-
-
-