-
公开(公告)号:CN117688440A
公开(公告)日:2024-03-12
申请号:CN202311523513.6
申请日:2023-11-13
Applicant: 科大讯飞股份有限公司
IPC: G06F18/241 , G06F18/23 , G06F18/214 , G01S7/41
Abstract: 本申请公开了一种雷达信号分选方法、分选模型的训练方法及相关装置,该方法包括:将多个雷达信号进行聚类,得到离散信号集和多个聚类信号集;获取所述离散信号集中每个雷达信号与每个所述聚类信号集之间的相关距离;其中,所述相关距离表征雷达信号与所述聚类信号集的离散度,且所述相关距离与所述离散度正相关;基于所述相关距离,从所述离散信号集中确定与每个所述聚类信号集对应的参考信号集。通过上述方式,本申请能够提高对雷达信号进行分选的准确性。
-
公开(公告)号:CN115630274A
公开(公告)日:2023-01-20
申请号:CN202211399016.5
申请日:2022-11-09
Applicant: 科大讯飞股份有限公司
IPC: G06F18/00 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种通信辐射源的识别方法、装置、存储介质及计算设备,涉及通信技术领域,该方法包括:采集来自于通信辐射源的第一原始波形信号;利用特征提取网络从第一原始波形信号提取通信辐射源的特征,该特征提取网络包括深度神经网络,该深度神经网络包括过滤层,该过滤层包括用于获取设定频率范围的电磁信号的一组带通滤波器;将通信辐射源的特征输入分类器,获得通信辐射源的识别结果。该方法从原始波形信号中直接提取通信辐射源的特征,使得提取的特征能够适用于不同的场景和任务,同时,深度神经网络的过滤层包括用于获取设定频率范围的电磁信号的一组带通滤波器,从而增加提取的特征的可解释性,提升通信辐射源识别的准确度。
-
公开(公告)号:CN109862313B
公开(公告)日:2022-01-14
申请号:CN201811518639.3
申请日:2018-12-12
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种视频浓缩方法及装置,该方法包括:获取包括多个运动目标的待浓缩视频,随后为各个浓缩图像选择运动目标组合方式,该各个浓缩图像是对待浓缩视频进行浓缩后得到的各个帧图像,以便根据各个浓缩图像中的运动目标组合方式,对待浓缩视频进行视频浓缩。可见,本申请可以为每一帧浓缩图像选择一种合理的运动目标组合方式,从而使每帧浓缩图像中的各个运动目标能够最大限度的占据图像空间、并使每帧浓缩图像中的不同运动目标之间的重叠程度尽量小,进而提高浓缩视频的浓缩精度。
-
公开(公告)号:CN110084229B
公开(公告)日:2021-10-08
申请号:CN201910228663.1
申请日:2019-03-25
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种印章检测方法、装置、设备及可读存储介质,首先获取待检测图像,然后从待检测图像中检测疑似印章区域,获得疑似印章区域集合,最后基于真实印章的固有特征,从疑似印章区域集合中确定真实印章区域。本申请提供的印章检测方法能够基于印章的固有特征自动对待检测图像进行印章检测,这种检测方式不但节省了人工成本,而且提高了印章检测效率,并且,本申请提供的印章检测方法具有较高的检测准确度。
-
公开(公告)号:CN110164417B
公开(公告)日:2021-07-06
申请号:CN201910470489.1
申请日:2019-05-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语种向量获得、语种识别的方法和相关装置,该方法包括:将各个长时语音数据切分获得短时语音片段,利用全变量因子分析技术得到各个语音数据和各个语音片段的语种向量;基于各个语音数据和各个语音片段的语种向量进行时长干扰属性投影处理获得时长干扰投影矩阵;利用时长干扰投影矩阵将各个语音数据的语种向量映射为各个语音数据的新语种向量。可见,该方法充分有效挖掘长时语音数据和短时语音片段的相互关联信息。即使短时语音数据利用上述全变量空间和时长干扰投影矩阵进行时长因素补偿也能够得到更加精准、稳定的新语种向量,从而提高短时语音语种识别的准确性。
-
公开(公告)号:CN109358317B
公开(公告)日:2021-06-08
申请号:CN201811159847.9
申请日:2018-09-30
Applicant: 科大讯飞股份有限公司
IPC: G01S5/24
Abstract: 本申请提供了一种鸣笛信号检测方法、装置、设备及可读存储介质,方法包括:获取麦克风阵列采集的声音信号;对声音信号进行预处理,预处理后的信号作为目标声音信号;利用预先建立的鸣笛信号判别模型和/或预先设定的鸣笛信号判别规则,判别目标声音信号中是否存在鸣笛信号,其中,鸣笛信号判别规则根据鸣笛信号的特点设定。本申请提供的鸣笛信号检测方法能够自动检测出目标声音信号中是否存在鸣笛信号,并且在检测时由于充分利用了鸣笛信号的特点/特征,因此,鸣笛信号的检测准确率较高,检测效果较好。
-
公开(公告)号:CN108198574B
公开(公告)日:2020-12-08
申请号:CN201711475093.3
申请日:2017-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供的变声检测方法及装置,获取待与目标对象进行认证匹配的待测语音数据;利用预置的变声检测模型,确定与所述待测语音数据匹配的待测声纹特征信息,以及语音伪造判决结果;确定所述待测声纹特征信息与所述目标对象已注册的声纹特征信息的相似度,得到声纹相似度;根据所述语音伪造判决结果以及所述声纹相似度,确定所述待测语音数据是否为人工伪造的变声语音数据。本发明利用变声检测模型来确定与所述待测语音数据匹配的待测声纹特征信息,以及语音伪造判决结果,进而来实现待测语音数据的检测,大幅提高了待测语音数据的检测效率以及检测结果的精准度。
-
公开(公告)号:CN110517698A
公开(公告)日:2019-11-29
申请号:CN201910837580.2
申请日:2019-09-05
Applicant: 科大讯飞股份有限公司 , 咪咕数字传媒有限公司
Abstract: 本申请提供了一种声纹模型的确定方法、装置、设备及存储介质,其中,方法包括:获取目标语音的至少一个语谱片段,通过预先建立的声纹提取模型,确定每个语谱片段的至少一个第一特征图,其中,第一特征图中的各特征点相互独立,通过声纹提取模型,确定每个第一特征图对应的、包含其全局信息的第二特征图,获得每个语谱片段的至少一个第二特征图,其中,一个第一特征图对应的第二特征图为对该第一特征图中能够区分声纹的特征区域进行强化后的特征图;至少利用每个语谱片段的至少一个第二特征图,以及声纹提取模型,确定目标语音的声纹模型。本申请提供的声纹模型确定方法能够针对目标语音确定出稳定且精准的声纹模型。
-
公开(公告)号:CN109829356A
公开(公告)日:2019-05-31
申请号:CN201811482879.2
申请日:2018-12-05
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供了一种神经网络的训练方法及基于神经网络的行人属性识别方法,该识别方法包括:获取待识别的目标行人图像;对目标行人图像作身体区域分割,获取与不同身体区域对应的多个局部图像;将多个局部图像分别输入至预先经过训练的与不同身体区域相对应的多个属性识别网络,得到与不同身体区域对应的多组目标行人属性;其中,目标属性识别网络用于结合目标行人图像中行人的性别信息,以及目标局部图像中目标身体区域的方向信息,来识别目标行人图像中行人的全身属性,以及专属于目标身体区域的行人属性;对多组目标行人属性进行汇总处理,得到目标行人图像的多个目标行人属性。本发明能够在识别行人属性时,提升泛化能力以及识别准确度。
-
公开(公告)号:CN108345679A
公开(公告)日:2018-07-31
申请号:CN201810159175.5
申请日:2018-02-26
Applicant: 科大讯飞股份有限公司
IPC: G06F17/30
Abstract: 本申请提供了一种音视频检索方法、装置、设备及可读存储介质,方法包括:获取输入的检索词;在预先构建的文本文档库中确定包含检索词的目标文本文档,文本文档库中的每一文本文档由对应的音视频文件转写得到;对于每篇目标文本文档,从目标文本文档中确定与检索词相关的文本内容,获得每篇目标文本文档对应的文本内容;通过每篇目标文本文档对应的文本内容与检索词的相关度,以及各目标文本文档对应的音视频文件,确定检索结果。本申请去除了与检索词无关的内容对检索结果的影响,大大提高了检索准确度。
-
-
-
-
-
-
-
-
-