-
公开(公告)号:CN116466314A
公开(公告)日:2023-07-21
申请号:CN202310350067.7
申请日:2023-03-31
Applicant: 科大讯飞股份有限公司
IPC: G01S7/41
Abstract: 本申请公开了一种雷达个体分选方法、装置、存储介质及设备,该方法包括:首先将雷达脉冲序列划分为P个节拍;并在其中第n个节拍内获取每一脉冲描述字的预设维度的特征参数向量;然后对其进行聚类处理,得到第n个节拍包含的异常聚类簇和M个有效聚类簇;接着分别构建M个有效聚类簇对应的混合高斯模型;并依次从异常聚类簇中选取目标异常脉冲描述字,以计算其分别在这M个混合高斯模型中的最大似然度得分;进而从中选取最大得分,并判断其是否高于预设第一阈值;若是,则将目标异常脉冲描述字分选为最大得分对应的有效聚类簇;若否,则将其分选为异常聚类簇,依次类推,直至得到这P个节拍中所有脉冲描述字的分选结果,以有效提高分选准确率。
-
公开(公告)号:CN111128223B
公开(公告)日:2022-08-05
申请号:CN201911424875.3
申请日:2019-12-30
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0272 , G10L25/03
Abstract: 本申请实施例公开了一种基于文本信息的辅助说话人分离方法及相关装置,方法包括:获取待分离的第一语音信息;对待分离的第一语音信息进行第一分离处理,得到第一分离结果,第一分离处理是指对第一语音信息中的不同说话人进行初步分割和聚类;对第一分离结果进行语音处理,得到第二语音信息,语音处理包括语音识别或语音表征信息采集;将第二语音信息输入预先训练好的说话人转变点识别模型,确定第二语音信息中的说话人的转变点;根据说话人的转变点和第一分离结果得到目标分离结果。可见,本申请通过获取的第一语音信息获取文本信息,融合底层声学特征与文本信息进行说话人分离,提高说话人分离的准确性。
-
公开(公告)号:CN109840485B
公开(公告)日:2021-10-08
申请号:CN201910063138.9
申请日:2019-01-23
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种微表情特征提取方法、装置、设备及可读存储介质,其中,微表情特征提取方法包括:获取包含人脸区域的目标图像,其中,目标图像为待提取微表情特征的单幅图像,或者为待提取微表情特征的多幅图像中的任一幅图像,或者为待提取微表情特征的视频中的任一帧图像;从目标图像获取微表情预测特征,其中,微表情预测特征为目标图像中与微表情有关的特征;根据微表情预测特征和预先构建的微表情特征提取模型,确定目标图像中人脸的目标微表情特征。本申请提供的微表情特征提取方法能够从包含人脸区域的目标图像中提取出准确有效的微表情特征。
-
公开(公告)号:CN111524502A
公开(公告)日:2020-08-11
申请号:CN202010460914.1
申请日:2020-05-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种语种检测方法、装置、设备及存储介质,该方法包括:获取待检测语音数据的各个语音数据段的声学特征;基于预先构建的正交化投影空间,分别将所述各个语音数据段的声学特征映射为语种表征特征;其中,所述正交化投影空间中的指定语种的投影空间与非指定语种的投影空间不重叠;根据所述各个语音数据段的语种表征特征,确定所述各个语音数据段的语种为指定语种或非指定语种。上述方案通过提取待检测语音数据中的各个语音数据段的语种表征特征,来识别各个语音数据段的语种为指定语种或非指定语种。当待检测语音数据为包含混合语种的语音数据时,通过执行上述方案,可以从待检测语音数据中检测出不同语种的语音数据段。
-
公开(公告)号:CN108228574B
公开(公告)日:2020-07-28
申请号:CN201711288979.7
申请日:2017-12-07
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种文本翻译处理方法及装置,属于语言处理技术领域。该方法包括:若第一识别文本的识别置信度大于第一预设阈值且第一目标语言文本的翻译置信度不大于第二预设阈值,则对第一目标语言文本进行翻译,得到第二识别文本;若第一识别文本与第二识别文本之间语义不等价,获取关键名词及关键名词的类型;基于关键名词的类型对关键名词进行翻译,得到第一翻译结果,对第一识别文本中除关键名词之外的其它内容进行翻译,得到第二翻译结果,将第一翻译结果与第二翻译结果进行合并得到第二目标语言文本。由于可将第一识别文本中的关键名词作为一个整体分词,按照关键名词类型对关键名词进行翻译,从而可使得翻译结果更加准确。
-
公开(公告)号:CN109862313A
公开(公告)日:2019-06-07
申请号:CN201811518639.3
申请日:2018-12-12
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种视频浓缩方法及装置,该方法包括:获取包括多个运动目标的待浓缩视频,随后为各个浓缩图像选择运动目标组合方式,该各个浓缩图像是对待浓缩视频进行浓缩后得到的各个帧图像,以便根据各个浓缩图像中的运动目标组合方式,对待浓缩视频进行视频浓缩。可见,本申请可以为每一帧浓缩图像选择一种合理的运动目标组合方式,从而使每帧浓缩图像中的各个运动目标能够最大限度的占据图像空间、并使每帧浓缩图像中的不同运动目标之间的重叠程度尽量小,进而提高浓缩视频的浓缩精度。
-
公开(公告)号:CN109840485A
公开(公告)日:2019-06-04
申请号:CN201910063138.9
申请日:2019-01-23
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种微表情特征提取方法、装置、设备及可读存储介质,其中,微表情特征提取方法包括:获取包含人脸区域的目标图像,其中,目标图像为待提取微表情特征的单幅图像,或者为待提取微表情特征的多幅图像中的任一幅图像,或者为待提取微表情特征的视频中的任一帧图像;从目标图像获取微表情预测特征,其中,微表情预测特征为目标图像中与微表情有关的特征;根据微表情预测特征和预先构建的微表情特征提取模型,确定目标图像中人脸的目标微表情特征。本申请提供的微表情特征提取方法能够从包含人脸区域的目标图像中提取出准确有效的微表情特征。
-
公开(公告)号:CN109783684A
公开(公告)日:2019-05-21
申请号:CN201910072964.X
申请日:2019-01-25
Applicant: 科大讯飞股份有限公司
IPC: G06F16/70
Abstract: 本申请提供了一种视频的情感识别方法、装置、设备及可读存储介质,方法包括:获取待识别视频,并基于指定的边界划分依据对待识别视频进行粗粒度的边界划分,获得粗粒度视频片段;基于粗粒度视频片段的时空语义信息,对粗粒度视频片段进行细粒度的边界划分,获得细粒度视频片段;确定细粒度视频片段的至少一种情感识别结果,并通过细粒度视频片段的至少一种情感识别结果获得待识别视频的情感识别结果。本申请提供的情感识别方法具有较高的识别准确度。
-
公开(公告)号:CN109358317A
公开(公告)日:2019-02-19
申请号:CN201811159847.9
申请日:2018-09-30
Applicant: 科大讯飞股份有限公司
IPC: G01S5/24
Abstract: 本申请提供了一种鸣笛信号检测方法、装置、设备及可读存储介质,方法包括:获取麦克风阵列采集的声音信号;对声音信号进行预处理,预处理后的信号作为目标声音信号;利用预先建立的鸣笛信号判别模型和/或预先设定的鸣笛信号判别规则,判别目标声音信号中是否存在鸣笛信号,其中,鸣笛信号判别规则根据鸣笛信号的特点设定。本申请提供的鸣笛信号检测方法能够自动检测出目标声音信号中是否存在鸣笛信号,并且在检测时由于充分利用了鸣笛信号的特点/特征,因此,鸣笛信号的检测准确率较高,检测效果较好。
-
公开(公告)号:CN106446109A
公开(公告)日:2017-02-22
申请号:CN201610826545.7
申请日:2016-09-14
Applicant: 科大讯飞股份有限公司
CPC classification number: G06F17/30684 , G06F17/271 , G06K9/6215
Abstract: 本申请提出一种语音文件摘要的获取方法和装置,该语音文件摘要的获取方法包括:获取待处理的语音文件;对所述语音文件进行处理,得到所述语音文件对应的文本句子;计算所述文本句子的融合得分,其中,所述融合得分根据所述文本句子与所述语音文件对应的文本的主题的相似度及与前一个句子的相似度确定;根据所述融合得分在所述文本句子中选择需要个数的文本句子,并根据选择的文本句子组成所述语音文件的摘要。该方法能够提高获取语音文件摘要的效率,降低成本。
-
-
-
-
-
-
-
-
-