-
公开(公告)号:CN110517698A
公开(公告)日:2019-11-29
申请号:CN201910837580.2
申请日:2019-09-05
Applicant: 科大讯飞股份有限公司 , 咪咕数字传媒有限公司
Abstract: 本申请提供了一种声纹模型的确定方法、装置、设备及存储介质,其中,方法包括:获取目标语音的至少一个语谱片段,通过预先建立的声纹提取模型,确定每个语谱片段的至少一个第一特征图,其中,第一特征图中的各特征点相互独立,通过声纹提取模型,确定每个第一特征图对应的、包含其全局信息的第二特征图,获得每个语谱片段的至少一个第二特征图,其中,一个第一特征图对应的第二特征图为对该第一特征图中能够区分声纹的特征区域进行强化后的特征图;至少利用每个语谱片段的至少一个第二特征图,以及声纹提取模型,确定目标语音的声纹模型。本申请提供的声纹模型确定方法能够针对目标语音确定出稳定且精准的声纹模型。
-
公开(公告)号:CN110517698B
公开(公告)日:2022-02-01
申请号:CN201910837580.2
申请日:2019-09-05
Applicant: 科大讯飞股份有限公司 , 咪咕数字传媒有限公司
Abstract: 本申请提供了一种声纹模型的确定方法、装置、设备及存储介质,其中,方法包括:获取目标语音的至少一个语谱片段,通过预先建立的声纹提取模型,确定每个语谱片段的至少一个第一特征图,其中,第一特征图中的各特征点相互独立,通过声纹提取模型,确定每个第一特征图对应的、包含其全局信息的第二特征图,获得每个语谱片段的至少一个第二特征图,其中,一个第一特征图对应的第二特征图为对该第一特征图中能够区分声纹的特征区域进行强化后的特征图;至少利用每个语谱片段的至少一个第二特征图,以及声纹提取模型,确定目标语音的声纹模型。本申请提供的声纹模型确定方法能够针对目标语音确定出稳定且精准的声纹模型。
-
公开(公告)号:CN111241267B
公开(公告)日:2022-12-06
申请号:CN202010025465.8
申请日:2020-01-10
Applicant: 科大讯飞股份有限公司
IPC: G06F16/34
Abstract: 本申请公开了一种摘要提取和摘要抽取模型训练方法及相关装置、存储介质,其中,摘要提取方法包括:对文本进行分句得到句子列表,按照预设长度对句子列表按照顺序进行窗口划分得到多个窗口,且预设长度为摘要抽取模型支持的最大序列长度,每个窗口包括多个连续的句子且长度小于或等于预设长度,相邻的两个窗口包括至少一个相同的句子,利用摘要抽取模型分别对每个窗口进行预测,得到每个窗口中每个句子的重要性得分,利用每个窗口中每个句子的重要性得分确定文本中每个句子的重要性得分,选择按重要性得分从高到低排序靠前的至少一个句子作为文本的摘要。上述方案,能够提高摘要提取的质量。
-
公开(公告)号:CN110164417A
公开(公告)日:2019-08-23
申请号:CN201910470489.1
申请日:2019-05-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语种向量获得、语种识别的方法和相关装置,该方法包括:将各个长时语音数据切分获得短时语音片段,利用全变量因子分析技术得到各个语音数据和各个语音片段的语种向量;基于各个语音数据和各个语音片段的语种向量进行时长干扰属性投影处理获得时长干扰投影矩阵;利用时长干扰投影矩阵将各个语音数据的语种向量映射为各个语音数据的新语种向量。可见,该方法充分有效挖掘长时语音数据和短时语音片段的相互关联信息。即使短时语音数据利用上述全变量空间和时长干扰投影矩阵进行时长因素补偿也能够得到更加精准、稳定的新语种向量,从而提高短时语音语种识别的准确性。
-
公开(公告)号:CN111241267A
公开(公告)日:2020-06-05
申请号:CN202010025465.8
申请日:2020-01-10
Applicant: 科大讯飞股份有限公司
IPC: G06F16/34
Abstract: 本申请公开了一种摘要提取和摘要抽取模型训练方法及相关装置、存储介质,其中,摘要提取方法包括:对文本进行分句得到句子列表,按照预设长度对句子列表按照顺序进行窗口划分得到多个窗口,且预设长度为摘要抽取模型支持的最大序列长度,每个窗口包括多个连续的句子且长度小于或等于预设长度,相邻的两个窗口包括至少一个相同的句子,利用摘要抽取模型分别对每个窗口进行预测,得到每个窗口中每个句子的重要性得分,利用每个窗口中每个句子的重要性得分确定文本中每个句子的重要性得分,选择按重要性得分从高到低排序靠前的至少一个句子作为文本的摘要。上述方案,能够提高摘要提取的质量。
-
公开(公告)号:CN115630274A
公开(公告)日:2023-01-20
申请号:CN202211399016.5
申请日:2022-11-09
Applicant: 科大讯飞股份有限公司
IPC: G06F18/00 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种通信辐射源的识别方法、装置、存储介质及计算设备,涉及通信技术领域,该方法包括:采集来自于通信辐射源的第一原始波形信号;利用特征提取网络从第一原始波形信号提取通信辐射源的特征,该特征提取网络包括深度神经网络,该深度神经网络包括过滤层,该过滤层包括用于获取设定频率范围的电磁信号的一组带通滤波器;将通信辐射源的特征输入分类器,获得通信辐射源的识别结果。该方法从原始波形信号中直接提取通信辐射源的特征,使得提取的特征能够适用于不同的场景和任务,同时,深度神经网络的过滤层包括用于获取设定频率范围的电磁信号的一组带通滤波器,从而增加提取的特征的可解释性,提升通信辐射源识别的准确度。
-
公开(公告)号:CN110164417B
公开(公告)日:2021-07-06
申请号:CN201910470489.1
申请日:2019-05-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语种向量获得、语种识别的方法和相关装置,该方法包括:将各个长时语音数据切分获得短时语音片段,利用全变量因子分析技术得到各个语音数据和各个语音片段的语种向量;基于各个语音数据和各个语音片段的语种向量进行时长干扰属性投影处理获得时长干扰投影矩阵;利用时长干扰投影矩阵将各个语音数据的语种向量映射为各个语音数据的新语种向量。可见,该方法充分有效挖掘长时语音数据和短时语音片段的相互关联信息。即使短时语音数据利用上述全变量空间和时长干扰投影矩阵进行时长因素补偿也能够得到更加精准、稳定的新语种向量,从而提高短时语音语种识别的准确性。
-
公开(公告)号:CN111524502B
公开(公告)日:2024-04-30
申请号:CN202010460914.1
申请日:2020-05-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种语种检测方法、装置、设备及存储介质,该方法包括:获取待检测语音数据的各个语音数据段的声学特征;基于预先构建的正交化投影空间,分别将所述各个语音数据段的声学特征映射为语种表征特征;其中,所述正交化投影空间中的指定语种的投影空间与非指定语种的投影空间不重叠;根据所述各个语音数据段的语种表征特征,确定所述各个语音数据段的语种为指定语种或非指定语种。上述方案通过提取待检测语音数据中的各个语音数据段的语种表征特征,来识别各个语音数据段的语种为指定语种或非指定语种。当待检测语音数据为包含混合语种的语音数据时,通过执行上述方案,可以从待检测语音数据中检测出不同语种的语音数据段。
-
公开(公告)号:CN111524502A
公开(公告)日:2020-08-11
申请号:CN202010460914.1
申请日:2020-05-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种语种检测方法、装置、设备及存储介质,该方法包括:获取待检测语音数据的各个语音数据段的声学特征;基于预先构建的正交化投影空间,分别将所述各个语音数据段的声学特征映射为语种表征特征;其中,所述正交化投影空间中的指定语种的投影空间与非指定语种的投影空间不重叠;根据所述各个语音数据段的语种表征特征,确定所述各个语音数据段的语种为指定语种或非指定语种。上述方案通过提取待检测语音数据中的各个语音数据段的语种表征特征,来识别各个语音数据段的语种为指定语种或非指定语种。当待检测语音数据为包含混合语种的语音数据时,通过执行上述方案,可以从待检测语音数据中检测出不同语种的语音数据段。
-
-
-
-
-
-
-
-