-
公开(公告)号:CN113448975B
公开(公告)日:2023-01-17
申请号:CN202110578744.1
申请日:2021-05-26
Applicant: 科大讯飞股份有限公司
IPC: G06F16/23 , G06V10/762 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种人物画像库的更新方法、装置、系统和存储介质,该方法包括:对获取到的语音序列进行特征提取处理,得到新声纹特征;判断新声纹特征与人物画像库中的声纹特征是否匹配;若匹配失败,则基于当前匹配失败的次数判定是否满足第一聚类触发条件;若满足第一聚类触发条件,则对新声纹特征进行聚类处理,得到第一聚类结果,基于第一聚类结果将新声纹特征注册到人物画像库中。通过上述方式,本申请能够实现自动将新说话人的信息注册到人物画像库,且保护用户的隐私。
-
公开(公告)号:CN116046888A
公开(公告)日:2023-05-02
申请号:CN202211730308.2
申请日:2022-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种设备破裂检测方法、装置、电子设备和存储介质。方法包括:确定待检测设备的采集数据,所述采集数据包括声音数据和图像数据,所述声音数据是采集所述待检测设备的敲击声音得到的;基于所述采集数据,对所述待检测设备进行破裂检测,得到设备检测结果。本发明提供的方法、装置、电子设备和存储介质,基于包括声音数据和图像数据的采集数据,对待检测设备进行破裂检测,从而提高设备破裂检测的准确性,且声音数据是采集待检测设备的敲击声音得到的,从而进一步提高设备破裂检测的准确性。
-
公开(公告)号:CN115394287A
公开(公告)日:2022-11-25
申请号:CN202210892864.3
申请日:2022-07-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种混合语种语音识别方法、装置、系统及存储介质,其中,该混合语种语音识别方法包括以下步骤:获取待识别语音信息;对所述待识别语音信息进行语种识别,以确定所述待识别语音信息的语种信息;当所述语种信息包括目标语种时,将所述待识别语音信息输入到已训练的转写模型中,以将所述待识别语音信息转换为文本信息,所述目标语种包括第一语种和第二语种,所述文本信息中包括所述第一语种和所述第二语种对应的混合语种文本信息。通过本申请的方法使得获得的文本信息的准确性更高,能够输出多语种语音混合的识别结果,提升用户的使用体验。
-
公开(公告)号:CN113448975A
公开(公告)日:2021-09-28
申请号:CN202110578744.1
申请日:2021-05-26
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种人物画像库的更新方法、装置、系统和存储介质,该方法包括:对获取到的语音序列进行特征提取处理,得到新声纹特征;判断新声纹特征与人物画像库中的声纹特征是否匹配;若匹配失败,则基于当前匹配失败的次数判定是否满足第一聚类触发条件;若满足第一聚类触发条件,则对新声纹特征进行聚类处理,得到第一聚类结果,基于第一聚类结果将新声纹特征注册到人物画像库中。通过上述方式,本申请能够实现自动将新说话人的信息注册到人物画像库,且保护用户的隐私。
-
公开(公告)号:CN109543020B
公开(公告)日:2022-11-04
申请号:CN201811426774.5
申请日:2018-11-27
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F40/30 , G10L15/26
Abstract: 本发明公开了一种问询处理方法及系统,其中,所述处理方法包括:在对目标回答人进行问询时,实时将问答语音进行转写,得到以问答对为单位的问答文本;根据所述问答文本中问答对的单词数和句子数,实时计算当前问答对的复杂度;结合当前问答对的复杂度,获取当前问答对的文本特征向量;将目标回答人的当前问答对的文本特征向量与其他回答人的问答对的文本特征向量进行相似度比对;将比对结果按预设的需求策略进行展示。本发明能够实现在线协同处理,提升办案、办公的效率;而且由于采用了成熟的语音处理技术,不仅能大幅节省人力和时间成本,还能够确保处理的准确度,降低误判率。
-
公开(公告)号:CN114254634B
公开(公告)日:2025-01-03
申请号:CN202111529005.X
申请日:2021-12-14
Applicant: 科大讯飞股份有限公司
Inventor: 王培养
IPC: G06F40/289 , G06F40/40 , G06F40/194
Abstract: 本申请公开了一种多媒体数据的挖掘方法、装置、存储介质及设备,涉及数据挖掘技术领域,该方法包括获取少数民族语音的多媒体数据的转写结果和翻译结果,以及获取第一关键词和第二关键词,第一关键词为官方语音的关键词,第二关键词为翻译得到的少数民族语言的关键词;根据转写结果和翻译结果,结合第一关键词和第二关键词,获得多数媒体数据中存在关键词片段的置信度,然后根据多数媒体数据中存在关键词片段的置信度和关键词识别门限,获得识别结果,该识别结果包括多媒体数据中识别到的关键词。可见,该方法能够实现对少数民族语言的多媒体数据的挖掘。
-
公开(公告)号:CN114254634A
公开(公告)日:2022-03-29
申请号:CN202111529005.X
申请日:2021-12-14
Applicant: 科大讯飞股份有限公司
Inventor: 王培养
IPC: G06F40/289 , G06F40/40 , G06F40/194
Abstract: 本申请公开了一种多媒体数据的挖掘方法、装置、存储介质及设备,涉及数据挖掘技术领域,该方法包括获取少数民族语音的多媒体数据的转写结果和翻译结果,以及获取第一关键词和第二关键词,第一关键词为官方语音的关键词,第二关键词为翻译得到的少数民族语言的关键词;根据转写结果和翻译结果,结合第一关键词和第二关键词,获得多数媒体数据中存在关键词片段的置信度,然后根据多数媒体数据中存在关键词片段的置信度和关键词识别门限,获得识别结果,该识别结果包括多媒体数据中识别到的关键词。可见,该方法能够实现对少数民族语言的多媒体数据的挖掘。
-
公开(公告)号:CN109543020A
公开(公告)日:2019-03-29
申请号:CN201811426774.5
申请日:2018-11-27
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F17/28 , G10L15/26
Abstract: 本发明公开了一种问询处理方法及系统,其中,所述处理方法包括:在对目标回答人进行问询时,实时将问答语音进行转写,得到以问答对为单位的问答文本;根据所述问答文本中问答对的单词数和句子数,实时计算当前问答对的复杂度;结合当前问答对的复杂度,获取当前问答对的文本特征向量;将目标回答人的当前问答对的文本特征向量与其他回答人的问答对的文本特征向量进行相似度比对;将比对结果按预设的需求策略进行展示。本发明能够实现在线协同处理,提升办案、办公的效率;而且由于采用了成熟的语音处理技术,不仅能大幅节省人力和时间成本,还能够确保处理的准确度,降低误判率。
-
公开(公告)号:CN112233680B
公开(公告)日:2024-02-13
申请号:CN202011033828.9
申请日:2020-09-27
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种说话人角色识别方法、装置、电子设备及存储介质,通过待识别的说话人语音片段的语音特征与经声学特征确定的说话人语音属性特征相结合,对说话人角色进行识别,使得识别过程考虑的因素更加全面,可以保证角色识别的效果,使得角色识别的结果更加准确,同时也使得识别结果更加可信。
-
公开(公告)号:CN112233680A
公开(公告)日:2021-01-15
申请号:CN202011033828.9
申请日:2020-09-27
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种说话人角色识别方法、装置、电子设备及存储介质,通过待识别的说话人语音片段的语音特征与经声学特征确定的说话人语音属性特征相结合,对说话人角色进行识别,使得识别过程考虑的因素更加全面,可以保证角色识别的效果,使得角色识别的结果更加准确,同时也使得识别结果更加可信。
-
-
-
-
-
-
-
-
-