-
公开(公告)号:CN114495959A
公开(公告)日:2022-05-13
申请号:CN202111531077.8
申请日:2021-12-14
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0208 , G10L21/0216 , G06V40/16 , H04N7/18
Abstract: 一种语音增强方法、装置和系统,该方法包括:获取目标接待人员接待目标客户的过程的录音音频,其中所述录音音频是由佩戴在所述目标接待人员身上的拾音设备拾取的;获取与所述录音音频同一时段的监控视频,从所述监控视频中确定出所述目标接待人员和其他人员;根据所述目标接待人员从所述其他人员中确定出所述目标客户;确定所述目标客户在所述时段内相对于所述目标接待人员的方位信息,并根据所述方位信息确定降噪参数;根据所述降噪参数对所述录音音频进行降噪处理。本申请将拾音设备放置在接待过程中涉及的两个对象中的一个对象身上,结合监控视频锁定该对象再定位另一对象,最终获得两者之间的相对方位用于降噪,能够得到高质量的降噪效果。
-
公开(公告)号:CN107678309A
公开(公告)日:2018-02-09
申请号:CN201710781250.7
申请日:2017-09-01
Applicant: 科大讯飞股份有限公司
IPC: G05B19/04
CPC classification number: G05B19/04
Abstract: 本公开提供一种操控句式生成方法及装置、应用操控方法及装置、存储介质、电子设备。其中,操控句式生成方法包括:获取待操控应用支持的功能对应的原有词条,所述原有词条包括原有实体和/或原有意图;将所述原有词条、以及所述原有词条对应的扩展词条,确定为新增词条;判断能否在预设句式库中匹配到所述新增词条对应的相似词条;如果匹配到所述新增词条对应的相似词条,则将所述新增词条合并到所述相似词条所属的词条类中;根据所述相似词条所属的词条类与所述预设句式库中的其他词条类之间的映射关系,生成带有所述新增词条的操控句式。如此方案,可以自动生成操控句式,有助于提高操控句式生成的灵活性、可扩展性。
-
公开(公告)号:CN107329730A
公开(公告)日:2017-11-07
申请号:CN201710533680.7
申请日:2017-07-03
Applicant: 科大讯飞股份有限公司
IPC: G06F3/16
Abstract: 本申请实公开了语音提示信息生成方法及装置。所述方法包括:接收用户的交互指令;基于所述交互指令获得最佳POI点;确定与所述最佳POI点相匹配的选定语音信息生成模板;将所述最佳POI点所包含的信息填充至所述选定语音信息生成模板中,从而生成与交互指令相对应的语音提示信息。采用本申请所提供的语音提示信息生成方法及装置等,可以在检索到的POI点复杂的情况下,获得最佳POI点并使用与最佳POI点相匹配的选定语音信息生成模板生成语音提示信息,从而可以在检索到的POI点复杂多样的情况下,也能够使用语音信息呈现交互结果,减少用户在使用人机交互系统使用过程中出现视线脱离驾驶视野情况,从而减少驾驶的危险性。
-
公开(公告)号:CN116486784A
公开(公告)日:2023-07-25
申请号:CN202310081913.X
申请日:2023-01-16
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种多语种免切换交互方法、装置以及电子设备,将多个语种的数据联合训练多语种语音识别模型,基于多语种共性特征混合建模,实现多语言无缝免切换语音交互,具体地,将输入的混合语种语音音频特征送入端到端的多语种语音识别模型中,从中获取多语种的共性特征及差异特征,并结合二者进行声学建模及语言解码,输出对应各语种的转写文本及语种标签,最后利用转写文本及语种标签进行语义理解并执行交互操作。本发明无需依赖人为切换,且消除了不同语种在语音识别、语义理解、语音合成方面的差异,尤其是无需切换,直接对混合语种的语音交互进行综合识别、理解,由此可以显著提升人机交互体验。
-
公开(公告)号:CN116308637A
公开(公告)日:2023-06-23
申请号:CN202310172582.0
申请日:2023-02-23
Applicant: 科大讯飞股份有限公司
IPC: G06Q30/0601 , G06F40/151 , G06F40/205 , G06F40/47
Abstract: 本发明公开了一种产品合规自动配置方法、装置以及电子设备,本发明的主要构思在于,结合人工智能领域的文本处理技术,通过预先构建的合规法规文本模型,从不同国家的原始法规文本中提取出预设的若干规定条文,将抽出的规定条文文本与预设的产品配置信息进行对应关联,锁定待调整配置的目标信息,进而基于该特定的法规条文填入或修改对应的产品配置信息。本发明从根本上解决了目前针对软硬件产品进行合规处理时,过于依赖人工产生的诸如效率慢、准确性相对不稳定且影响整个产品研发至销售全周期进度的问题。
-
公开(公告)号:CN107316643B
公开(公告)日:2021-08-17
申请号:CN201710539227.7
申请日:2017-07-04
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种语音交互方法及装置,该方法包括:在接收语音识别文本之后,将所述语音识别文本分别分发到各业务中,并分别进行语义理解,然后基于得到的语义理解结果、客户端所处应用状态进行置信度排序,获取置信度最高的语义理解结果,对所述置信度最高的语义理解结果做出响应。由于基于多维度的信息进行语义理解结果的置信度排序,不仅考虑了语义理解结果与各业务的匹配度,还同时考虑了客户端所处应用状态,例如是否处于导航状态或听音乐状态,客户端所处应用及应用状态可能就是语音交互所要处理的对象,因此,基于多维度的信息进行语义理解可以有效提升判断其业务所属的准确度,提高对人机交互语义理解的正确率,提升用户体验。
-
公开(公告)号:CN114261251B
公开(公告)日:2024-04-09
申请号:CN202111497876.8
申请日:2021-12-09
Applicant: 科大讯飞股份有限公司
IPC: B60G17/015 , B60G17/018
Abstract: 本发明提供一种目标车辆悬架控制方法、系统、车辆、设备及存储介质,所述方法包括:当所述目标车辆在行驶至距离目标地点为预设距离时,通过预设方式得到悬架调节参数,所述悬架调节参数是根据所述目标车辆的特征信息和所维护的所述目标地点的特征信息计算得到;根据所述悬架调节参数调节自身悬架,以行驶通过所述目标地点。本发明可以提前将确定好的悬架调节参数下发给该目标车辆,以便于目标车辆能够提前对悬架做出自动控制,使得车辆在通过不平路段时可降低车内的震感,并能提高车辆驾乘人员的舒适性和车辆的行驶平顺性。
-
公开(公告)号:CN115662399A
公开(公告)日:2023-01-31
申请号:CN202211321530.7
申请日:2022-10-26
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种日语语音模型的训练方法以及交互方法、存储介质、设备,该模型的训练方法包括:获取第一训练集,利用其中多个日语语音信息训练初始语音识别模型,得到目标语音识别模型,语音识别模型用于识别日语语音信息对应的文本;获取第二训练集,利用其中多组表记信息训练初始语义识别模型,得到目标语义识别模型,表记信息包括文本音素序列和由汉字文本表记、假名文本表记中至少一者组成的表记方式,语义识别模型用于识别文本中字或词在文本中的语义含义;将目标语音识别模型与目标语义识别模型拼接,得到日语语音交互模型。由此,能够从多种表记方式的文本中正确提取语义信息,提高语义识别正确率,并使其更符合人们日常阅读和书写习惯。
-
公开(公告)号:CN114261251A
公开(公告)日:2022-04-01
申请号:CN202111497876.8
申请日:2021-12-09
Applicant: 科大讯飞股份有限公司
IPC: B60G17/015 , B60G17/018
Abstract: 本发明提供一种目标车辆悬架控制方法、系统、车辆、设备及存储介质,所述方法包括:当所述目标车辆在行驶至距离目标地点为预设距离时,通过预设方式得到悬架调节参数,所述悬架调节参数是根据所述目标车辆的特征信息和所维护的所述目标地点的特征信息计算得到;根据所述悬架调节参数调节自身悬架,以行驶通过所述目标地点。本发明可以提前将确定好的悬架调节参数下发给该目标车辆,以便于目标车辆能够提前对悬架做出自动控制,使得车辆在通过不平路段时可降低车内的震感,并能提高车辆驾乘人员的舒适性和车辆的行驶平顺性。
-
公开(公告)号:CN107240398B
公开(公告)日:2020-11-17
申请号:CN201710538745.7
申请日:2017-07-04
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种智能语音交互方法及装置,该方法包括:获取人机交互语音数据,对人机交互语音数据进行语义理解,得到当前语义理解结果,然后判断当前语义理解结果是否可信,并对可信语义理解结果做出响应,当语义理解结果不可信时,基于存储的人人交互数据的相关信息对当前语义理解结果进行校正,得到校正后的语义理解结果,然后对所述校正后的语义理解结果做出响应。由于现有车载环境下的智能交互方法,只利用了人机交互信息,然而车内用户与其他乘客交谈,与他人打电话等过程中都隐含着与车机业务相关的信息,本发明采用人人交互数据的相关信息来校正人机交互中意图理解,提高对人机交互语音理解的正确率,提升用户体验。
-
-
-
-
-
-
-
-
-