-
公开(公告)号:CN109087662A
公开(公告)日:2018-12-25
申请号:CN201811251321.3
申请日:2018-10-25
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0208 , G10L13/02 , G10L13/08 , H04L29/08
Abstract: 本申请公开了一种回声消除方法及装置,该方法包括:在第一时刻利用第一参考信号更新云端回声消除系统的参数,第一参考信号是云端服务器对第一用户指令进行响应后的语音合成结果;在第一时刻之后的第二时刻,若接收到客户端上传的麦克风信号和目标参考信号,则通过云端回声消除系统,利用目标参考信号对麦克风信号进行回声消除。可见,由于云端回声消除可以使用比本地更复杂的回声消除算法以及提前预估计回声消除滤波器参数,在对麦克风信号进行回声消除时,可以具有较好的回声消除效果。
-
公开(公告)号:CN107240398A
公开(公告)日:2017-10-10
申请号:CN201710538745.7
申请日:2017-07-04
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种智能语音交互方法及装置,该方法包括:获取人机交互语音数据,对人机交互语音数据进行语义理解,得到当前语义理解结果,然后判断当前语义理解结果是否可信,并对可信语义理解结果做出响应,当语义理解结果不可信时,基于存储的人人交互数据的相关信息对当前语义理解结果进行校正,得到校正后的语义理解结果,然后对所述校正后的语义理解结果做出响应。由于现有车载环境下的智能交互方法,只利用了人机交互信息,然而车内用户与其他乘客交谈,与他人打电话等过程中都隐含着与车机业务相关的信息,本发明采用人人交互数据的相关信息来校正人机交互中意图理解,提高对人机交互语音理解的正确率,提升用户体验。
-
公开(公告)号:CN111145721B
公开(公告)日:2024-02-13
申请号:CN201911276510.0
申请日:2019-12-12
Applicant: 科大讯飞股份有限公司
IPC: G10L13/04 , G10L13/047 , G06N20/00
Abstract: 本发明公开了一种个性化提示语生成方法、装置和设备。所述方法包括接收用户交互指令及个性化综合信息;根据用户交互指令、个性化综合信息及相应预设策略,确定目标提示语人设类别;再基于用户交互指令、个性化综合信息、目标提示语人设类别及相应预设策略,生成目标提示语文本;最后由目标提示语人设类别、目标提示语文本及相应预设策略,合成目标提示语。本发明将提示语生成过程中的各任务阶段与多维输入信息进行反复且多次的结合,从而确保各任务阶段均能满足个性化输出的需求,进而使得最终合成的语音内容及风格更为多样且人性化。因而,将本发明施用在不同的场景环境中,也会辅助提升相关应用的交互效率并由此改善交互产(56)对比文件EP 2800017 A2,2014.11.05CN 106652996 A,2017.05.10CN 102501823 A,2012.06.20
-
公开(公告)号:CN111681662B
公开(公告)日:2023-07-25
申请号:CN202010486703.5
申请日:2020-06-01
Applicant: 科大讯飞股份有限公司
IPC: G10L19/018 , H04L9/08
Abstract: 本发明公开了一种车内交互音频加密方法、装置及设备。本发明摒弃固定信息加密思路,基于车内音频交互所涉及的多种动态信息并采取多环节联合应用的思路,提出了一种具有很高安全性、可靠性的交互音频加密方案。具体是从用户的交互音频以及交互场景中至少提取到两种不同维度的动态信息,并将多种动态信息相互融合用于生成水印,而又以与交互音频内容相关的转写文本作为另一种动态信息,用于对音频进行相位调制,除此之外,还考虑综合上述各种动态信息生成相应秘钥,并以独立的传输通道分别向外发送秘钥和加密音频,这样,基于上述种种安全措施的联合应用,可以有效保护车内用户的个人信息乃至隐私,与现有方式相比,大大增加了非授权破解的难度。
-
公开(公告)号:CN107678309B
公开(公告)日:2021-07-06
申请号:CN201710781250.7
申请日:2017-09-01
Applicant: 科大讯飞股份有限公司
IPC: G05B19/04
Abstract: 本公开提供一种操控句式生成方法及装置、应用操控方法及装置、存储介质、电子设备。其中,操控句式生成方法包括:获取待操控应用支持的功能对应的原有词条,所述原有词条包括原有实体和/或原有意图;将所述原有词条、以及所述原有词条对应的扩展词条,确定为新增词条;判断能否在预设句式库中匹配到所述新增词条对应的相似词条;如果匹配到所述新增词条对应的相似词条,则将所述新增词条合并到所述相似词条所属的词条类中;根据所述相似词条所属的词条类与所述预设句式库中的其他词条类之间的映射关系,生成带有所述新增词条的操控句式。如此方案,可以自动生成操控句式,有助于提高操控句式生成的灵活性、可扩展性。
-
公开(公告)号:CN106483502B
公开(公告)日:2019-10-18
申请号:CN201610848492.9
申请日:2016-09-23
Applicant: 科大讯飞股份有限公司
IPC: G01S5/18 , G10L21/0272
Abstract: 本发明实施例提供了一种声源定位方法及装置,其中方法包括:监听不同方向的语音信号,其中来自目标声源方向的语音信号中包含有第一语音;通过对所述不同方向的语音信号进行语音分离得到两路语音信号;对所述两路语音信号分别进行声源追踪,以确定所述两路语音信号各自的声源方向;将所述两路语音信号形成两个波束,并根据所述两路语音信号的声源方向抑制非声源方向的干扰;通过在两个波束中对所述第一语音的识别区分出目标声源和干扰声源。本发明将语音分离和语音识别相结合,在多声源场景下可以很好地对目标声源进行定位,解决了存在干扰情况时目标声源无法定位的技术问题,进而提升了用户的满意度。
-
公开(公告)号:CN107862004A
公开(公告)日:2018-03-30
申请号:CN201711001907.X
申请日:2017-10-24
Applicant: 科大讯飞股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30867 , G06F17/3087
Abstract: 本公开提供一种智能排序方法及装置、存储介质、电子设备。该方法包括:获取交互指令以及交互指令对应的响应结果;提取排序特征信息,所述排序特征信息包括:用于表示所述交互指令的指令特征,以及用于表示所述响应结果的响应特征;将所述排序特征信息作为输入,经排序模型处理后,输出各响应结果与用户偏好的相关性得分;按照所述相关性得分,对所述响应结果进行排序。如此方案,更能反映用户的个人偏好,使排序结果更具针对性,有助于提高用户体验。
-
公开(公告)号:CN107316643A
公开(公告)日:2017-11-03
申请号:CN201710539227.7
申请日:2017-07-04
Applicant: 科大讯飞股份有限公司
CPC classification number: G10L15/1822 , G06F17/2785 , G10L15/22 , G10L2015/223
Abstract: 本发明公开了一种语音交互方法及装置,该方法包括:在接收语音识别文本之后,将所述语音识别文本分别分发到各业务中,并分别进行语义理解,然后基于得到的语义理解结果、客户端所处应用状态进行置信度排序,获取置信度最高的语义理解结果,对所述置信度最高的语义理解结果做出响应。由于基于多维度的信息进行语义理解结果的置信度排序,不仅考虑了语义理解结果与各业务的匹配度,还同时考虑了客户端所处应用状态,例如是否处于导航状态或听音乐状态,客户端所处应用及应用状态可能就是语音交互所要处理的对象,因此,基于多维度的信息进行语义理解可以有效提升判断其业务所属的准确度,提高对人机交互语义理解的正确率,提升用户体验。
-
公开(公告)号:CN114495959B
公开(公告)日:2024-11-29
申请号:CN202111531077.8
申请日:2021-12-14
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0208 , G10L21/0216 , G06V40/16 , H04N7/18
Abstract: 一种语音增强方法、装置和系统,该方法包括:获取目标接待人员接待目标客户的过程的录音音频,其中所述录音音频是由佩戴在所述目标接待人员身上的拾音设备拾取的;获取与所述录音音频同一时段的监控视频,从所述监控视频中确定出所述目标接待人员和其他人员;根据所述目标接待人员从所述其他人员中确定出所述目标客户;确定所述目标客户在所述时段内相对于所述目标接待人员的方位信息,并根据所述方位信息确定降噪参数;根据所述降噪参数对所述录音音频进行降噪处理。本申请将拾音设备放置在接待过程中涉及的两个对象中的一个对象身上,结合监控视频锁定该对象再定位另一对象,最终获得两者之间的相对方位用于降噪,能够得到高质量的降噪效果。
-
公开(公告)号:CN109087662B
公开(公告)日:2021-10-08
申请号:CN201811251321.3
申请日:2018-10-25
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0208 , G10L13/02 , G10L13/08 , H04L29/08
Abstract: 本申请公开了一种回声消除方法及装置,该方法包括:在第一时刻利用第一参考信号更新云端回声消除系统的参数,第一参考信号是云端服务器对第一用户指令进行响应后的语音合成结果;在第一时刻之后的第二时刻,若接收到客户端上传的麦克风信号和目标参考信号,则通过云端回声消除系统,利用目标参考信号对麦克风信号进行回声消除。可见,由于云端回声消除可以使用比本地更复杂的回声消除算法以及提前预估计回声消除滤波器参数,在对麦克风信号进行回声消除时,可以具有较好的回声消除效果。
-
-
-
-
-
-
-
-
-