多语种免切换交互方法、装置以及电子设备

    公开(公告)号:CN116486784A

    公开(公告)日:2023-07-25

    申请号:CN202310081913.X

    申请日:2023-01-16

    Abstract: 本发明公开了一种多语种免切换交互方法、装置以及电子设备,将多个语种的数据联合训练多语种语音识别模型,基于多语种共性特征混合建模,实现多语言无缝免切换语音交互,具体地,将输入的混合语种语音音频特征送入端到端的多语种语音识别模型中,从中获取多语种的共性特征及差异特征,并结合二者进行声学建模及语言解码,输出对应各语种的转写文本及语种标签,最后利用转写文本及语种标签进行语义理解并执行交互操作。本发明无需依赖人为切换,且消除了不同语种在语音识别、语义理解、语音合成方面的差异,尤其是无需切换,直接对混合语种的语音交互进行综合识别、理解,由此可以显著提升人机交互体验。

    语音处理方法及相关装置、电子设备、存储介质

    公开(公告)号:CN114898755A

    公开(公告)日:2022-08-12

    申请号:CN202210824381.X

    申请日:2022-07-14

    Abstract: 本申请公开了一种语音处理方法及相关装置、电子设备、存储介质,其中,语音处理方法包括:获取持续至当前时刻的空白语音的语音时长,并判断语音时长是否不小于首个检测时长;响应于语音时长不小于首个检测时长,基于截止至当前时刻采集到的有效语音,获取语音处理结果,并基于空白语音的端点时刻,确定参考时刻;将最新使用的检测时长的下一检测时长,作为参考时长,并判断从参考时刻开始持续采集参考时长的参考语音是否仍空白;若是且所有检测时长均已使用,则将最新获取的语音处理结果置为有效。上述方案,能够提升语音交互的响应速度。

    输入识别方法、装置、电子设备和存储介质

    公开(公告)号:CN112801239A

    公开(公告)日:2021-05-14

    申请号:CN202110116416.X

    申请日:2021-01-28

    Inventor: 徐小玉 童鹏 邢猛

    Abstract: 本发明提供一种输入识别方法、装置、电子设备和存储介质,其中方法包括:基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别,得到意图识别结果;其中,当前应用场景类型用于表征当前输入行为识别结果的预期应用场景的类型,环境语种用于表征当前输入行为所处的语言环境;基于意图识别结果以及当前输入行为的手写识别结果,确定当前输入行为的识别结果。本发明实施例提供的输入识别方法、装置、电子设备和存储介质,基于当前输入行为对应的当前应用场景类型和/或环境语种进行输入意图识别,并综合得到的意图识别结果与当前输入行为的手写识别结果,得到当前输入行为的识别结果,提高了手写输入识别的准确性。

    语音交互方法及相关装置、设备、系统和存储介质

    公开(公告)号:CN116386639A

    公开(公告)日:2023-07-04

    申请号:CN202310091983.3

    申请日:2023-01-17

    Abstract: 本申请公开了一种语音交互方法及相关装置、设备、系统和存储介质,其中,语音交互方法包括:获取语音交互场景的拍摄图像和采集语音;基于拍摄图像进行检测,得到拍摄图像中目标对象的视线注视情况和唇部运动情况;基于唇部运动情况,从采集语音中提取目标对象的目标语音,并获取语音交互场景中交互设备的控制指令与目标语音的语义匹配情况;响应于视线注视情况包括目标对象的视线注视交互设备且存在语义匹配情况满足预设要求的控制指令,控制交互设备执行语义匹配情况满足预设要求的控制指令。上述方案,能够在语音交互之前免于语音唤醒,提升语音交互的便利性,同时提升语音交互的准确性。

    日语语音模型的训练方法以及交互方法、存储介质、设备

    公开(公告)号:CN115662399A

    公开(公告)日:2023-01-31

    申请号:CN202211321530.7

    申请日:2022-10-26

    Abstract: 本发明公开了一种日语语音模型的训练方法以及交互方法、存储介质、设备,该模型的训练方法包括:获取第一训练集,利用其中多个日语语音信息训练初始语音识别模型,得到目标语音识别模型,语音识别模型用于识别日语语音信息对应的文本;获取第二训练集,利用其中多组表记信息训练初始语义识别模型,得到目标语义识别模型,表记信息包括文本音素序列和由汉字文本表记、假名文本表记中至少一者组成的表记方式,语义识别模型用于识别文本中字或词在文本中的语义含义;将目标语音识别模型与目标语义识别模型拼接,得到日语语音交互模型。由此,能够从多种表记方式的文本中正确提取语义信息,提高语义识别正确率,并使其更符合人们日常阅读和书写习惯。

    语音处理方法及相关装置、电子设备、存储介质

    公开(公告)号:CN114898755B

    公开(公告)日:2023-01-17

    申请号:CN202210824381.X

    申请日:2022-07-14

    Abstract: 本申请公开了一种语音处理方法及相关装置、电子设备、存储介质,其中,语音处理方法包括:获取持续至当前时刻的空白语音的语音时长,并判断语音时长是否不小于首个检测时长;响应于语音时长不小于首个检测时长,基于截止至当前时刻采集到的有效语音,获取语音处理结果,并基于空白语音的端点时刻,确定参考时刻;将最新使用的检测时长的下一检测时长,作为参考时长,并判断从参考时刻开始持续采集参考时长的参考语音是否仍空白;若是且所有检测时长均已使用,则将最新获取的语音处理结果置为有效。上述方案,能够提升语音交互的响应速度。

    一种车机输入法按键候选项推荐的方法和相关装置

    公开(公告)号:CN111522451A

    公开(公告)日:2020-08-11

    申请号:CN202010326338.1

    申请日:2020-04-23

    Abstract: 本申请公开了一种车机输入法按键候选项推荐的方法和相关装置,该方法包括:在监测到车辆加速度之前实时获取用户点击手指与车机输入法按键的距离,若距离小于预设距离将对应的车机输入法按键确定为目标按键;当监测到车辆加速度信息后,基于车辆加速度信息获得用户点击手指的偏移位移信息;基于偏移位移信息对用户点击手指的实际点击位置进行调整,将调整后点击位置对应的车机输入法按键确定为预测按键;基于目标按键和预测按键进行车机输入法按键候选项推荐。针对车辆产生加速度的场景,在车辆产生加速度之前判断是否存在目标按键,在车辆产生加速度后判断预测按键,提供车机输入法按键候选项,提高用户点击车机输入法按键的准确性。

    一种语音交互方法、装置、电子设备和存储介质

    公开(公告)号:CN116403578A

    公开(公告)日:2023-07-07

    申请号:CN202310268457.X

    申请日:2023-03-15

    Abstract: 本申请公开了一种语音交互方法、装置、电子设备和存储介质,该方法包括:获取到第一待识别语音以及若干历史语音交互数据;其中,历史语音交互数据包括历史识别语音和历史识别文本,历史识别文本为用户从历史识别语音对应的参考识别文本中选择的,参考识别文本为基于对历史识别语音进行语音识别得到的;确定第一待识别语音与各历史识别语音的匹配情况;基于与第一待识别语音匹配的历史识别语音对应的历史识别文本,对用户进行响应。通过上述方式,本申请能够提高语音交互的准确性。

    语音交互方法、装置、电子设备和计算机可读存储介质

    公开(公告)号:CN116403577A

    公开(公告)日:2023-07-07

    申请号:CN202310268452.7

    申请日:2023-03-15

    Abstract: 本申请公开了一种语音交互方法、装置、电子设备和计算机可读存储介质,该方法包括:对第一待识别语音进行语音识别,得到第一待识别语音的语音意图以及对应第一待识别语音的若干第一初始识别文本;基于语音意图对若干第一初始识别文本进行过滤,得到第一目标识别文本,并在显示界面展示第一目标识别文本;响应于用户对任一第一目标识别文本的选择,基于用户选择的第一目标识别文本,对用户进行响应。通过上述方式,本申请能够提高语音交互的准确性。

    一种智能救援系统
    10.
    发明授权

    公开(公告)号:CN113734087B

    公开(公告)日:2022-10-04

    申请号:CN202110948611.9

    申请日:2021-08-18

    Abstract: 本申请公开了一种智能救援系统,该智能救援系统包括:处理系统与充气阻碍装置,处理系统用于在判断出当前目标车辆处于预设状态时,生成第一触发信号;充气阻碍装置与处理系统连接,用于在接收到第一触发信号后,展开在目标车辆的周围,以对目标车辆进行保护。通过上述方式,本申请能够在事故发生后对目标车辆进行保护,防止再次发生碰撞,提升安全性。

Patent Agency Ranking