语音处理方法、装置、设备以及存储介质

    公开(公告)号:CN113823313A

    公开(公告)日:2021-12-21

    申请号:CN202110783691.7

    申请日:2021-07-12

    Abstract: 本申请公开了一种语音处理方法、装置、设备以及存储介质,属于计算机技术领域。通过本申请实施例提供的技术方案,在进行语音降噪时,无需通过结构复杂的模型进行噪声识别,直接基于语音数据的频域信息确定一个第一掩码,将第一掩码与语音数据的频谱结合,就能够得到目标语音数据,在保证降噪效果的同时,提高了语音降噪的速度,减少了计算资源的消耗。

    提醒任务的运行方法及装置

    公开(公告)号:CN113760665A

    公开(公告)日:2021-12-07

    申请号:CN202010484392.9

    申请日:2020-06-01

    Inventor: 高毅 郑锦良

    Abstract: 本发明提供了一种提醒任务的运行方法、装置、电子设备及计算机可读存储介质;应用于分布式系统,所述分布式系统包括多个服务器;方法包括:所述服务器接收被设定的多个提醒任务,并按照所接收的提醒任务的提醒时间所处的时间区间进行存储;将用于执行所述提醒任务的线程设置为阻塞状态,并尝试获取所述分布式系统中的分布式锁;当获取到所述分布式锁时,将处于所述阻塞状态的线程转换为可执行状态,并通过所述线程执行处于当前时间区间内的提醒任务,以发送与被执行的提醒任务相应的提醒消息;其中,所述当前时间区间为所述线程获取所述分布式锁时所处的时间区间。通过本发明,能够提供稳定的提醒服务。

    通话方法、装置、系统、服务器及存储介质

    公开(公告)号:CN111049848B

    公开(公告)日:2021-11-23

    申请号:CN201911334137.X

    申请日:2019-12-23

    Inventor: 高毅

    Abstract: 本申请实施例公开了一种通话方法、装置、系统、服务器及存储介质,属于互联网技术领域。该方法包括:获取至少三个第一终端发送的语音数据,语音数据携带指示信息,根据获取的至少三路语音数据的指示信息,从至少三路语音数据中选取至少两路目标语音数据,向第二终端发送至少两路目标语音数据,第二终端用于对至少两路目标语音数据进行解码,将解码后的至少两路目标语音数据进行混音,播放混音后的语音数据。该方法通过对接收到的至少三路语音数据进行选取,将选取的目标语音数据发送给终端,减少了发送的语音数据的数量,从而发送过程中减少了占用的网络带宽,节省了耗费的数据流量,提高了语音数据的传输速度,提升了通话质量。

    语音增强方法、装置、智能语音设备和计算机设备

    公开(公告)号:CN108615535B

    公开(公告)日:2020-08-11

    申请号:CN201810427071.8

    申请日:2018-05-07

    Abstract: 本申请提供一种语音增强方法、装置、智能语音设备和计算机设备,其中方法包括:获取待处理的语音信号;将语音信号输入语音增强模型,去除语音信号中的噪声和/或干扰语音,得到处理后的语音信号;语音增强模型,为根据混合语音信号进行训练得到的模型;混合语音信号,为在纯净唤醒词语音信号中添加噪声和/或干扰语音后得到的信号;纯净唤醒词语音信号为,噪声和干扰语音的占比小于比例阈值的唤醒词语音信号;语音增强模型能够有效去除语音信号中的噪声和干扰语音,例如与非唤醒词相关的语音,从而提高语音增强效果,对处理后的语音信号进行语音识别处理,提高唤醒词识别的准确度以及唤醒效率,提高用户的使用体验。

    日程创建方法、装置、设备及存储介质

    公开(公告)号:CN111126958A

    公开(公告)日:2020-05-08

    申请号:CN201911335604.0

    申请日:2019-12-23

    Inventor: 杨培艺 高毅 熊劲

    Abstract: 本申请公开了日程创建方法、装置、设备及存储介质,属于计算机技术领域。方法包括:在互动群组的互动页面显示候选时间;将确认选中的候选时间作为目标时间,显示与目标时间对应的目标互动信息,目标互动信息包括目标时间和投票选项;基于互动群组中的互动对象对投票选项的选择结果,创建与目标时间对应的目标日程。在互动群组中执行创建目标日程的过程,可以提高目标日程的创建效率;此外,由于目标日程是基于互动对象对投票选项的选择结果而创建的,所以可以减少目标日程的参与人员无法按时参与目标日程的现象,日程的创建效果较好。

    一种人工智能的音频数据处理方法及装置、存储介质

    公开(公告)号:CN110517679A

    公开(公告)日:2019-11-29

    申请号:CN201910809323.8

    申请日:2018-11-15

    Abstract: 本发明实施例提供了一种人工智能的音频数据处理方法及装置、存储介质,该方法包括:获取语音检测模型,所述语音检测模型为具有历史积累特性的至少一个检测通路的音频数据和语音识别结果的对应关系;当检测到的至少一个检测通路的数量为一个时,基于当前检测结果进行重置语音检测模型的重置时间点;当检测到的至少一个检测通路的数量为大于一个时,基于当前时间点进行重置语音检测模型的重置时间点;其中,所述重置时间点为在保证语音识别性能的情况下,初始化所述语音检测模型中的历史积累的时刻;在所述重置时间点到达时,重置所述语音检测模型。

    一种语音识别的方法、唤醒词检测的方法及装置

    公开(公告)号:CN110444210A

    公开(公告)日:2019-11-12

    申请号:CN201910756837.1

    申请日:2018-10-25

    Abstract: 本申请公开了一种唤醒词检测的方法,该方法应用于人工智能领域,具体可应用于语音识别领域,该方法包括:获取待识别语音信息,待识别语音信息中包含目标字集合,目标字集合由重复的至少两组目标词组成,每组目标词包括至少一个目标字;根据待识别语音信息获取目标语音特征向量;通过语音识别模型确定目标语音特征向量所对应的目标概率分值集合;若目标概率分值集合满足语音唤醒条件,则确定待识别语音信息包含目标唤醒词,目标唤醒词属于唤醒词集合中的一个唤醒词。本申请公开了一种唤醒词检测装置及终端设备。本申请提升叠词式唤醒词的检测性能,具有较高的唤醒率,以及较低的误唤醒率。

    一种人工智能的数据检测方法及装置、存储介质

    公开(公告)号:CN110415698A

    公开(公告)日:2019-11-05

    申请号:CN201910809813.8

    申请日:2018-11-15

    Abstract: 本发明实施例提供了一种人工智能的数据检测方法及装置、存储介质,该方法包括:获取待检测音频数据;当检测到的检测通路的主检测通路和备份检测通路时,通过重置和启动控制器控制主检测通路的重置,以及控制备份检测通路的重置和启动,得到每个检测通路的重置后语音检测模型;利用重置后语音检测模型对主检测通路和备份检测通路的待检测音频数据进行识别,得到主检测通路的主检测结果和备份检测通路备份检测结果;将主检测结果和备份检测结果进行综合处理后,输出总检测结果。

    一种方位角估计的方法、设备及存储介质

    公开(公告)号:CN110164423A

    公开(公告)日:2019-08-23

    申请号:CN201810887965.5

    申请日:2018-08-06

    Abstract: 本申请公开了一种方位角估计的方法,包括:获取多通路采样信号并缓存所述多通路采样信号;对所述多通路采样信号中每路采样信号进行唤醒词检测,并确定每路采样信号的唤醒词检测得分;若根据所述每路采样信号的唤醒词检测得分确定存在所述唤醒词,则对缓存的所述多通路采样信号进行空间谱估计,以得到空间谱估计结果,所述唤醒词包含于目标语音;根据所述空间谱估计结果和最高的唤醒词检测得分,确定所述目标语音的方位角。本申请技术方案由于采用唤醒词辅助估计目标语音的方位角,从而提高了语音交互过程中方位角估计的准确性。

Patent Agency Ranking