机器人的语音合成方法、装置和机器人系统

    公开(公告)号:CN117351935A

    公开(公告)日:2024-01-05

    申请号:CN202311444418.7

    申请日:2023-11-01

    Abstract: 本申请涉及一种机器人的语音合成方法、装置和机器人系统,其中,该机器人的语音合成方法包括:从语音合成服务器中下载分句集合中当前分句的语音合成结果;其中,分句集合为预先基于预设的分句规则对待合成文本进行分句得到;在播放当前分句的语音合成结果的同时,判断语音合成服务器是否完成分句集合中下一条分句的语音合成,若是,则从语音合成服务器中下载下一条分句的语音合成结果。通过本申请,能够实现语音文本的合成、下载以及播放的并行执行,从而降低了播放之前等待语音文本合成和下载的时长,进而提高了机器人语音播放的效率。

    基于干扰噪声空间谱矩阵的语音信号波束成形方法

    公开(公告)号:CN116312602B

    公开(公告)日:2023-10-03

    申请号:CN202211565066.6

    申请日:2022-12-07

    Abstract: 本发明公开了一种基于干扰噪声空间谱矩阵的语音信号波束成形方法与装置。本发明基于麦克风阵列流形矢量计算球面扩散噪声的空间谱矩阵;在麦克风没有检测到语音信号时,计算背景噪声的空间谱矩阵;在麦克风检测到语音信号后,计算信号空间谱矩阵;基于麦克风阵列流形矢量和信号空间谱矩阵对Capon空间谱进行积分,计算干扰语音信号的空间谱矩阵;球面扩散噪声的空间谱矩阵、背景噪声的空间谱矩阵、干扰语音信号的空间谱矩阵叠加得到干扰噪声空间谱矩阵;对干扰噪声空间谱矩阵进行特征值分解,获取特征向量和噪声功率估计值,并以此更新干扰噪声空间谱矩阵;并结合线性约束最小方差波束形成得到波束增强的语音信号。

    基于干扰噪声空间谱矩阵的语音信号波束成形方法

    公开(公告)号:CN116312602A

    公开(公告)日:2023-06-23

    申请号:CN202211565066.6

    申请日:2022-12-07

    Abstract: 本发明公开了一种基于干扰噪声空间谱矩阵的语音信号波束成形方法与装置。本发明基于麦克风阵列流形矢量计算球面扩散噪声的空间谱矩阵;在麦克风没有检测到语音信号时,计算背景噪声的空间谱矩阵;在麦克风检测到语音信号后,计算信号空间谱矩阵;基于麦克风阵列流形矢量和信号空间谱矩阵对Capon空间谱进行积分,计算干扰语音信号的空间谱矩阵;球面扩散噪声的空间谱矩阵、背景噪声的空间谱矩阵、干扰语音信号的空间谱矩阵叠加得到干扰噪声空间谱矩阵;对干扰噪声空间谱矩阵进行特征值分解,获取特征向量和噪声功率估计值,并以此更新干扰噪声空间谱矩阵;并结合线性约束最小方差波束形成得到波束增强的语音信号。

    混合声源分离方法、装置、计算机设备以及可读存储介质

    公开(公告)号:CN119380743B

    公开(公告)日:2025-03-25

    申请号:CN202411931790.5

    申请日:2024-12-26

    Abstract: 本申请涉及一种混合声源分离方法、装置、计算机设备以及可读存储介质。所述方法包括:获取多个混合声源信号,所述混合声源信号为声源重叠的多通道信号;将各所述混合声源信号输入神经网络模型,输出得到多个通道的分离声源信号;计算两两通道间所述分离声源信号的相似性,将相似性大于设定阈值的分离声源信号聚合为同一个单声源信号,所述单声源信号包括至少两个通道的分离声源信号;基于各所述单声源信号,生成每个所述单声源信号的单通道信号。采用本方法能够实现高分辨率的声源信号分离。

    面向深海场景的声呐点云语义理解深度学习网络调制方法

    公开(公告)号:CN119538073A

    公开(公告)日:2025-02-28

    申请号:CN202510099896.1

    申请日:2025-01-22

    Abstract: 本发明公开了一种面向深海场景的声呐点云语义理解深度学习网络调制方法,该方法包括:对预训练好的语义理解网络进行特征统计分析,确定不同目标类别的特征向量;并基于SHAP归因分析确定关键特征分量,建立特征解释器;同时,将人类对于深海点云语义理解的先验知识形式化为逻辑表达式,在推理过程中结合特征解释器预分类结果进行目标中间特征的调制修正,以实现更优的语义分类结果。本发明通过数据与知识双驱动实现知识增强深度学习,有助于提高声呐点云语义理解网络在复杂深海环境中的适应性和准确性,优化模型的语义分类结果,避免不合理的幻觉输出。

    混合声源分离方法、装置、计算机设备以及可读存储介质

    公开(公告)号:CN119380743A

    公开(公告)日:2025-01-28

    申请号:CN202411931790.5

    申请日:2024-12-26

    Abstract: 本申请涉及一种混合声源分离方法、装置、计算机设备以及可读存储介质。所述方法包括:获取多个混合声源信号,所述混合声源信号为声源重叠的多通道信号;将各所述混合声源信号输入神经网络模型,输出得到多个通道的分离声源信号;计算两两通道间所述分离声源信号的相似性,将相似性大于设定阈值的分离声源信号聚合为同一个单声源信号,所述单声源信号包括至少两个通道的分离声源信号;基于各所述单声源信号,生成每个所述单声源信号的单通道信号。采用本方法能够实现高分辨率的声源信号分离。

    面向深海场景的声呐点云语义理解深度学习网络调制方法

    公开(公告)号:CN119538073B

    公开(公告)日:2025-05-13

    申请号:CN202510099896.1

    申请日:2025-01-22

    Abstract: 本发明公开了一种面向深海场景的声呐点云语义理解深度学习网络调制方法,该方法包括:对预训练好的语义理解网络进行特征统计分析,确定不同目标类别的特征向量;并基于SHAP归因分析确定关键特征分量,建立特征解释器;同时,将人类对于深海点云语义理解的先验知识形式化为逻辑表达式,在推理过程中结合特征解释器预分类结果进行目标中间特征的调制修正,以实现更优的语义分类结果。本发明通过数据与知识双驱动实现知识增强深度学习,有助于提高声呐点云语义理解网络在复杂深海环境中的适应性和准确性,优化模型的语义分类结果,避免不合理的幻觉输出。

    基于子阵列信号增强的多声源定位方法和装置

    公开(公告)号:CN118376980B

    公开(公告)日:2024-08-30

    申请号:CN202410806449.0

    申请日:2024-06-21

    Abstract: 本发明公开了一种基于子阵列信号增强的多声源定位方法和装置,包括:根据声源定位频率分别设计小孔径子阵列和以小孔径子阵列的参考点组成的大孔径阵列;基于参考点麦克风的声信号计算多个声源在各聚焦点的第一自谱矩阵,并找出第一峰值最大的声源作为当前峰值最大的声源;根据当前峰值最大的声源对各小孔径子阵列的各自参考点进行增强;基于各参考点的增强信号构建虚拟大孔径阵列的复声压向量,并计算当前峰值最大的声源在各聚焦点的第二自谱矩阵后修正当前峰值最大的声源;根据第一自谱矩阵和第二自谱矩阵计算更新后的自谱矩阵后找出其他峰值最大的声源作为当前峰值最大的声源;重复上述过程,实现准确定位经过修正的所有声源。

    基于子阵列信号增强的多声源定位方法和装置

    公开(公告)号:CN118376980A

    公开(公告)日:2024-07-23

    申请号:CN202410806449.0

    申请日:2024-06-21

    Abstract: 本发明公开了一种基于子阵列信号增强的多声源定位方法和装置,包括:根据声源定位频率分别设计小孔径子阵列和以小孔径子阵列的参考点组成的大孔径阵列;基于参考点麦克风的声信号计算多个声源在各聚焦点的第一自谱矩阵,并找出第一峰值最大的声源作为当前峰值最大的声源;根据当前峰值最大的声源对各小孔径子阵列的各自参考点进行增强;基于各参考点的增强信号构建虚拟大孔径阵列的复声压向量,并计算当前峰值最大的声源在各聚焦点的第二自谱矩阵后修正当前峰值最大的声源;根据第一自谱矩阵和第二自谱矩阵计算更新后的自谱矩阵后找出其他峰值最大的声源作为当前峰值最大的声源;重复上述过程,实现准确定位经过修正的所有声源。

    基于信号协方差矩阵重构的实时声源分离方法和装置

    公开(公告)号:CN117037836B

    公开(公告)日:2023-12-29

    申请号:CN202311278673.9

    申请日:2023-10-07

    Abstract: 基于信号协方差矩阵重构的实时声源分离方法与装置,其方法包括:检测到多个声源信号时,采用指数平滑方法计算混合信号的协方差矩阵;对混合信号的协方差矩阵作特征值分解,利用特征值计算不同频率分量的噪声功率;利用主要特征值向量构成的子空间和理论导向矢量,计算声源的导向矢量;利用混合信号协方差矩阵的特征值向量和特征值,计算混合信号协方差矩阵的逆矩阵;利用混合信号协方差矩阵的逆矩阵和声源的导向矢量,计算每个声源的功率,并按照协方差矩阵的定义重构每个声源的信号协方差矩阵;利用每个声源的信号协方差矩阵和信号的理论导向矢量,计算分离系数矩阵;基于混合声信号向量与分离系数矩阵得到分离后的声源信

Patent Agency Ranking