语音唤醒模型的更新方法、系统和介质

    公开(公告)号:CN116543758B

    公开(公告)日:2023-09-15

    申请号:CN202310762127.6

    申请日:2023-06-27

    Abstract: 本发明公开了一种语音唤醒模型的更新方法、系统和介质。该方法包括:获取计算节点集合中每个计算节点对应的私有模型和测试数据库;其中,所有计算节点位于同一个区域内;按照预设融合算法对私有模型进行融合,得到对应的目标增强模型;将测试数据库中的测试数据分别输入至每个私有模型和目标增强模型,得到对应的第一实际唤醒准确率和第二实际唤醒准确率;基于第一实际唤醒准确率、第二实际唤醒准确率和唤醒准确率差值阈值对每个计算节点的私有模型进行更新。本发明实现了通过处于同一个区域内的多个计算节点对自身实际工况下创建的私有数据库进行共享,并采用这些数据对基础模型进行增量训练,从而提升了在噪声环境下语音唤醒的准确率和稳定性。

    车用语音唤醒方法、装置、电子设备及存储介质

    公开(公告)号:CN115035896B

    公开(公告)日:2023-05-23

    申请号:CN202210609856.3

    申请日:2022-05-31

    Abstract: 本发明公开了一种车用语音唤醒方法、装置、电子设备及存储介质,该方法包括:获取目标车辆的车联网数据以及预设帧数的座舱语音数据;根据所述车联网数据,确定车联网编码数据,并根据所述座舱语音数据,确定音频特征编码数据;根据所述车联网编码数据以及所述音频特征编码数据,确定特征融合数据;将所述特征融合数据输入至预先训练完成的唤醒模型中,得到与所述特征融合数据相对应的唤醒数据;其中,所述唤醒模型基于多尺度深度可分时域卷积网络构建;基于所述唤醒数据,对所述目标车辆的语音交互系统进行处理。通过本发明实施例的技术方案,实现了提高车用语音唤醒的场景适应性,并提高用户体验度的技术效果。

    噪声生成模型训练方法、装置、设备及介质

    公开(公告)号:CN115035911A

    公开(公告)日:2022-09-09

    申请号:CN202210614008.1

    申请日:2022-05-31

    Abstract: 本申请实施例公开了一种噪声生成模型训练方法、装置、设备及介质。该方法包括:获取预设时间步长的参考噪声数据和期望噪声类别;将参考噪声数据和期望噪声类别输入至预设的噪声生成模型,以根据预设时间步长和期望噪声类别,生成期望类别特征,并提取参考噪声数据中的预测噪声特征,且根据期望类别特征和预测噪声特征,生成预设时间步长对应未来时刻的未来噪声数据;根据未来时刻的标准噪声数据和未来噪声数据,调整噪声生成模型中的待训练参数。本申请实施例提高了生成噪声的准确度,以及实现了对车辆行驶过程中噪声场景的全面覆盖。

    语音唤醒模型的更新方法、系统和介质

    公开(公告)号:CN116543758A

    公开(公告)日:2023-08-04

    申请号:CN202310762127.6

    申请日:2023-06-27

    Abstract: 本发明公开了一种语音唤醒模型的更新方法、系统和介质。该方法包括:获取计算节点集合中每个计算节点对应的私有模型和测试数据库;其中,所有计算节点位于同一个区域内;按照预设融合算法对私有模型进行融合,得到对应的目标增强模型;将测试数据库中的测试数据分别输入至每个私有模型和目标增强模型,得到对应的第一实际唤醒准确率和第二实际唤醒准确率;基于第一实际唤醒准确率、第二实际唤醒准确率和唤醒准确率差值阈值对每个计算节点的私有模型进行更新。本发明实现了通过处于同一个区域内的多个计算节点对自身实际工况下创建的私有数据库进行共享,并采用这些数据对基础模型进行增量训练,从而提升了在噪声环境下语音唤醒的准确率和稳定性。

    噪声生成模型训练方法、装置、设备及介质

    公开(公告)号:CN115035911B

    公开(公告)日:2023-05-02

    申请号:CN202210614008.1

    申请日:2022-05-31

    Abstract: 本申请实施例公开了一种噪声生成模型训练方法、装置、设备及介质。该方法包括:获取预设时间步长的参考噪声数据和期望噪声类别;将参考噪声数据和期望噪声类别输入至预设的噪声生成模型,以根据预设时间步长和期望噪声类别,生成期望类别特征,并提取参考噪声数据中的预测噪声特征,且根据期望类别特征和预测噪声特征,生成预设时间步长对应未来时刻的未来噪声数据;根据未来时刻的标准噪声数据和未来噪声数据,调整噪声生成模型中的待训练参数。本申请实施例提高了生成噪声的准确度,以及实现了对车辆行驶过程中噪声场景的全面覆盖。

    音乐可视化展示方法及装置

    公开(公告)号:CN115035909A

    公开(公告)日:2022-09-09

    申请号:CN202210613329.X

    申请日:2022-05-31

    Abstract: 本发明实施例公开了一种音乐可视化展示方法及装置。包括:获取可视化音乐界面的背景音乐,基于背景音乐的音频数据生成界面元素于可视化音乐界面的第一运动曲线;根据第一运动曲线确定界面元素的初始运动位置和运动变化位置,控制界面元素沿第一运动曲线从初始运动位置运动到运动变化位置;确定界面元素的运动结束位置,基于运动变化位置和运动结束位置生成界面元素的第二运动曲线,并控制界面元素沿第二运动曲线从运动变化位置运动至运动结束位置,解决了目前车载多媒体的音乐可视化展示方式存在表现形式过于单一,无法满足人们在音乐视觉方面上越来越高的需求问题,从而达到提升用户听音乐时的视觉感官体验和系统可玩性的技术效果。

Patent Agency Ranking