语音唤醒模型的更新方法、系统和介质

    公开(公告)号:CN116543758A

    公开(公告)日:2023-08-04

    申请号:CN202310762127.6

    申请日:2023-06-27

    Abstract: 本发明公开了一种语音唤醒模型的更新方法、系统和介质。该方法包括:获取计算节点集合中每个计算节点对应的私有模型和测试数据库;其中,所有计算节点位于同一个区域内;按照预设融合算法对私有模型进行融合,得到对应的目标增强模型;将测试数据库中的测试数据分别输入至每个私有模型和目标增强模型,得到对应的第一实际唤醒准确率和第二实际唤醒准确率;基于第一实际唤醒准确率、第二实际唤醒准确率和唤醒准确率差值阈值对每个计算节点的私有模型进行更新。本发明实现了通过处于同一个区域内的多个计算节点对自身实际工况下创建的私有数据库进行共享,并采用这些数据对基础模型进行增量训练,从而提升了在噪声环境下语音唤醒的准确率和稳定性。

    噪声生成模型训练方法、装置、设备及介质

    公开(公告)号:CN115035911B

    公开(公告)日:2023-05-02

    申请号:CN202210614008.1

    申请日:2022-05-31

    Abstract: 本申请实施例公开了一种噪声生成模型训练方法、装置、设备及介质。该方法包括:获取预设时间步长的参考噪声数据和期望噪声类别;将参考噪声数据和期望噪声类别输入至预设的噪声生成模型,以根据预设时间步长和期望噪声类别,生成期望类别特征,并提取参考噪声数据中的预测噪声特征,且根据期望类别特征和预测噪声特征,生成预设时间步长对应未来时刻的未来噪声数据;根据未来时刻的标准噪声数据和未来噪声数据,调整噪声生成模型中的待训练参数。本申请实施例提高了生成噪声的准确度,以及实现了对车辆行驶过程中噪声场景的全面覆盖。

    音乐可视化展示方法及装置

    公开(公告)号:CN115035909A

    公开(公告)日:2022-09-09

    申请号:CN202210613329.X

    申请日:2022-05-31

    Abstract: 本发明实施例公开了一种音乐可视化展示方法及装置。包括:获取可视化音乐界面的背景音乐,基于背景音乐的音频数据生成界面元素于可视化音乐界面的第一运动曲线;根据第一运动曲线确定界面元素的初始运动位置和运动变化位置,控制界面元素沿第一运动曲线从初始运动位置运动到运动变化位置;确定界面元素的运动结束位置,基于运动变化位置和运动结束位置生成界面元素的第二运动曲线,并控制界面元素沿第二运动曲线从运动变化位置运动至运动结束位置,解决了目前车载多媒体的音乐可视化展示方式存在表现形式过于单一,无法满足人们在音乐视觉方面上越来越高的需求问题,从而达到提升用户听音乐时的视觉感官体验和系统可玩性的技术效果。

    一种车内人员的情绪检测方法、装置、设备及介质

    公开(公告)号:CN119672754A

    公开(公告)日:2025-03-21

    申请号:CN202411522422.5

    申请日:2024-10-29

    Abstract: 本发明公开了一种车内人员的情绪检测方法、装置、设备及介质,涉及智能车辆技术领域,包括:获取目标乘车人员的至少一个面部关键点的类型和实时位置、目标乘车人员所处车内的空气质量数据;针对每一面部关键点,获取面部关键点的类型对应的正常位置变化区域;根据面部关键点的实时位置,以及空气质量数据,对面部关键点的类型对应的正常位置变化区域进行调整,得到调整位置区域;根据面部关键点的调整位置区域和面部关键点的实时位置,对面部关键点进行异常检测,得到面部关键点的位置异常检测结果;根据各面部关键点的位置异常检测结果,对目标乘车人员的情绪进行异常检测,确定目标乘车人员的情绪异常检测结果。本发明提高了车内人员的情绪检测的准确率。

Patent Agency Ranking