-
公开(公告)号:CN118571241A
公开(公告)日:2024-08-30
申请号:CN202411053564.1
申请日:2024-08-02
Applicant: 深圳波洛斯科技有限公司
Abstract: 本发明提供了一种基于DNN降噪技术的窗口对讲系统,涉及窗口对讲系统技术领域,所述系统包括:获取每一目标噪声语音样本,以得到目标噪声语音样本集A;获取每一噪声语音对应的目标纯净语音样本,以得到A对应的目标纯净语音集B;确定每一目标噪声语音对应的语音特征向量,以得到目标噪声语音特征向量列表TA;对TA中的语音特征向量进行聚类,以得到语音类别列表C;根据A、B和C,得到训练样本组集D;将D输入至预设的初始DNN模型,以得到目标DNN模型;获取待降噪语音W以及W对应的语音类别CW;将W和CW输入至目标DNN模型,以得到纯净语音;本发明在实现对噪声语音降噪的同时,提高语音降噪的效率和准确性。
-
公开(公告)号:CN117558269A
公开(公告)日:2024-02-13
申请号:CN202410040171.0
申请日:2024-01-11
Applicant: 深圳波洛斯科技有限公司
Abstract: 本申请涉及声音识别技术领域,特别是涉及一种声音识别方法、装置、介质和电子设备。该方法包括:获取预处理后的待识别声音;对上述待识别声音进行特征提取,得到待识别声音对应的待识别特征向量;将上述待识别特征向量输入目标卷积神经网络模型,得到对应的声音类别;根据上述声音类别遍历预设映射表,得到目标声音识别模型;将上述待识别声音输入至上述目标声音识别模型,输出待识别声音对应的文字。本申请对不同声音类别的待识别声音进行分类处理,每一声音类别均有对应的声音识别模型,由此,利用不同声音识别模型针对性处理不同口音的待识别声音,识别的结果的准确度更高。
-
公开(公告)号:CN117079634B
公开(公告)日:2023-12-22
申请号:CN202311332015.3
申请日:2023-10-16
Applicant: 深圳波洛斯科技有限公司
IPC: G10K11/178 , G10L25/30
Abstract: 本发明公开了一种音频主动降噪方法,涉及主动降噪技术领域,依据音频段的噪声特征,从预先构建的滤波器库中匹配出对应的滤波器,以其分别对各个音频段进行过滤并获取滤后音频,通过测试结果筛选出降噪效果最佳的降噪方案;由降噪后音频的降噪结果建立降噪质量集合,由所述降噪质量集合生成降噪后音频的噪声指数No(n,d)后,若其低于质量阈值,向外部发出预警信息;训练获取瑕疵音频段的噪声模型,对瑕疵音频段的降噪过程进行仿真测试,获取测试方案的修正方案,以修正方案对瑕疵音频段进行降噪,获取降噪后音频。对瑕疵音频进行降噪时针对性更强,提高降噪的效果,使经过一次滤波和两次降噪的音频质量达到最高。
-
公开(公告)号:CN119028309B
公开(公告)日:2025-02-14
申请号:CN202411453169.2
申请日:2024-10-17
Applicant: 深圳波洛斯科技有限公司
IPC: G10K11/178 , G10L15/20 , G10L15/24 , G10L15/26
Abstract: 本发明提供了一种基于DNN降噪技术的车载多音区系统,涉及车载多音区系统技术领域,所述新系统包括:获取目标车辆的屏蔽区域内的初始音频,使用预设的DNN降噪模型对初始音频进行降噪,以得到初始用户语音;提取初始用户语音中的每一关键词,进而根据初始用户语音中的每一关键词以及初始用户语音对应的用户在车内所坐的座位,以及该座位对应的区域的图像,并结合后排区域用户的数量,确定初始用户语音是否为目标用户语音;将目标用户语音通过设置于主驾区域的音频设备进行播放;本发明能够在不关闭屏蔽功能的前提下,有针对性的将用户说给司机的语音通过音频设备播放给司机,从而简化用户语音沟通的过程,提高车内驾乘人员语音沟通的效率。
-
公开(公告)号:CN118984438A
公开(公告)日:2024-11-19
申请号:CN202411453168.8
申请日:2024-10-17
Applicant: 深圳波洛斯科技有限公司
IPC: H04R27/00
Abstract: 本申请涉及音频处理技术领域,特别是涉及一种基于AES音频处理的本地扩音系统。其中,所述音频采集模块用于采集每一初始音频信号,以得到初始音频信号列表Y;所述音频评分模块用于根据Y内的每一初始音频信号,得到对应的初始音频难度评分列表集F;所述音频处理模块用于根据Y、F和预设的多核音频处理器内的每一处理器核心的当前计算资源剩余率,将每一初始音频信号分配至对应的处理器核心进行音频处理,得到对应的目标音频信号列表M;所述本地扩音模块用于根据M,对每一目标音频信号进行本地扩音。本申请使得处理器核心的负载(计算资源总占用率)尽量均衡,节约整体的音频处理时间,确保了音频信号无延迟、高质量地实现本地扩音。
-
公开(公告)号:CN118571241B
公开(公告)日:2024-09-27
申请号:CN202411053564.1
申请日:2024-08-02
Applicant: 深圳波洛斯科技有限公司
Abstract: 本发明提供了一种基于DNN降噪技术的窗口对讲系统,涉及窗口对讲系统技术领域,所述系统包括:获取每一目标噪声语音样本,以得到目标噪声语音样本集A;获取每一噪声语音对应的目标纯净语音样本,以得到A对应的目标纯净语音集B;确定每一目标噪声语音对应的语音特征向量,以得到目标噪声语音特征向量列表TA;对TA中的语音特征向量进行聚类,以得到语音类别列表C;根据A、B和C,得到训练样本组集D;将D输入至预设的初始DNN模型,以得到目标DNN模型;获取待降噪语音W以及W对应的语音类别CW;将W和CW输入至目标DNN模型,以得到纯净语音;本发明在实现对噪声语音降噪的同时,提高语音降噪的效率和准确性。
-
公开(公告)号:CN117558269B
公开(公告)日:2024-03-15
申请号:CN202410040171.0
申请日:2024-01-11
Applicant: 深圳波洛斯科技有限公司
Abstract: 本申请涉及声音识别技术领域,特别是涉及一种声音识别方法、装置、介质和电子设备。该方法包括:获取预处理后的待识别声音;对上述待识别声音进行特征提取,得到待识别声音对应的待识别特征向量;将上述待识别特征向量输入目标卷积神经网络模型,得到对应的声音类别;根据上述声音类别遍历预设映射表,得到目标声音识别模型;将上述待识别声音输入至上述目标声音识别模型,输出待识别声音对应的文字。本申请对不同声音类别的待识别声音进行分类处理,每一声音类别均有对应的声音识别模型,由此,利用不同声音识别模型针对性处理不同口音的待识别声音,识别的结果的准确度更高。
-
公开(公告)号:CN118972716B
公开(公告)日:2025-01-10
申请号:CN202411453172.4
申请日:2024-10-17
Applicant: 深圳波洛斯科技有限公司
IPC: H04Q5/24 , G10L15/22 , G10L15/26 , G10L17/02 , G10L17/08 , G10L21/0232 , G16H80/00 , G06F40/216 , G06F40/295 , G06F40/30
Abstract: 本发明涉及医疗语音通信技术领域,公开了一种基于音频处理的医疗对讲系统及方法,该系统包括:音频采集模块、音频定位模块、需求确定模块、指令生成模块、指令分配模块、响应人员确定模块、指令发送模块和响应处理模块。通过实施本发明,以智能语音识别和语义分析技术自动解析呼叫音频中的需求类型数据和紧急等级,实现资源的精准分配和优先处理,确保关键需求得到及时响应,精准定位患者位置并识别患者需求,迅速匹配到最合适的响应团队。
-
公开(公告)号:CN118972868B
公开(公告)日:2024-12-13
申请号:CN202411453166.9
申请日:2024-10-17
Applicant: 深圳波洛斯科技有限公司
IPC: H04W16/20 , H04B17/318 , H04B17/391
Abstract: 本发明提供了一种基于AES音频处理技术的无线传输方法,涉及无线传输技术领域,所述方法包括:确定无线信号从目标厂房的发射端到接收端的无线信号衰减率;获取每一种摆放形态的物体对应的无线信号衰减率,结合不摆放物体时每一预设环境因素对应的无线信号衰减率,确定受不同摆放形态的物体影响的无线信号衰减率;确定发射端在当前的环境因素以及物体摆放形态下对应的最佳的目标发射功率;本发明能够在确保音频信号无线传输稳定性的前提下,自适应的确定发射端的无线信号发射功率,避免发射端的发射功率一直处于最大发射功率的状态,进而延缓无线信号发射设备的老化,增加无线信号发射设备的使用寿命。
-
公开(公告)号:CN118963603A
公开(公告)日:2024-11-15
申请号:CN202411453164.X
申请日:2024-10-17
Applicant: 深圳波洛斯科技有限公司
IPC: G06F3/0481 , G06N3/0464 , G06N3/08 , G10L15/20 , G10L15/22 , G10L21/0208 , G10L25/30
Abstract: 本发明涉及智能面板技术领域,公开了一种基于DNN降噪技术的智能面板控制方法,包括:利用预训练的第一卷积神经网络模型对语音交互数据进行降噪处理,得到降噪语音交互数据;对图像交互数据和降噪语音交互数据进行分析,得到用户指令数据;基于用户指令数据和情境标签对待控智能面板的显示内容数据和界面布局数据进行调整;基于调整后的显示内容数据和调整后的界面布局数据控制待控智能面板显示交互界面。通过实施本发明,融合多源数据,包括图像、语音、环境数据和人员行为数据,使得智能面板能够更精准地响应用户的操作,解决智能面板控制方法在数据处理和情境适应性等方面存在明显不足,难以满足现代医院对智能化管理与控制的高要求的问题。
-
-
-
-
-
-
-
-
-