-
公开(公告)号:CN112133328B
公开(公告)日:2023-07-25
申请号:CN202010768627.7
申请日:2020-08-03
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了音频数据的测评信息生成方法和装置,涉及人工智能领域、大数据领域和深度学习领域。具体实现方案为:获取目标音频数据对应的目标频响曲线;将目标频响曲线与预设的多个标准频响曲线匹配,获取目标频响曲线与每个标准频响曲线的匹配度;根据匹配度在多个标准频响曲线中确定目标标准频响曲线;获取目标标准频响曲线对应的目标预设测评信息,并将预设测评信息作为音频数据的测评信息。由此,实现了音频数据的智能化测评,提高了音频数据的测评信息的生成效率,降低了生成成本。
-
公开(公告)号:CN112788278B
公开(公告)日:2023-04-07
申请号:CN202011643811.5
申请日:2020-12-30
Applicant: 北京百度网讯科技有限公司
IPC: H04N7/15 , H04N23/67 , G10L21/0208 , H04L65/403 , H04L65/60 , H04L65/80
Abstract: 本公开公开了一种视频流的生成方法、装置、设备及存储介质,涉及语音技术领域、视频处理技术领域、计算机视觉技术领域和深度学习技术领域。具体实现方案为:当监测到语音数据时,确定与语音数据对应的第一发言用户;控制预设摄像头对焦第一发言用户拍摄第一视频帧图像,并采集第一发言用户的第一发言数据;对第一发言数据中的噪音数据进行去噪处理,得到第一目标数据;根据第一目标数据和第一视频帧图像生成视频流。由此,在视频流传输场景下,聚焦发言人进行视频帧图像的拍摄,并且抑制非发言人的噪音,提高了视频流的质量,满足了多种场景下的视频需求。
-
公开(公告)号:CN109905808B
公开(公告)日:2021-12-07
申请号:CN201910189064.3
申请日:2019-03-13
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了用于调节智能语音设备的方法和装置。该方法的一具体实施方式包括:获取对智能语音设备播放的扫频信号进行采集所得到的频响曲线和总谐波失真曲线;获取对智能语音设备播放的语音信号进行采集所得到的音质;基于频响曲线、总谐波失真曲线和音质,调节智能语音设备,以平衡智能语音设备的音频播放能力和语音识别能力。该实施方式结合频响曲线、总谐波失真曲线和音质,对智能语音设备进行调节,能够平衡智能语音设备的音频播放能力和语音识别能力。
-
公开(公告)号:CN114237544A
公开(公告)日:2022-03-25
申请号:CN202111536807.3
申请日:2021-12-15
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种音频输入方法、装置、电子设备及存储介质,涉及人工智能领域,尤其涉及语音技术。具体实现方案为:通过现场可编程门阵列FPGA接收N个音频输入单元按照多路方式发送的音频数据;其中,N为大于1的自然数;通过FPGA将其接收到的音频数据按照单路方式发送至通用串行总线物理层芯片USB‑PHY;通过USB‑PHY将其接收到的音频数据输入至音频接收单元中。本申请实施例可以方便地扩展通道数量,满足多通道录音需求;并且无需额外安装驱动,兼容性好,操作简单。
-
公开(公告)号:CN110062321B
公开(公告)日:2021-08-17
申请号:CN201910345767.0
申请日:2019-04-26
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种智能音响的测试方法,该方法包括:向智能音响测试工装发送测试指令;所述测试指令中包括至少一个测试项目;接收所述智能音响测试工装响应所述测试指令后返回的测试数据;根据所述测试数据确定出所述测试指令所包含的各测试项目的测试结果。本公开还提供了另一种智能音响的测试方法、测试上位机以及智能音响测试工装。
-
公开(公告)号:CN112788278A
公开(公告)日:2021-05-11
申请号:CN202011643811.5
申请日:2020-12-30
Applicant: 北京百度网讯科技有限公司
IPC: H04N7/15 , H04N5/232 , G10L21/0208 , H04L29/06
Abstract: 本公开公开了一种视频流的生成方法、装置、设备及存储介质,涉及语音技术领域、视频处理技术领域、计算机视觉技术领域和深度学习技术领域。具体实现方案为:当监测到语音数据时,确定与语音数据对应的第一发言用户;控制预设摄像头对焦第一发言用户拍摄第一视频帧图像,并采集第一发言用户的第一发言数据;对第一发言数据中的噪音数据进行去噪处理,得到第一目标数据;根据第一目标数据和第一视频帧图像生成视频流。由此,在视频流传输场景下,聚焦发言人进行视频帧图像的拍摄,并且抑制非发言人的噪音,提高了视频流的质量,满足了多种场景下的视频需求。
-
公开(公告)号:CN109905808A
公开(公告)日:2019-06-18
申请号:CN201910189064.3
申请日:2019-03-13
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了用于调节智能语音设备的方法和装置。该方法的一具体实施方式包括:获取对智能语音设备播放的扫频信号进行采集所得到的频响曲线和总谐波失真曲线;获取对智能语音设备播放的语音信号进行采集所得到的音质;基于频响曲线、总谐波失真曲线和音质,调节智能语音设备,以平衡智能语音设备的音频播放能力和语音识别能力。该实施方式结合频响曲线、总谐波失真曲线和音质,对智能语音设备进行调节,能够平衡智能语音设备的音频播放能力和语音识别能力。
-
公开(公告)号:CN112133328A
公开(公告)日:2020-12-25
申请号:CN202010768627.7
申请日:2020-08-03
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了音频数据的测评信息生成方法和装置,涉及人工智能领域、大数据领域和深度学习领域。具体实现方案为:获取目标音频数据对应的目标频响曲线;将目标频响曲线与预设的多个标准频响曲线匹配,获取目标频响曲线与每个标准频响曲线的匹配度;根据匹配度在多个标准频响曲线中确定目标标准频响曲线;获取目标标准频响曲线对应的目标预设测评信息,并将预设测评信息作为音频数据的测评信息。由此,实现了音频数据的智能化测评,提高了音频数据的测评信息的生成效率,降低了生成成本。
-
公开(公告)号:CN111750876A
公开(公告)日:2020-10-09
申请号:CN202010547718.8
申请日:2020-06-16
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了一种路网修复方法、装置、设备以及存储介质,涉及数据处理技术领域,尤其涉及人工智能、智能交通等技术领域。具体实现方案为:根据路网中顶点间的连通关系,从路网的顶点中确定候选连通对;根据所述候选连通对之间的行驶轨迹和/或道路数据,从所述候选连通对中确定目标连通对;建立所述目标连通对之间的连通关系。根据本申请的技术实现了对路网中连通关系的修复。
-
公开(公告)号:CN110062321A
公开(公告)日:2019-07-26
申请号:CN201910345767.0
申请日:2019-04-26
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种智能音响的测试方法,该方法包括:向智能音响测试工装发送测试指令;所述测试指令中包括至少一个测试项目;接收所述智能音响测试工装响应所述测试指令后返回的测试数据;根据所述测试数据确定出所述测试指令所包含的各测试项目的测试结果。本公开还提供了另一种智能音响的测试方法、测试上位机以及智能音响测试工装。
-
-
-
-
-
-
-
-
-