-
公开(公告)号:CN105472191B
公开(公告)日:2019-09-20
申请号:CN201510795224.0
申请日:2015-11-18
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 李峥
Abstract: 本发明提供了一种跟踪回声时延的方法和装置,其中方法包括:获取回声参考信号和声音输入信号,利用回声参考信号和声音输入信号在当前帧的互相关函数的峰值,确定所述回声参考信号在当前帧的回声时延。本发明的跟踪回声时延的方法和装置在获取回声参考信号的过程中,利用回声参考信号和声音输入信号在当前帧的互相关函数的峰值来确定回声参考信号在当前帧的回声时延,从而跟踪回声参考信号在每一帧的回声时延,以便为消除时延抖动以及提高回声消除性能的长期稳定性提供基础。
-
公开(公告)号:CN105116920B
公开(公告)日:2018-07-10
申请号:CN201510394607.7
申请日:2015-07-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: G05D3/12
Abstract: 本发明公开了一种基于人工智能的智能机器人追踪方法、装置及智能机器人,其中方法包括:检测智能机器人周围的至少一个声源;当检测到的至少一个声源的其中一个声源满足预设声源条件时,对其中一个声源进行定位,并根据定位结果控制智能机器人移动至上述声源的位置;当智能机器人移动至上述的位置时,判断其中一个声源的位置的附近是否有人脸;若有,则识别人脸中的最大人脸,并定位最大人脸的位置;根据最大人脸的位置调整智能机器人以使最大人脸位于智能机器人中摄像头所捕捉的画面的正中间。该方法结合声源定位和人脸检测等多方面技术来实现用户的追踪定位,提高智能机器人的定位效果,提高准确性,使得智能机器人能够主动寻找用户。
-
公开(公告)号:CN105467364B
公开(公告)日:2019-03-29
申请号:CN201510809839.4
申请日:2015-11-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G01S5/22
Abstract: 本发明公开了一种定位目标声源的方法和装置。其中一种定位目标声源的方法包括:确定麦克风阵列中两两组合的阵元在预设方位的波束时延差;利用所述时延差,确定两两组合的阵元从所述预设方位获取的波束能量之和作为所述预设方位的波束能量;依据所有预设方位的波束能量,确定声源的位置。本发明采用麦克风阵列,基于麦克风阵列在所有预设方位的波束能量,确定声源的位置,提高了声源的分辨效果。
-
公开(公告)号:CN105472191A
公开(公告)日:2016-04-06
申请号:CN201510795224.0
申请日:2015-11-18
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 李峥
Abstract: 本发明提供了一种跟踪回声时延的方法和装置,其中方法包括:获取回声参考信号和声音输入信号,利用回声参考信号和声音输入信号在当前帧的互相关函数的峰值,确定所述回声参考信号在当前帧的回声时延。本发明的跟踪回声时延的方法和装置在获取回声参考信号的过程中,利用回声参考信号和声音输入信号在当前帧的互相关函数的峰值来确定回声参考信号在当前帧的回声时延,从而跟踪回声参考信号在每一帧的回声时延,以便为消除时延抖动以及提高回声消除性能的长期稳定性提供基础。
-
公开(公告)号:CN105159111A
公开(公告)日:2015-12-16
申请号:CN201510523179.3
申请日:2015-08-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G05B15/02
CPC classification number: G05B15/02
Abstract: 本发明提出了一种基于人工智能的智能交互设备控制方法、系统及智能交互设备,该方法包括:接收多模态的输入信号,多模态的输入信号包括用户输入的图像信号、声音信号和/或距离信号;根据图像信号进行人脸检测,并在检测到有人脸时,获取人脸图像和人脸信息;根据人脸图像进行唇区检测以确定唇区运动情况;根据声音信号进行声源定位以得到声源信息;根据人脸信息、唇区运动情况、声源信息和/或距离信号判断用户的交互意愿以及交互意愿强烈程度;根据用户的交互意愿以及交互意愿强烈程度控制所述智能交互设备进行相应的交互响应。该方法能够提升用户与智能交互设备的交互体验,提升智能交互设备的智能性。
-
公开(公告)号:CN105116994A
公开(公告)日:2015-12-02
申请号:CN201510394608.1
申请日:2015-07-07
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了一种基于人工智能的智能机器人追踪方法和装置,其中该方法包括:获取智能机器人所捕捉的画面图像,并对画面图像进行人脸检测以判断画面图像中是否有人脸;若有,则定位画面图像中的最大人脸,并对最大人脸进行身份识别;当最大人脸的身份识别成功之后,获取最大人脸的位置坐标;以及根据位置坐标调整智能机器人以使最大人脸位于智能机器人中摄像头所捕捉的画面的正中间。该方法通过检测并识别最大人脸,可以使得智能机器人能够并准确地判断待交互的用户,并通过增加智能机器人的运动自由度,使得智能机器人更接近人脸,并使得智能机器人在机械运动时更加生动形象。
-
公开(公告)号:CN105116994B
公开(公告)日:2019-05-31
申请号:CN201510394608.1
申请日:2015-07-07
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了一种基于人工智能的智能机器人追踪方法和装置,其中该方法包括:获取智能机器人所捕捉的画面图像,并对画面图像进行人脸检测以判断画面图像中是否有人脸;若有,则定位画面图像中的最大人脸,并对最大人脸进行身份识别;当最大人脸的身份识别成功之后,获取最大人脸的位置坐标;以及根据位置坐标调整智能机器人以使最大人脸位于智能机器人中摄像头所捕捉的画面的正中间。该方法通过检测并识别最大人脸,可以使得智能机器人能够并准确地判断待交互的用户,并通过增加智能机器人的运动自由度,使得智能机器人更接近人脸,并使得智能机器人在机械运动时更加生动形象。
-
公开(公告)号:CN105159111B
公开(公告)日:2019-01-25
申请号:CN201510523179.3
申请日:2015-08-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G05B15/02
Abstract: 本发明提出了一种基于人工智能的智能交互设备控制方法、系统及智能交互设备,该方法包括:接收多模态的输入信号,多模态的输入信号包括用户输入的图像信号、声音信号和/或距离信号;根据图像信号进行人脸检测,并在检测到有人脸时,获取人脸图像和人脸信息;根据人脸图像进行唇区检测以确定唇区运动情况;根据声音信号进行声源定位以得到声源信息;根据人脸信息、唇区运动情况、声源信息和/或距离信号判断用户的交互意愿以及交互意愿强烈程度;根据用户的交互意愿以及交互意愿强烈程度控制所述智能交互设备进行相应的交互响应。该方法能够提升用户与智能交互设备的交互体验,提升智能交互设备的智能性。
-
公开(公告)号:CN105467364A
公开(公告)日:2016-04-06
申请号:CN201510809839.4
申请日:2015-11-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G01S5/22
CPC classification number: G01S5/22
Abstract: 本发明公开了一种定位目标声源的方法和装置。其中一种定位目标声源的方法包括:确定麦克风阵列中两两组合的阵元在预设方位的波束时延差;利用所述时延差,确定两两组合的阵元从所述预设方位获取的波束能量之和作为所述预设方位的波束能量;依据所有预设方位的波束能量,确定声源的位置。本发明采用麦克风阵列,基于麦克风阵列在所有预设方位的波束能量,确定声源的位置,提高了声源的分辨效果。
-
公开(公告)号:CN105116920A
公开(公告)日:2015-12-02
申请号:CN201510394607.7
申请日:2015-07-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: G05D3/12
Abstract: 本发明公开了一种基于人工智能的智能机器人追踪方法、装置及智能机器人,其中方法包括:检测智能机器人周围的至少一个声源;当检测到的至少一个声源的其中一个声源满足预设声源条件时,对其中一个声源进行定位,并根据定位结果控制智能机器人移动至上述声源的位置;当智能机器人移动至上述的位置时,判断其中一个声源的位置的附近是否有人脸;若有,则识别人脸中的最大人脸,并定位最大人脸的位置;根据最大人脸的位置调整智能机器人以使最大人脸位于智能机器人中摄像头所捕捉的画面的正中间。该方法结合声源定位和人脸检测等多方面技术来实现用户的追踪定位,提高智能机器人的定位效果,提高准确性,使得智能机器人能够主动寻找用户。
-
-
-
-
-
-
-
-
-