-
公开(公告)号:CN114489341B
公开(公告)日:2024-06-25
申请号:CN202210110252.4
申请日:2022-01-28
申请人: 北京地平线机器人技术研发有限公司
IPC分类号: G06F3/01
摘要: 本公开实施例公开了一种手势的确定方法和装置、电子设备和存储介质,其中,方法包括:获取环境图像数据;根据所述环境图像数据,确定用户的手部信息;根据所述用户的手部信息,确定所述用户的手势所属的目标手势类型及目标投影方向;按照所述目标投影方向,将所述目标手势类型对应的手势标志投影到目标对象上。本公开实施例可以为用户提供交互对象的视觉上的信息反馈,使得用户能够及时准确地获知自己手势是否准确地指向了想要的交互对象,有效提高用户体验。
-
公开(公告)号:CN114489341A
公开(公告)日:2022-05-13
申请号:CN202210110252.4
申请日:2022-01-28
申请人: 北京地平线机器人技术研发有限公司
IPC分类号: G06F3/01
摘要: 本公开实施例公开了一种手势的确定方法和装置、电子设备和存储介质,其中,方法包括:获取环境图像数据;根据所述环境图像数据,确定用户的手部信息;根据所述用户的手部信息,确定所述用户的手势所属的目标手势类型及目标投影方向;按照所述目标投影方向,将所述目标手势类型对应的手势标志投影到目标对象上。本公开实施例可以为用户提供交互对象的视觉上的信息反馈,使得用户能够及时准确地获知自己手势是否准确地指向了想要的交互对象,有效提高用户体验。
-
公开(公告)号:CN106125911B
公开(公告)日:2020-02-11
申请号:CN201610428438.9
申请日:2016-06-16
申请人: 北京地平线机器人技术研发有限公司
IPC分类号: G06F3/01
摘要: 本申请公开了一种用于机器的人机交互学习方法及机器。用于机器的人机交互学习方法包括:经由机器的人机接口接收第一信号;经由所述人机接口接收用于监督第一信号的第二信号,所述第二信号与所述机器针对所述第一信号应采取的操作的操控指令相关联;以及将所述第一信号与所述操控指令进行匹配,建立用于所述机器的人机交互模式。根据本申请实施例提供的技术方案,通过第一信号与控制指令匹配,能够解决传统人机交互的单一化问题,获得用户可定制的个性化交互的效果。
-
公开(公告)号:CN105912092B
公开(公告)日:2019-08-13
申请号:CN201610210631.5
申请日:2016-04-06
申请人: 北京地平线机器人技术研发有限公司
IPC分类号: G06F1/3234 , G06F3/01 , G10L15/22
摘要: 本申请公开了人机交互中的语音唤醒方法和语音识别装置,所述语音唤醒方法包括以下步骤:静音检测步骤,包括:在机器检测到声音能量时,进行唤醒词检出,如果声音能量包括唤醒词,则唤醒机器开始语音识别,否则,启动图像检测;图像检测步骤,包括:在图像检测中,如果检测到人,则唤醒机器开始语音识别,否则继续检测声音能量。通过本发明的方法和语音识别装置,能够结合图像检测,实现自然地人机交互,同时保持待机状态下的低电力消耗。
-
公开(公告)号:CN111966721B
公开(公告)日:2024-05-14
申请号:CN201910420005.2
申请日:2019-05-20
申请人: 北京地平线机器人技术研发有限公司
IPC分类号: G06F16/2458
摘要: 本公开实施例公开了一种数据处理方法、装置、计算机可读存储介质及电子设备,其中,该方法包括:确定当前数据帧的类别;若当前数据帧的类别为第一预设类别,确定当前数据帧包括的至少一条周期数据;从当前数据帧所处的数据帧序列中确定至少一帧目标历史数据帧;基于至少一帧目标历史数据帧与至少一条周期数据,利用预先训练的数据处理模型,得到针对当前数据帧的处理结果。本公开的实施例可以有效地利用周期数据,使数据处理模型能够根据周期数据将当前数据帧和与周期数据相对应的历史数据帧相结合进行分析,即根据不同的数据生成周期进行不同的处理,提高了基于数据帧序列进行决策的准确性及效率。
-
公开(公告)号:CN105929827B
公开(公告)日:2020-03-10
申请号:CN201610341566.X
申请日:2016-05-20
申请人: 北京地平线机器人技术研发有限公司
摘要: 本发明提供一种移动机器人及其定位方法,所述方法包括:采集用户的语音信息,根据所述语音信息定位所述用户的方向;转动所述移动机器人以使图像定位单元朝向所述方向;采集图像序列,识别所述图像序列中所述用户的特征部位;根据所述特征部位的位置校准所述用户的方向并定位所述用户的距离。本发明通过语音定位为图像采集导向,再通过识别所采集图像序列中用户的特征部位,并根据所述特征部位的位置校准用户的方向、定位用户的距离,从而实现对作为声源的用户的准确定位;并进一步通过识别用户的召唤或跟踪命令,在对用户进行准确定位后驱动移动机器人移动至用户面前。
-
公开(公告)号:CN105912111B
公开(公告)日:2018-11-09
申请号:CN201610210633.4
申请日:2016-04-06
申请人: 北京地平线机器人技术研发有限公司
摘要: 本申请公开了一种人机交互中结束语音对话的方法和语音识别装置。所述方法包括步骤:在开启语音对话后检测声音能量,如果检测不到预设定阈值的声音能量,则开启图像检测;如果图像检测不到人,则关闭图像检测并关闭语音对话。根据本发明的实施例,将图像检测的信息和静音检测相结合,来判断是否结束语音对话状态,可以在用户离开的场景,更快的结束对话,降低功耗。
-
公开(公告)号:CN107734370A
公开(公告)日:2018-02-23
申请号:CN201710970857.X
申请日:2017-10-18
申请人: 北京地平线机器人技术研发有限公司
IPC分类号: H04N21/41 , H04N21/422 , H04N21/4363 , H04N21/442 , G06F3/01 , G10L15/22
摘要: 公开了一种信息交互方法、信息交互装置和电子设备。该信息交互方法应用于第一设备,包括:接收来自用户的输入信息;根据所述输入信息确定具有优选呈现方式的响应信息;判断所述第一设备是否能够实现所述优选呈现方式;响应于所述第一设备不能实现所述优选呈现方式,生成外部呈现指令,所述外部呈现指令用于触发第二设备以所述优选呈现方式呈现所述响应信息;以及,将所述外部呈现指令发送到所述第二设备。因此,可以实现具有改进的用户体验和低成本的信息交互。
-
公开(公告)号:CN106128451A
公开(公告)日:2016-11-16
申请号:CN201610516126.3
申请日:2016-07-01
申请人: 北京地平线机器人技术研发有限公司
摘要: 本申请公开了一种用于语音识别的方法及装置,其中用于语音识别的方法包括:采集语音信息和空间图像信息;根据所述空间图像信息获取空间信息;根据所述语音信息获取声学特征信息;根据所述空间信息消除声学特征信息中的混响信息;以及根据消除混响后的声学特征信息进行语音识别。根据本申请实施例提供的技术方案,通过环境的空间信息的引入,能够获取环境的三维几何信息和表面材质信息来确定混响时间,获得更好的去混响,去除噪声效果,提高信噪比。
-
公开(公告)号:CN114598963A
公开(公告)日:2022-06-07
申请号:CN202210325881.9
申请日:2022-03-30
申请人: 北京地平线机器人技术研发有限公司
IPC分类号: H04R1/40
摘要: 本公开实施例公开了一种语音处理的方法、装置、基于可活动麦克风阵列的语音识别系统、计算机可读存储介质及电子设备,其中,该方法包括:确定处于目标空间内的人员数量和人员位置;基于人员数量和人员位置,确定麦克风阵列调整的目标位置;控制麦克风阵列中的目标麦克风转动到目标位置的方向;从麦克风阵列采集的音频信号中提取语音信号进行语音处理。本公开实施例实现了利用较少数量的麦克风采集目标空间内的更多人员位置的音频信号,并能够准确识别语音信号,降低了设置麦克风阵列的成本,提高了使用麦克风阵列进行语音交互的灵活性,扩展了使用麦克风阵列进行语音交互的应用场景。
-
-
-
-
-
-
-
-
-