一种多媒体语音识别装置及方法

    公开(公告)号:CN107452381B

    公开(公告)日:2020-12-29

    申请号:CN201610371239.9

    申请日:2016-05-30

    Inventor: 马帅 于渊

    Abstract: 本发明公开了一种多媒体语音识别装置及方法,该装置包括:至少一个第二声音采集模块、摄像装置以及控制模块,其中:控制模块在确定出智能用户设备的设定区域内有用户存在时,控制所述智能用户设备的可转动部件设置摄像装置的一面面向所述用户;第二声音采集模块,用于获得声音数据;摄像装置,用于获取视频信息;所述控制模块,用于在确定出所述声音数据跃变时,提取当前摄像装置中获取的所述视频信息中的图片;并结合所述第二声音采集模块采集的所述声音数据和所述图片,识别所述声音数据对应的用户发送的语音,识别所述语音指令,用于提升语音识别率,降低语音识别的处理开销,提高实时性。

    一种多媒体语音识别装置及方法

    公开(公告)号:CN107452381A

    公开(公告)日:2017-12-08

    申请号:CN201610371239.9

    申请日:2016-05-30

    Inventor: 马帅 于渊

    Abstract: 本发明公开了一种多媒体语音识别装置及方法,该装置包括:至少一个第二声音采集模块、摄像装置以及控制模块,其中:控制模块在确定出智能用户设备的设定区域内有用户存在时,控制所述智能用户设备的可转动部件设置摄像装置的一面面向所述用户;第二声音采集模块,用于获得声音数据;摄像装置,用于获取视频信息;所述控制模块,用于在确定出所述声音数据跃变时,提取当前摄像装置中获取的所述视频信息中的图片;并结合所述第二声音采集模块采集的所述声音数据和所述图片,识别所述声音数据对应的用户发送的语音,识别所述语音指令,用于提升语音识别率,降低语音识别的处理开销,提高实时性。

    一种点云背景生成方法、装置及通信设备

    公开(公告)号:CN114596331B

    公开(公告)日:2025-02-18

    申请号:CN202011410908.1

    申请日:2020-12-04

    Abstract: 本发明提供一种点云背景生成方法、装置及通信设备,涉及通信技术领域。该方法包括:对多帧点云数据的每帧点云数据进行处理得到初始背景点云信息和初始运动点云信息;确定初始运动点云信息所属的多个体素单元并记录每个体素单元对应的帧数;基于路侧设备的误差信息确定每个体素单元对应的阈值;将体素单元对应的帧数与阈值进行比较,确定体素单元的点云信息是否属于背景点云信息;若体素单元的点云信息均不属于背景点云信息,则根据初始背景点云信息生成目标点云背景信息;若体素单元的点云信息属于背景点云信息,则根据体素单元的点云信息和初始背景点云信息生成目标点云背景信息。本发明能够解决目前点云背景生成方式中存在背景漏检的问题。

    三维建模方法、装置、网络设备及计算机可读存储介质

    公开(公告)号:CN112634427A

    公开(公告)日:2021-04-09

    申请号:CN201910905028.2

    申请日:2019-09-24

    Inventor: 王柄璇 于渊

    Abstract: 本发明提供了一种三维建模方法、装置、网络设备及计算机可读存储介质,其中,三维建模方法包括:获取远端设备的位置数据和视角数据;根据所述位置数据和视角数据,获取所需的点云数据;根据所述点云数据,获取前端传感器的传感数据;根据所述传感数据,进行三维建模。本方案能够实现通过远端视角控制三维实时建模,减少非必要空间的建模(即非必要点云的计算),以有效提升三维实时建模的性能,并降低从点云采集到远端用户成像的时延,提高用户感受,很好的解决现有技术中三维实时建模方案中存在非必要点云数据的计算的问题。

    眼镜去除方法、装置及通信设备

    公开(公告)号:CN114821692A

    公开(公告)日:2022-07-29

    申请号:CN202110127855.0

    申请日:2021-01-29

    Abstract: 本发明提供一种眼镜去除方法、装置及通信设备,该方法包括:将初始人脸图像切分为第一图像块、第二图像块以及第三图像块;通过眼镜去除浅层卷积神经网络对第二图像块依次进行上采样操作、下采样操作,并通过卷积、池化实现对图像的重构,得到大小与第二图像块一致的重构无眼镜图像块;将重构无眼镜图像块、第一图像块以及第三图像块进行拼合,得到完整的无眼镜人脸图像;本发明实施例先通过上采样获得更高分辨率的特征图,提高重构图像质量;然后通过池化、双支卷积模块等操作对特征图进行特征提取与重构,该过程同时是一个下采样过程,经过上述处理特征图尺寸下降到原图大小;该神经网络层数较少,从而保持较少的计算量和较快的前向运行效率。

    车辆航向角计算方法、车辆位姿计算方法、装置及设备

    公开(公告)号:CN114820416A

    公开(公告)日:2022-07-29

    申请号:CN202110125649.6

    申请日:2021-01-29

    Abstract: 本发明公开了一种车辆航向角计算方法、车辆位姿计算方法、装置及设备,涉及通信技术领域,以解决现有方法计算量较大问题。该车辆航向角计算方法包括:获取目标点云,其中,目标点云包括目标车辆的点云;确定目标点云映射到地面的第一点云,并确定包围第一点云的目标矩形框;分别确定目标矩形框中的纵向边缘区域和横向边缘区域;基于纵向边缘区域中的纵向边缘点云和横向边缘区域中的横向边缘点云,确定G个旋转卡壳;分别确定G个旋转卡壳中每个旋转卡壳对应的边缘距离,并基于边缘距离,确定目标旋转卡壳;基于目标旋转卡壳,确定目标车辆的航向角。本发明实施例可降低算法复杂度,减少计算量。

    三维建模方法、装置、网络设备及计算机可读存储介质

    公开(公告)号:CN112634427B

    公开(公告)日:2024-11-08

    申请号:CN201910905028.2

    申请日:2019-09-24

    Inventor: 王柄璇 于渊

    Abstract: 本发明提供了一种三维建模方法、装置、网络设备及计算机可读存储介质,其中,三维建模方法包括:获取远端设备的位置数据和视角数据;根据所述位置数据和视角数据,获取所需的点云数据;根据所述点云数据,获取前端传感器的传感数据;根据所述传感数据,进行三维建模。本方案能够实现通过远端视角控制三维实时建模,减少非必要空间的建模(即非必要点云的计算),以有效提升三维实时建模的性能,并降低从点云采集到远端用户成像的时延,提高用户感受,很好的解决现有技术中三维实时建模方案中存在非必要点云数据的计算的问题。

Patent Agency Ranking