一种面向非结构场景中垃圾拾取任务的高效感知方法

    公开(公告)号:CN115187905A

    公开(公告)日:2022-10-14

    申请号:CN202210835850.8

    申请日:2022-07-15

    Abstract: 工作场景感知是机器人高效实现指定任务的重要前提,得益于深度学习的发展,现有方法可实现高性能的工作场景感知,但要求较高的计算能力导致这些方法难以部署于低算力的平台上,本发明针对移动机器人在非结构化场景中的垃圾拾取任务,构建了一个包含12类垃圾的数据集,并以此提供一种面向非结构场景中垃圾拾取任务的高效感知方法,该方法在YOLOv4目标检测的基础上,设计了一种基于K‑means++聚类的深度信息优化方法,并结合图像形态学变化和Canny边缘检测算法实现物体角度估计,实验结果表明了本发明方法准确率高、实时性强,对于非结构化场景中的干扰信息(如背景、物体材质等)具有一定的鲁棒性。

    一种感知障碍物的更新方法、装置、整车控制器及介质

    公开(公告)号:CN119665941A

    公开(公告)日:2025-03-21

    申请号:CN202411582660.5

    申请日:2024-11-07

    Abstract: 本发明公开了一种感知障碍物的更新方法、装置、整车控制器及介质,包括获取每个检测装置环境点云数据,并根据装置的感知范围构建对应的视锥体模型;对环境点云数据采样和坐标转换后得到每个检测时刻的环境点云数据中的当前障碍物数据和历史障碍物数据,通过判断历史障碍物数据中的每一组障碍物点与每个视锥体模型之间的空间位置关系,来更新每个视锥体模型的历史障碍物数据和当前障碍物数据中对应的计数值;最后根据计数值来将每个视锥体模型中更新后的当前障碍物数据和历史障碍物数据进行融合,得到当前环境下的导航地图。本发明方案解决了现有的机器人障碍物感知技术的感知精度低,从导致机器人动态避障能力不够高效的问题。

    一种基于中文分词优化的中文语音合成方法、电子设备及存储介质

    公开(公告)号:CN116741140A

    公开(公告)日:2023-09-12

    申请号:CN202310773458.X

    申请日:2023-06-28

    Abstract: 本发明公开了一种基于中文分词优化的中文语音合成方法:首先利用基于加权自蒸馏的中文分词模型CWS‑WSD将医疗服务机器人交互过程中产生的回复文本进行分词,明确文本中的词汇边界,然后根据分词结果插入相应的停顿标志符,最后将插入标识符后的文本送入Tacotron2进行语音合成。本发明通过在语音合成过程中事先对中文文本进行中文分词,来为文本加入词汇边界,进而在生成的语音中对应地加入停顿来缓解前述提到的歧义和交互质量的问题。

    一种基于改进型角度估计的机械臂抓取方法

    公开(公告)号:CN115213902A

    公开(公告)日:2022-10-21

    申请号:CN202210840815.5

    申请日:2022-07-18

    Abstract: 本发明公开了一种基于改进型角度估计的机械臂抓取方法,包括:S1、将机器人放入非结构化场景中进行目标物体信息采集;S2、通过one‑stage检测器对步骤S1中的目标物体信息采集进行检测,输出目标物体的边界框信息;S3、将步骤S1中的目标物体信息与步骤S2中边界框信息进行结合,通过K‑means++算法将框内所有像素点的深度值聚类为三类,将聚类中心值作为抓取点到相机成像镜头的距离;S4、将上述的聚类中心的点坐标和剔除异常点的深度信息根据相应的运算得到真实世界中的抓取坐标;S5、使用Canny检测图像信息,并求解最小外接矩阵,获取物体主方向角度。根据本发明,能够迅速在复杂场景中获取物体抓取角度。

    一种地图的矫正方法、装置、计算机设备及存储介质

    公开(公告)号:CN119540102A

    公开(公告)日:2025-02-28

    申请号:CN202411582877.6

    申请日:2024-11-07

    Abstract: 本发明涉及图像处理技术领域,公开了一种地图的矫正方法、装置、计算机设备及存储介质,包括获取待矫正的初始地图图像,提取初始地图图像中的多条直线,在图像坐标系中提取对应的直线参数,所述直线参数包括直线的在所述图像坐标系中夹角的角度值;根据每个角度值在所述多条直线参数中出现的次数选择最优旋转校准角度;将初始地图图像上的每个点按照所述最优旋转校准角度进行旋转校准得到矫正后的地图图像。本发明方案解决了现有的地图矫正过程中的计算量大,训练时间长,且不能适用各种场景的问题。

    一种软硬件结合的视觉深度学习模型推理加速方法

    公开(公告)号:CN115034394A

    公开(公告)日:2022-09-09

    申请号:CN202210817062.6

    申请日:2022-07-12

    Abstract: 本发明公开了一种软硬件结合的视觉深度学习模型推理加速方法,包括:S1、根据视觉任务,训练原始深度学习模型;S2、针对所有网络层,利用权值大小挑选不重要的滤波器;S3、移除当前层不重要滤波器,判断剪枝前后模型精度;S4、进行判断模型精度下降是否明显;S5、机型判断是否所有层处理完毕;S6、进行全局优化网络,计算模型精度;S7、模型部署TensorRT&多线程处理。根据本发明,能够运用在任何需要部署到边缘设备的视觉深度学习模型中,在基本保持模型推理精度的同时,有效提升模型的推理速度。

Patent Agency Ranking