一种独立关系检测的场景图生成方法和系统

    公开(公告)号:CN115512003A

    公开(公告)日:2022-12-23

    申请号:CN202211430055.7

    申请日:2022-11-16

    Abstract: 本发明属于计算机视觉领域,涉及一种独立关系检测的场景图生成方法和系统,该方法包括:步骤一,建立独立关系检测模型;步骤二,利用图像、图像对应的关系标签以及预定义方向锚训练所述独立关系检测模型,得到训练好的独立关系检测模型;步骤三,使用训练好的独立关系检测模型,输入图像和预定义方向锚,输出图像中存在的关系,对其中相似的关系采用相似关系抑制算法进行抑制;步骤四,同时将通过目标检测算法检测得到的物体包围框与所述输出图像中存在的关系的关系起始点和关系末端点进行位置匹配,得到 的三元组,构成场景图。本发明在不依靠目标检测结果的情况下就能对图像中的关系进行检测,提升了场景图生成的运算速度。

    一种面向机器人的行人定位方法、装置、电子设备及介质

    公开(公告)号:CN112561997B

    公开(公告)日:2022-07-26

    申请号:CN202011458019.2

    申请日:2020-12-10

    Abstract: 本申请公开了一种面向机器人的行人定位方法、装置、电子设备及介质,该方法包括:获取当前时刻单目彩色相机的彩色图像一帧和二维激光雷达数据一帧,所述彩色图像和激光雷达数据应做好时间同步;在所述彩色图像上进行行人检测和人脸检测,得到行人检测矩形框和人脸检测矩形框;根据所述人脸检测矩形框,计算在所述单目彩色相机坐标系下的人脸中心所在的射线方程;根据所述的人脸中心所在的射线方程,结合所述行人检测矩形框、所述激光雷达数据以及所述单目彩色相机和二维激光雷达的内外参,计算得到人脸中心在所述激光雷达坐标系下的三维坐标。以解决相关技术中存在的定位计算量大、精度低的问题。

    一种基于注视目标的人物意图检测方法、装置及电子设备

    公开(公告)号:CN114356078B

    公开(公告)日:2024-03-19

    申请号:CN202111539274.4

    申请日:2021-12-15

    Abstract: 本发明涉及人工智能机器人行为交互领域,具体涉及一种基于注视目标的人物意图检测方法、装置及电子设备,该方法包括:利用机器人上的深度摄像头获取到彩色图像和深度图,通过注视目标估计方法在彩色图像中估计出人物的注视目标点,通过目标检测方法在彩色图像中检测出通用目标的包围框,将人物的注视目标点与通用目标相关联,得到彩色图像中的注视目标物体;利用深度图和机器人位姿坐标计算出机器人当前位置下的可观测到的点云,彩色图像中的注视目标物体映射到注视目标点云上;在语义地图上查询注视目标点云的位置上的语义信息,作为人物意图。本发明进一步提升机器人在人机交互的能力,更好地为人类进行服务。

    基于多维模展开张量与t-SVD的图像重构方法和装置

    公开(公告)号:CN116309207A

    公开(公告)日:2023-06-23

    申请号:CN202211106968.3

    申请日:2022-09-09

    Abstract: 本发明涉及图像处理技术领域,尤其是涉及一种基于多维模展开张量与t‑SVD的图像重构方法和装置,该方法包括:步骤一,获取待修复图像,构建低秩张量补全模型;步骤二,通过两段t‑SVD约束对所述低秩张量补全模型进行优化,得到基于多维度模展开张量与两段t‑SVD的张量补全模型,后输入待修复图像;步骤三,通过交替方向乘子法优化张量补全模型,利用优化后的张量补全模型迭代输出修复的图像。本发明对高阶图像数据丢失进行修复的过程中,通过输入图像得到不同维度的模展开张量,并联合两段t‑SVD约束将其整合到统一的目标函数,构建修复模型,使整体图像修复更加精准。

    一种双进程多目标跟踪方法
    25.
    发明公开

    公开(公告)号:CN115546254A

    公开(公告)日:2022-12-30

    申请号:CN202211398601.3

    申请日:2022-11-09

    Abstract: 本发明公开了一种双进程多目标跟踪方法,包括在主进程中运行的主线跟踪器和在子进程中运行的辅线修正器两条分支,所述主线跟踪器分支使用高速低精度模型进行多目标跟踪,所述辅线修正器分支使用低速高精度模型对所述主线跟踪器进行修正。所述两条分支的结果通过融合器融合后得到最终的多目标跟踪结果。本发明能够在不降低所述主线跟踪器跟踪速度的同时,提升其跟踪精度。

    一种实时识别视频中说话人的方法及装置

    公开(公告)号:CN114819110B

    公开(公告)日:2022-10-21

    申请号:CN202210717252.0

    申请日:2022-06-23

    Abstract: 本发明公开了一种实时识别视频中说话人的方法及装置,该方法包括:获取同一时刻开始且连续的图像序列和音频序列;根据所述图像序列中最新一帧的图像,检测并跟踪人脸,更新已有的人脸序列信息库;将所述人脸序列信息库中的人脸序列信息和所述音频序列输入训练好的说话人检测网络中,检测说话状态,更新说话状态数据库;根据所述说话状态数据库,获取所有人的当前状态,从而识别视频中的可能的说话人。

    一种面向机器人的行人定位方法、装置、电子设备及介质

    公开(公告)号:CN112561997A

    公开(公告)日:2021-03-26

    申请号:CN202011458019.2

    申请日:2020-12-10

    Abstract: 本申请公开了一种面向机器人的行人定位方法、装置、电子设备及介质,该方法包括:获取当前时刻单目彩色相机的彩色图像一帧和二维激光雷达数据一帧,所述彩色图像和激光雷达数据应做好时间同步;在所述彩色图像上进行行人检测和人脸检测,得到行人检测矩形框和人脸检测矩形框;根据所述人脸检测矩形框,计算在所述单目彩色相机坐标系下的人脸中心所在的射线方程;根据所述的人脸中心所在的射线方程,结合所述行人检测矩形框、所述激光雷达数据以及所述单目彩色相机和二维激光雷达的内外参,计算得到人脸中心在所述激光雷达坐标系下的三维坐标。以解决相关技术中存在的定位计算量大、精度低的问题。

Patent Agency Ranking