一种基于双模态图像的目标检测方法及装置

    公开(公告)号:CN115631397A

    公开(公告)日:2023-01-20

    申请号:CN202211361702.3

    申请日:2022-11-02

    Applicant: 清华大学

    Abstract: 本发明提出一种基于双模态图像的目标检测方法及装置,属于机器视觉、图像处理、精确制导领域。其中,所述方法包括:获取待目标检测的图像样本,所述图像样本包括对齐的一张可见光图像和一张红外图像;将所述图像样本输入预设的双模态目标检测网络,所述网络输出所述样本的目标初筛位置;对所述目标初筛位置进行优化,得到所述样本的最佳目标位置作为目标检测的最终结果。本发明利用可见光和红外在目标特征上的互补性以及在不同场景的有效性上的互补关系,通过融合二者的特征既能获得目标更特异性的特征,又能保证在更多场景的有效性,以解决现有技术中存在的目标特异性特征不充分和应用场景检测失效的问题。

    一种基于社交平台的多机器人动态环境搜索系统及方法

    公开(公告)号:CN114706389A

    公开(公告)日:2022-07-05

    申请号:CN202210310368.2

    申请日:2022-03-28

    Applicant: 清华大学

    Abstract: 本发明提出一种基于社交平台的多机器人动态环境搜索系统及方法,涉及机器人导航、计算机视觉、多机器人通讯等领域。其中所述系统包括云端服务器、多机器人任务分配模块和多个机器人;所述云端服务器分别连接多机器人任务分配模块、每个机器人以及用户的移动终端设备,所述多机器人任务分配模块连接每个机器人;其中,所述移动终端设备上安装有社交软件,每个机器人分别拥有所述社交软件的对应账号。本发明采用社交软件进行人机交互,采用多层次场景图谱解决动态场景下的环境变化,通过路径规划和任务分配实现高效、有序的多机器人环境搜索任务,通过交互将搜索的结果反馈给使用者,方便使用者对周围环境信息的及时掌握。

    自动驾驶多传感器融合感知模型的鲁棒性测试方法及系统

    公开(公告)号:CN113610141B

    公开(公告)日:2022-03-11

    申请号:CN202110880427.5

    申请日:2021-08-02

    Applicant: 清华大学

    Abstract: 本发明公开了自动驾驶多传感器融合感知模型的鲁棒性测试方法及系统,所述方法包括:利用预处理后的多个车载传感器的数据,训练得到多传感器融合感知模型;从多个车载传感器中选取一个待攻击传感器;在选择的待攻击传感器采集的数据上生成添加对抗扰动噪声的掩码,由此生成欺诈数据;将欺诈数据与其他传感器正常采集到的数据输入训练好的多传感器融合感知模型,计算欺诈数据生成的损失函数,并进行反向传播;结合损失函数梯度对欺诈数据进行迭代更新,得到最终的欺诈数据;将最终的欺诈数据与其他传感器正常采集到的数据输入到多传感器融合感知模型中,得到多传感器融合感知模型的输出精度,根据输出精度获取多传感器融合感知模型的鲁棒性测试结果。

    一种从视频中分离音源的方法

    公开(公告)号:CN110970056B

    公开(公告)日:2022-03-11

    申请号:CN201911124411.0

    申请日:2019-11-18

    Applicant: 清华大学

    Abstract: 本发明提出一种从视频中分离音源的方法。该方法由训练阶段和测试阶段两个阶段构成。该方法在训练阶段构建一个由视觉目标检测网络、声音特征提取网络和声音分离网络组成的音源分离模型,从训练数据中选取两个不同类别的视频将其音频混合,训练音源分离模型使之能够从混合音频中精确的分离出两个视频对应的原音频。在测试阶段,获取测试视频后将其输入训练完毕的音源分离模型,模型检测视频中的所有视觉目标,并从原始音频中分离出各个视觉目标对应的声音。本发明可以从目标物体级别上对音源进行分离,能够检测出视频中出现的所有目标物体并将其与分离出的对应声音进行自动匹配,建立了各视觉目标物体和分离后的声音之间的联系,应用前景广阔。

    双机械臂操作问答方法、装置、电子设备和存储介质

    公开(公告)号:CN113838042A

    公开(公告)日:2021-12-24

    申请号:CN202111163679.2

    申请日:2021-09-30

    Applicant: 清华大学

    Abstract: 本公开提供的双机械臂操作问答方法、装置、电子设备和存储介质,包括:将获取的操作场景的RGB图像和深度图像并行输入残差‑特征分层网络,以提取RGB图像和深度图像的特征映射;输入物品操作问题经过基于长短时记忆网络的自然语言处理模型处理后输出第一特征向量;将特征映射与第一特征向量进行连接得到双机械臂的操作初始状态;构建双机械臂问答操作模型,将操作初始状态输入至双机械臂问答操作模型中进行训练,输出双机械臂的操作动作,与环境进行交互,得到物品操作问题答案并输出。本公开打破了传统上问答系统的被动感知,将其转变为主动探索环境,并且双机械臂协同操作能够实现复杂任务的有序控制,减少对工装夹具的依赖。

    自动驾驶多传感器融合感知模型的鲁棒性测试方法及系统

    公开(公告)号:CN113610141A

    公开(公告)日:2021-11-05

    申请号:CN202110880427.5

    申请日:2021-08-02

    Applicant: 清华大学

    Abstract: 本发明公开了自动驾驶多传感器融合感知模型的鲁棒性测试方法及系统,所述方法包括:利用预处理后的多个车载传感器的数据,训练得到多传感器融合感知模型;从多个车载传感器中选取一个待攻击传感器;在选择的待攻击传感器采集的数据上生成添加对抗扰动噪声的掩码,由此生成欺诈数据;将欺诈数据与其他传感器正常采集到的数据输入训练好的多传感器融合感知模型,计算欺诈数据生成的损失函数,并进行反向传播;结合损失函数梯度对欺诈数据进行迭代更新,得到最终的欺诈数据;将最终的欺诈数据与其他传感器正常采集到的数据输入到多传感器融合感知模型中,得到多传感器融合感知模型的输出精度,根据输出精度获取多传感器融合感知模型的鲁棒性测试结果。

    一种障碍物跟踪方法、障碍物跟踪装置和芯片

    公开(公告)号:CN112734811B

    公开(公告)日:2021-08-24

    申请号:CN202110083050.0

    申请日:2021-01-21

    Applicant: 清华大学

    Abstract: 本发明公开了一种障碍物跟踪方法、障碍物跟踪装置和芯片,涉及障碍物跟踪技术领域,以解决现有技术中不能准确检测,跟踪障碍物的问题。所述障碍物跟踪方法包括:获取当前帧障碍物信息,根据当前帧障碍物信息建立当前帧障碍物模型链表;确定当前帧障碍物信息所在数据帧大于初始帧的情况下,根据当前帧障碍物模型链表和前一帧障碍物轨迹链表,获得当前帧轨迹链表;根据当前帧轨迹链表对当前帧障碍物进行追踪。其中,每帧轨迹链表包括:当前帧障碍物轨迹标识、当前帧障碍物模型位置、预测的下一帧障碍物模型位置、卡尔曼滤波器、累计帧数M、累计匹配帧数F、累计未匹配帧数E,M=F+E。本发明提供的障碍物跟踪装置和芯片用于执行上述障碍物跟踪方法。

    一种机器人作业调度方法及装置

    公开(公告)号:CN111597018B

    公开(公告)日:2021-04-13

    申请号:CN202010317207.7

    申请日:2020-04-21

    Applicant: 清华大学

    Abstract: 本发明公开一种机器人作业调度方法及装置,涉及操作系统技术领域,以解决频繁进行作业调度造成系统资源浪费,作业不能有效完成的问题。所述机器人作业调度方法包括:根据当前线程控制机器人作业;确定等待堆内大顶堆的堆顶元素包括一个线程的情况下,根据当前线程控制机器人作业后,根据线程控制机器人作业;大顶堆包括按照优先级排序的多个线程;确定等待堆内大顶堆的堆顶元素包括多个线程的情况下,根据多个线程中时间戳最小的线程确定待运行线程,根据当前线程控制机器人作业后,根据待运行线程控制机器人作业。本发明提供的一种机器人作业调度装置用于执行机器人作业调度方法。

    一种基于激光雷达点云和相机图像融合的车道线检测方法及装置和芯片

    公开(公告)号:CN111291676B

    公开(公告)日:2020-12-11

    申请号:CN202010081032.4

    申请日:2020-02-05

    Applicant: 清华大学

    Abstract: 本发明公开一种基于激光雷达点云和相机图像融合的车道线检测方法及装置和芯片,涉及检测技术领域,为解决准确、有效的检测车道线的问题。所述基于激光雷达点云和相机图像融合的车道线检测方法,包括:接收同一路面的路面点云信息和路面图像信息。根据路面点云信息和路面图像信息,确定车道融合图像。根据路面点云信息、路面图像信息和车道融合图像,确定路面融合图像。从路面融合图像检测车道线。所述基于激光雷达点云和相机图像融合的车道线检测装置用于执行基于激光雷达点云和相机图像融合的车道线检测方法。本发明提供的基于激光雷达点云和相机图像融合的车道线检测装置和芯片用于车道线检测。

Patent Agency Ranking