-
公开(公告)号:CN113989495B
公开(公告)日:2024-04-26
申请号:CN202111362421.5
申请日:2021-11-17
Applicant: 大连理工大学
IPC: G06V10/25 , G06V40/16 , G06V40/20 , G06V10/764 , G06V10/82 , G06V10/40 , G06N20/20 , G06N3/042 , G06N3/0464 , G06N3/048 , G06N5/04 , G06N3/08
Abstract: 本发明公开了一种基于视觉的行人召车行为识别方法,包括以下步骤:图像预处理和意图推理。本发明采用计算机视觉的方法从图像中准确高效的识别出具有召车行为的行人,实现自动驾驶出租车更高效的发现乘客,提高了自动驾驶出租车的使用效率,也提高了乘客的出行效率。本发明采用了空间推理网络实现对行人召车行为的推理,减少了对时间维度信息的依赖,与传统的行为识别算法相比,减少了时间特征提取的过程,能够简化网络,提高行为推理的实时性。本发明采用了一套具有逻辑上可解释的融合规则,实现随机森林和图卷积网络的融合,逻辑上可解释的特性能够提高算法的环境适应性和行为识别的精度,实现融合算法对行人召车意图更稳定准确的推理。
-
公开(公告)号:CN111126338B
公开(公告)日:2022-09-16
申请号:CN201911412860.5
申请日:2019-12-31
Applicant: 大连理工大学
Abstract: 本发明公开了一种融合视觉注意力机制的智能车辆环境感知方法,包括以下步骤:将处理后的视差图和灰度图输入到权重共享的孪生卷积神经网络中,提取灰度特征即G特征和深度特征即D特征;利用归一化算法对D特征和车辆转角信号进行归一化,生成与深度和车辆转角有关的注意力分配权重W;采用Hadamard乘积方式进行融合,生成视觉注意力特征A;将压缩后的视觉注意力特征A输入到回归预测网络中进行回归预测,得到目标的位置以及类别。本发明引入视觉注意力机制,有助于减少图像中无关区域对计算资源的占用,且对注意力集中的区域具有更高的检测精确度。本发明可降低交通场景的复杂性,减少无关区域占用的计算资源,提高目标检测的实时性。
-
公开(公告)号:CN115830549A
公开(公告)日:2023-03-21
申请号:CN202211543285.4
申请日:2022-12-02
Applicant: 大连理工大学
IPC: G06V20/54 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N5/022 , G06F16/583 , G06F16/58
Abstract: 本发明公开了一种融合先验知识的交通场景图生成方法,包括以下步骤:将图像输入到目标检测网络中,获取目标的空间特征FS;将离线三元组数据库存储于车载电脑存储器中,采用语义编码器获取高维三元组G,将关系概率空间作为先验知识;推理目标对的关系rp,采用关系概率空间中概率值最高的关系作为目标对的最终关系。本发明利用先验知识,将交通场景图像中无关联的目标对滤除,实现推理过程降维,减少无关联的目标之间关系推理对计算资源的占用,提高算法整体的实时性,提高算法在车载嵌入式平台中的适应性。本发明通过将先验知识融入到推理过程,为推理过程提供先验偏置,缓解推理过程倾向于头部类别的现象,提高网络推理结果的合理性。
-
公开(公告)号:CN113989495A
公开(公告)日:2022-01-28
申请号:CN202111362421.5
申请日:2021-11-17
Applicant: 大连理工大学
Abstract: 本发明公开了一种基于视觉的行人召车行为识别方法,包括以下步骤:图像预处理和意图推理。本发明采用计算机视觉的方法从图像中准确高效的识别出具有召车行为的行人,实现自动驾驶出租车更高效的发现乘客,提高了自动驾驶出租车的使用效率,也提高了乘客的出行效率。本发明采用了空间推理网络实现对行人召车行为的推理,减少了对时间维度信息的依赖,与传统的行为识别算法相比,减少了时间特征提取的过程,能够简化网络,提高行为推理的实时性。本发明采用了一套具有逻辑上可解释的融合规则,实现随机森林和图卷积网络的融合,逻辑上可解释的特性能够提高算法的环境适应性和行为识别的精度,实现融合算法对行人召车意图更稳定准确的推理。
-
公开(公告)号:CN111126338A
公开(公告)日:2020-05-08
申请号:CN201911412860.5
申请日:2019-12-31
Applicant: 大连理工大学
Abstract: 本发明公开了一种融合视觉注意力机制的智能车辆环境感知方法,包括以下步骤:将处理后的视差图和灰度图输入到权重共享的孪生卷积神经网络中,提取灰度特征即G特征和深度特征即D特征;利用归一化算法对D特征和车辆转角信号进行归一化,生成与深度和车辆转角有关的注意力分配权重W;采用Hadamard乘积方式进行融合,生成视觉注意力特征A;将压缩后的视觉注意力特征A输入到回归预测网络中进行回归预测,得到目标的位置以及类别。本发明引入视觉注意力机制,有助于减少图像中无关区域对计算资源的占用,且对注意力集中的区域具有更高的检测精确度。本发明可降低交通场景的复杂性,减少无关区域占用的计算资源,提高目标检测的实时性。
-
公开(公告)号:CN115482518A
公开(公告)日:2022-12-16
申请号:CN202211177185.4
申请日:2022-09-26
Applicant: 大连理工大学
IPC: G06V20/58 , G06V20/56 , G06V10/82 , G06V10/774 , G06V10/764 , G06V10/44 , G06V10/26 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向交通场景的可扩展多任务视觉感知方法,包括以下步骤:设计多任务视觉感知模型整体架构;搭建主干特征提取网络搭建任务分支网络;训练网络;检测多任务网络。本发明将主干特征提取网络与分支网络分开训练并保存权重的方法,提高了整个模型在交通场景中多任务检测的实时性,同时兼顾了模型的可扩展性。本发明通过增加边路权重分支网络设计了卷积多通道注意力残差模块,既可以缓解尺度变化带来的问题,又使网络更加关注需要检测的物体,可以有效忽略背景的干扰。本发明不仅缓解了视觉多任务检测需要占用大量硬件资源的问题,提高了网络的实时性,又提高了网络的可扩性,使其可以适应新的任务需求。
-
-
-
-
-