-
公开(公告)号:CN113158943A
公开(公告)日:2021-07-23
申请号:CN202110474134.7
申请日:2021-04-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开一种跨域红外目标检测方法,首先获取有标签的源域数据和含少量标签以及没有标签的目标域数据:然后利用含有标签的源域数据训练Mask R‑CNN‑1网络:利用源域数据和目标域数据对一个新的Mask R‑CNN‑2做域适应训练:最后将待进行目标检测的红外图像输入中训练好的Mask R‑CNN‑2网络,最终实现目标检测功能。本发明方法利用域适应技术,解决了目标域数据标签不足情况下网络训练效果较差的问题,提高了目标检测的准确度;补充了仅在特征层面进行域适应任务的不足,使用了Mask R‑CNN网络,在目标检测的基础上更进一步,实现了像素级目标检测。
-
公开(公告)号:CN113537307A
公开(公告)日:2021-10-22
申请号:CN202110727430.3
申请日:2021-06-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于元学习的自监督域适应方法,将目标域图像重建作为域适应过程中的自监督任务,监督信息即为目标域图像本身,不需要额外的目标域图像标注信息,节省了大量人工标注成本;此外,目标域图像的重建过程能够使网络学习到目标域图像中更丰富的高层语义信息,使得网络能够利用目标域数据的内在特征来辅助网络将源域数据中学习到的知识向目标域迁移,从而提升域适应方法的性能。通过将元学习策略引入自监督域适应中,使得目标域自监督任务和源域分类等特定任务对网络参数的更新方向趋于一致,使得网络能够更好地提取域不变特征,减少了域适应任务和特定任务对网络参数的更新方向不一致造成的负迁移问题,提升了域适应性能。
-
公开(公告)号:CN113128343B
公开(公告)日:2024-09-27
申请号:CN202110297410.7
申请日:2021-03-19
Applicant: 杭州电子科技大学
IPC: G06V20/59 , G06V20/40 , G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08 , G06V20/52
Abstract: 本发明提供一种基于深度学习的司机危险驾驶动作识别方法及系统;首先采集司机的动作数据;然后搭建数据处理云中心;对TSM模型进行改进;再搭建识别模型,对识别模型进行训练,最后通过搭建好的识别系统及训练好的识别模型进行数据处理得到司机违规检测结果。本发明使用改进的TSM模型算法作为基础算法,模型具有非常大的时间感受野来进行高度复杂的时间建模,把2DCNN转变为了伪3D卷积,可以处理时间和空间信息,但没有增加额外的计算量,不需要较高的配置。本发明使用自制数据集对模型参数进行微调,有效提高模型的泛化能力,增强对特定动作的识别能力,可以广泛应用于驾驶监督领域,规范司机的驾驶动作,有效提高国家交通安全。
-
公开(公告)号:CN113537307B
公开(公告)日:2024-04-05
申请号:CN202110727430.3
申请日:2021-06-29
Applicant: 杭州电子科技大学
IPC: G06V10/764 , G06V10/40 , G06V10/774
Abstract: 本发明公开了一种基于元学习的自监督域适应方法,将目标域图像重建作为域适应过程中的自监督任务,监督信息即为目标域图像本身,不需要额外的目标域图像标注信息,节省了大量人工标注成本;此外,目标域图像的重建过程能够使网络学习到目标域图像中更丰富的高层语义信息,使得网络能够利用目标域数据的内在特征来辅助网络将源域数据中学习到的知识向目标域迁移,从而提升域适应方法的性能。通过将元学习策略引入自监督域适应中,使得目标域自监督任务和源域分类等特定任务对网络参数的更新方向趋于一致,使得网络能够更好地提取域不变特征,减少了域适应任务和特定任务对网络参数的更新方向不一致造成的负迁移问题,提升了域适应性能。
-
公开(公告)号:CN113536987A
公开(公告)日:2021-10-22
申请号:CN202110727405.5
申请日:2021-06-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开一种快速的室内场景理解方法,首先利用RGB‑D传感器获得室内整体的3D扫描数据;检测出场景平面,并对平面赋予语义信息,将场景平面去除,仅留下物体;对物体进行语义分割,应用平面语义标签;最后应用树形图对场景进行理解。本发明通过去除布局layout,能够获得更为简洁的物体表示,以便于后续的物体分割识别。
-
公开(公告)号:CN113538657A
公开(公告)日:2021-10-22
申请号:CN202110725474.2
申请日:2021-06-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种组件级别的三维场景理解方法。本发明对于三维场景中的物体,使用树形图表示其物体的结构,预测真实世界扫描场景中物体的零件图信息,作为一种中间表示,以实现物体的鲁棒的、基于零件的表示形式。利用训练集中预测的一种语义标签物体的通常结构来作为先验知识,以便于为扫描场景中的物体更有效的推断出part级别的表示。通过预测出的part图来补全扫描物体的缺失部分,即,这个物体与模板物体是否相似,如果是的话,会通过先验结构来对扫描物体缺失的部分的语义标签进行预测,并通过其他部分的形状作为参考进行补全。
-
公开(公告)号:CN113128343A
公开(公告)日:2021-07-16
申请号:CN202110297410.7
申请日:2021-03-19
Applicant: 杭州电子科技大学
Abstract: 本发明提供一种基于深度学习的司机危险驾驶动作识别方法及系统;首先采集司机的动作数据;然后搭建数据处理云中心;对TSM模型进行改进;再搭建识别模型,对识别模型进行训练,最后通过搭建好的识别系统及训练好的识别模型进行数据处理得到司机违规检测结果。本发明使用改进的TSM模型算法作为基础算法,模型具有非常大的时间感受野来进行高度复杂的时间建模,把2DCNN转变为了伪3D卷积,可以处理时间和空间信息,但没有增加额外的计算量,不需要较高的配置。本发明使用自制数据集对模型参数进行微调,有效提高模型的泛化能力,增强对特定动作的识别能力,可以广泛应用于驾驶监督领域,规范司机的驾驶动作,有效提高国家交通安全。
-
公开(公告)号:CN110674675A
公开(公告)日:2020-01-10
申请号:CN201910711588.4
申请日:2019-08-02
Applicant: 杭州电子科技大学
IPC: G06K9/00
Abstract: 本发明公开了一种行人面部反欺诈方法。本发明步骤如下:步骤1:获取原始的视频图像序列;步骤2:将获取的视频图像序列作为输入,进行人脸检测;步骤3:利用mask rcnn网络对视频图像序列进行实例分割,提取出人脸视频图像序列,输入数据为获取的图像;步骤4:对步骤3中提取出的人脸视频图像序列进行欧拉视频放大,提取出的时间域信息;步骤5:根据步骤4提取出的时间域信息基于阈值判别出真实人脸和伪造人脸。本发明解决了人工识别人脸信息的不准确性和低效性,解放了部分人工生产力,并采用了欧拉视频微小运动放大技术来提取时间域中人脸肤色的规律性变化信息,所提取的信息人工难以伪造,提高了安全性。
-
-
-
-
-
-
-