-
公开(公告)号:CN113936235A
公开(公告)日:2022-01-14
申请号:CN202111075792.5
申请日:2021-09-14
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于质量评估的视频显著性目标检测方法,首先构建视频显著性目标检测网络框架,基于一个双流的编码‑解码结构,主干网络采用ResNet101网络,一条支流的输入为RGB图像,提取图像的空间特征,称其RGB支流,另一条支流的输入为光流图像,提取图像间的时间信息,称其运动支流,通过RAFT算法处理视频中连续两帧图像,计算得到光流图,用于反映视频中物体的运动。在两个分支中引入了多尺度感知模块、质量评估模块、时空信息交互模块、双差分增强模块,与现有的基于双流的视频显著性目标检测方法相比,本文提出的框架能自适应的捕获准确的空间和时间信息,从而获取准确的预测结果。
-
公开(公告)号:CN113935404A
公开(公告)日:2022-01-14
申请号:CN202111120902.5
申请日:2021-09-24
Applicant: 杭州电子科技大学
IPC: G06K9/62 , G06V10/776 , G06V10/774
Abstract: 本发明公开了一种光场显著性检测数据集清晰度评价方法。首先通过显著性区域掩膜制作三个掩膜,并获取对应的窗函数;通过掩膜A获得光场焦堆栈图像显著性区域图像;用傅里叶变换将焦堆栈显著性区域图像从空域转换到频域,获得其频谱信息;对显著性区域高频信息进行傅里叶反变换,得到空域图像;用腐蚀的掩膜B截取空域高频部分,计算高频图像灰度值之和,用以表示焦堆栈图像显著性区域高频能量值大小;对堆栈图像显著性区域高频能量值进行归一化,用来表示该图片的训练权重。本发明针对数据集焦堆栈中显著性区域进行清晰程度判定,并以此作为焦堆栈中该图片训练权重的评价标准,显著性区域越清晰,则该图片的训练权重越高。
-
公开(公告)号:CN113920354A
公开(公告)日:2022-01-11
申请号:CN202111075801.0
申请日:2021-09-14
Applicant: 杭州电子科技大学
IPC: G06V10/764 , G06V10/774 , G06V40/20 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于事件相机的动作识别方法,首先搭建事件相机数据采集系统,然后对事件数据进行处理;再搭建软件框架,通过搭建的事件相机数据采集系统采集人类动作数据对模型进行训练;最后将待识别的人类动作事件流进行处理,然后将处理后的输送到步骤四训练好的动作识别网络,通过训练好的动作识别网络进行动作识别,输出对应的动作类别。本发明使用先进的DAVIS346相机作为采集设备,事件数据流具有很强的时间信息,可以有效地捕捉动作的变化。本方法鲁棒性强,对极端光照情况具有免疫力,同时实时性强,冗余小。
-
公开(公告)号:CN113792621A
公开(公告)日:2021-12-14
申请号:CN202110995008.6
申请日:2021-08-27
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于FPGA的目标检测加速器设计方法,首先选择要移植到该平台上的目标检测算法;然后根据选择的算法的特点,在FPGA硬件平台下采用软硬件协同设计的思想进行总体架构设计;最后对所选择的目标检测算法模型网络参数进行16位动态定点数据量化,依据网络模型的运算特点对数据的调度进行规划,并提出一个CNN硬件加速器架构,包括输入输出模块、卷积模块、池化模块、重排序模块、全连接模块、激活模块以及控制模块。本发明方法利用较少的硬件资源完成目标检测加速器的设计,提高了总线带宽利用率,具有一定的通用性和可扩展性,功耗较低,可以达到一个较高的能效比,比较适合应用在有严重功耗限制的场所。
-
公开(公告)号:CN110399518B
公开(公告)日:2021-12-10
申请号:CN201910520136.8
申请日:2019-06-17
Applicant: 杭州电子科技大学
IPC: G06F16/583 , G06F16/9032 , G06K9/46 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图卷积的视觉问答增强方法。本发明包括以下步骤:步骤1、分别提取图片和问题的特征表示;步骤2、提取基于问题生成的图片中各目标之间的关系;步骤3、将带有问题信息的图片生成为graph,并且为每个顶点挑选最相关的目标,为每个顶点生成新的特征表示之后,对graph进行最大池化和分类。本发明利用GCN网络和图片中物体之间的关系来探索高层次语义,对视觉问答技术有较大意义。
-
公开(公告)号:CN113554599A
公开(公告)日:2021-10-26
申请号:CN202110718776.7
申请日:2021-06-28
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于人类视觉效应的视频质量评价方法。本发本发明方法包括内容特征提取网络、上下文注意机制网络和时间记忆效应网络。模型的输入是当前帧图像。首先,深度特征提取网络提取内容感知特征,注意力模块采用循环神经网络强化学习内容感知特征,再将注意力感知转移。然后,将内容感知特征与注意力感知转移相结合得到当前帧的质量得分,通过时间记忆效应模型对帧质量得分进行全局平均池化,得到视频的总体质量。本发明方法提供的网络模型可以充分有效地利用模仿人类视觉行为来实现对视频的质量评价。
-
公开(公告)号:CN113538657A
公开(公告)日:2021-10-22
申请号:CN202110725474.2
申请日:2021-06-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种组件级别的三维场景理解方法。本发明对于三维场景中的物体,使用树形图表示其物体的结构,预测真实世界扫描场景中物体的零件图信息,作为一种中间表示,以实现物体的鲁棒的、基于零件的表示形式。利用训练集中预测的一种语义标签物体的通常结构来作为先验知识,以便于为扫描场景中的物体更有效的推断出part级别的表示。通过预测出的part图来补全扫描物体的缺失部分,即,这个物体与模板物体是否相似,如果是的话,会通过先验结构来对扫描物体缺失的部分的语义标签进行预测,并通过其他部分的形状作为参考进行补全。
-
公开(公告)号:CN113536978A
公开(公告)日:2021-10-22
申请号:CN202110720395.2
申请日:2021-06-28
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于显著性的伪装目标检测方法。本发明第一条路径首先提取图像的低级、中级与高级特征并通过合并区分性特征与多尺度特征融合相加得到一个初始的伪装目标区域特征图。第二条路径将第一条路径得到的中层特征与初始伪装目标区域特征图融合的同时对特征进行加强,然后再次提取高级特征并进行与第一条路径相似的操作得到最终的伪装目标区域特征图,其结果为一张像素值在[0,1]的灰度图。本发明将注意力机制引入图像处理,以初始预测图作为注意力引导中级特征的增强。同时使用残差增强模块对特征进行处理增强特征。通过搜索识别两个阶段对图像中的伪装目标区域进行检测。利用图像的多级特征与显著性引导实现对伪装目标的预测。
-
公开(公告)号:CN113516616A
公开(公告)日:2021-10-19
申请号:CN202110302082.5
申请日:2021-03-22
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于图像识别的眼底照片自动检测方法。首先进行眼底照片获取及预处理;然后对眼底照片区域进行划分,进行区域深度特征提取;生成全局特征向量;最后通过全局特征向量对分类网络进行训练,通过训练好的分类网络完成眼底照片分类检测。本发明方法有效的减少了网络的参数个数,缓解了模型的过拟合问题;获得平移和形变的鲁棒性。经过分区和合并得到区域和全局的特征,有利于发掘更多特征信息。用全局池化层代替全连接层来融合学到的深度特征有效避免了网络的冗余,具有较好的预测性能。
-
公开(公告)号:CN113393688A
公开(公告)日:2021-09-14
申请号:CN202110523552.0
申请日:2021-05-13
Applicant: 杭州电子科技大学
IPC: G08G1/0967 , G08G1/16
Abstract: 本发明公开了一种基于队列长度预测的交叉口生态驾驶优化方法。首先,利用车路通信技术获得交通流和信号灯相位信息,基于运动冲击波模型预测队列排队长度;接下来,考虑排队长度,构建燃油最优车辆轨迹优化问题,并将其简化为停车等待和不停车优化问题,以获取实时解;然后,将获取的实时解作为智能汽车的期望加速度,并且为了保证车辆的安全,必要时,将根据智能驾驶员模型所得的安全加速度作为智能汽车的期望加速度,以避免碰撞。本发明方法使得智能汽车利用车路通信技术获得交通流与信号灯信息,以预测车队长度,所设计的生态驾驶算法避免了车辆在交叉口处的剧烈加减速,从而减少智能汽车通过交叉口时的油耗与行驶时间。
-
-
-
-
-
-
-
-
-