-
公开(公告)号:CN113538442B
公开(公告)日:2024-04-09
申请号:CN202110624851.3
申请日:2021-06-04
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种使用自适应特征融合的RGB‑D显著目标检测方法,首先使用2个结构相同的编码器网络分别对RGB图像和Depth图像这2个数据流编码,编码后对2个数据流分别获得m个层级的特征;然后在RGB和Depth两个数据流的解码过程中分别使用自适应特征融合;在联合数据流中对2个数据流的特征融合;最后使用损失函数对该网络模型优化。本发明所述的方法,可以提高RGB‑D显著目标检测的效果。通过使用自适应特征融合,可以有效融合数据流内不同层级的特征。通过使用数据流间特征融合方法,可以有效融合2个数据流的特征。
-
公开(公告)号:CN113792621B
公开(公告)日:2024-04-05
申请号:CN202110995008.6
申请日:2021-08-27
Applicant: 杭州电子科技大学
IPC: G06V10/94 , G06V10/25 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/063 , G06F9/50 , G06F8/76 , G06F8/41 , G06F9/38 , G06F9/302
Abstract: 本发明公开了一种基于FPGA的目标检测加速器设计方法,首先选择要移植到该平台上的目标检测算法;然后根据选择的算法的特点,在FPGA硬件平台下采用软硬件协同设计的思想进行总体架构设计;最后对所选择的目标检测算法模型网络参数进行16位动态定点数据量化,依据网络模型的运算特点对数据的调度进行规划,并提出一个CNN硬件加速器架构,包括输入输出模块、卷积模块、池化模块、重排序模块、全连接模块、激活模块以及控制模块。本发明方法利用较少的硬件资源完成目标检测加速器的设计,提高了总线带宽利用率,具有一定的通用性和可扩展性,功耗较低,可以达到一个较高的能效比,比较适合应用在有严重功耗限制的场所。
-
公开(公告)号:CN113392727B
公开(公告)日:2024-04-05
申请号:CN202110586099.8
申请日:2021-05-27
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于动态特征选择的RGB‑D显著目标检测方法。本发明提出了一种动态选择网络,包括动态选择模块DSM和跨模态全局上下文模块CGCM,其中DSM又包含了两个子模块:跨模态注意力模块CAM和双向门控池化模块BGPM。通过CAM从通道和空间的角度来动态地挖掘RGB和深度图之间的互补信息,通过CGCM从全局的角度来精准地凸出显著目标。通过BGPM,以门控选择的方式优化了跨级别信息,以动态选择的方式强化了多尺度信息。最后,本发明进一步引入了边缘监督策略,并将空间注意力机制嵌入到其中,以反馈的方式保证了显著目标边界的准确性和清晰性,有效提升了模型的细节表征能力。
-
公开(公告)号:CN117576723A
公开(公告)日:2024-02-20
申请号:CN202311512490.9
申请日:2023-11-14
Applicant: 杭州电子科技大学
IPC: G06V40/10 , G06V40/20 , G06V10/762 , G06V10/82 , G06N3/08 , G06V10/764 , G06V10/774 , G06N3/088
Abstract: 本发明公开了一种基于语义信息的无监督行人重识别方法。首先构建基于语义信息的无监督行人重识别模型;确定基于语义信息的无监督行人重识别模型的损失函数;然后选择网络模型的数据集,定义数据集的batch size、最大迭代次数和学习率,设置聚类算法的初始聚类半径,获取模型的初始参数;对构建的无监督行人重识别模型进行迭代训练,得到最终的无监督行人重识别模型的参数;最后将待识别的数据输入训练好的无监督行人重识别模型,得到最终的行人重识别结果。本发明通过行人语义特征的预测来细化全局特征的伪标签,这共同减轻了全局特征聚类中的噪声,有效地减少了噪声标签的影响,并在丰富的本地上下文中学习辨别表示。
-
公开(公告)号:CN117218176A
公开(公告)日:2023-12-12
申请号:CN202311052744.3
申请日:2023-08-21
Applicant: 杭州电子科技大学
Inventor: 颜成钢 , 王磊 , 朱尊杰 , 薛安克 , 赵思成 , 孙垚棋 , 高宇涵 , 王鸿奎 , 赵治栋 , 殷海兵 , 王帅 , 张继勇 , 李宗鹏 , 丁贵广 , 付莹 , 郭雨晨
IPC: G06T7/593 , G06T15/00 , G06T17/00 , G06N3/0895 , G06N3/045
Abstract: 本发明公开了一种基于NeRF生成数据的立体深度估计方法。首先对N个室内物体进行扫描,采集双目红外图像,每次扫描数据不含重复的物体;然后训练NeRF模型,得到任意角度的红外图像;再进行数据集预处理;最后确定并训练立体深度估计模型。本发明结合d435i深度传感器和NeRF模型,仅使用采集的红外图像,经过NeRF渲染生成任意角度的红外图像立体对,通过深度学习算法,得到预测的深度图。相较于传统经典算法,大大降低了数据收集的难度和成本,也避免了过度平滑、边缘增肥等问题。
-
公开(公告)号:CN117029858A
公开(公告)日:2023-11-10
申请号:CN202311052725.0
申请日:2023-08-21
Applicant: 杭州电子科技大学丽水研究院
IPC: G01C21/34
Abstract: 本发明公开了一种基于改进式蚁群算法的外卖员路径规划系统及方法。本发明系统包括订单信息授权模块、外卖员当前位置获取模块、商家及配送位置获取模块、路况匹配模块、外卖员配送路径规划模块和外卖员配送路径导航模块。相比于外卖员自行寻找配送路径,本发明专利提出的外卖员路径规划系统通过小程序获取外卖员订单信息,系统将外卖员位置以及商家位置和订单配送位置与地图上的路况信息进行对应,并且通过改进式遗传算法对外卖员配送路径进行规划。同时系统及时更新订单信息,及时对路径进行重新规划,提高了外卖员配送的效率。
-
公开(公告)号:CN116469003A
公开(公告)日:2023-07-21
申请号:CN202310285121.4
申请日:2023-03-22
Applicant: 杭州电子科技大学
IPC: G06V20/10 , G06V10/764 , G06V10/766 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于弹性网络正则化回归算法的遥感图像分类方法。针对现阶段对于高分辨率遥感图像的分类,通过一种弹性网络正则化回归算法,在基于稀疏表示的分类方法中加入基于协作表示的方法,两者都有助于图像分类中单个类别的样本建立在一个线性子空间上,将测试样本表示为训练样本的线性组合,适用于图像的特殊性和复杂性。此外,本发明将提出的弹性正则化回归算法扩展到任意核空间,以处理隐藏在原始图像特征中的非线性结构,从而进一步提高分类性能。
-
公开(公告)号:CN116385406A
公开(公告)日:2023-07-04
申请号:CN202310374306.2
申请日:2023-04-10
Applicant: 杭州电子科技大学
IPC: G06T7/00 , G06T7/11 , G06V10/774 , G06V10/764 , G06V10/80 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于U‑Net的眼眶肿瘤图像分割方法,首先进行眼眶肿瘤数据集的采集;然后进行数据的预处理;再构建基于U‑Net的眼眶肿瘤图像分割模型;通过预处理后的数据集训练眼眶肿瘤图像分割模型;最后利用训练好的模型参数,实现眼眶肿瘤图像分割模型在眼眶肿瘤图像上的肿瘤区域分割。本发明的网络架构模型对于尺度变化明显的病情肿瘤区域能有较好的尺度敏感性,从而有利于改善分割模型对一些尺度变化大的难样本的分割精度。
-
公开(公告)号:CN116071606A
公开(公告)日:2023-05-05
申请号:CN202310210827.4
申请日:2023-03-07
Applicant: 杭州电子科技大学丽水研究院
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/40 , G06N3/047 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了基于多尺度多注意力实例学习的sMRI图像分类方法,首先获取数据集,构建多尺度多注意力实例学习模型,通过空间金字塔池化模块将不同大小脑区转化为相同尺度;通过patch‑net处理模块获取相应的局部特征增强;通过注意力多实例学习模块来增强全局特征;通过分类器得到分类结果;最后通过训练多尺度多注意力实例学习模型。本发明是采取了区域块的分析方法,能获取对大脑病变影响更大的位置,引入了双注意机制,能增强到局部和全局的特征;本发明采用了将分割数据和脑区数据结合的多模态数据,加强分类效果。
-
公开(公告)号:CN115589455A
公开(公告)日:2023-01-10
申请号:CN202211274388.5
申请日:2022-10-18
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于FPGA+ARM的夜间视频图像增强系统,包括图像采集单元,运算加算单元,中央控制处理单元,显示单元四个部分。运算加速单元利用FPGA的并行处理和高频特性,实现简化后的三个不同尺度的高斯滤波器。中央控制处理单元利用ARM较强的逻辑运算能力和移植简单的特性,来完成复杂度较高的自适应直方图均衡化算法部分和逻辑控制。本发明视频图像采集单元支持DVP和Cameralink接口,运算加速单元利用FPGA的并行特性提升计算速率,中央控制单元通过ARM来进行复杂的逻辑和算数运算,最后通过显示单元输出结果。相对于传统系统,本发明在能够更加精确的显示出夜间图像的边缘信息,同时通过FPGA+ARM的组合满足了系统实时性的需求。
-
-
-
-
-
-
-
-
-