-
公开(公告)号:CN117576723A
公开(公告)日:2024-02-20
申请号:CN202311512490.9
申请日:2023-11-14
Applicant: 杭州电子科技大学
IPC: G06V40/10 , G06V40/20 , G06V10/762 , G06V10/82 , G06N3/08 , G06V10/764 , G06V10/774 , G06N3/088
Abstract: 本发明公开了一种基于语义信息的无监督行人重识别方法。首先构建基于语义信息的无监督行人重识别模型;确定基于语义信息的无监督行人重识别模型的损失函数;然后选择网络模型的数据集,定义数据集的batch size、最大迭代次数和学习率,设置聚类算法的初始聚类半径,获取模型的初始参数;对构建的无监督行人重识别模型进行迭代训练,得到最终的无监督行人重识别模型的参数;最后将待识别的数据输入训练好的无监督行人重识别模型,得到最终的行人重识别结果。本发明通过行人语义特征的预测来细化全局特征的伪标签,这共同减轻了全局特征聚类中的噪声,有效地减少了噪声标签的影响,并在丰富的本地上下文中学习辨别表示。
-
公开(公告)号:CN118262141B
公开(公告)日:2025-02-07
申请号:CN202410175080.8
申请日:2024-02-07
Applicant: 杭州电子科技大学
IPC: G06V10/764 , G06V10/774 , G06T3/4038 , G06N3/0464 , G06N3/0455 , G06N3/09
Abstract: 本发明公开一种基于边缘紧缩和曝光的伪装目标检测方法,包括:在训练阶段,针对训练集中每一训练图像及该训练图像的真值图,训练目标检测模型,使用模型中编码单元输出的编码特征经由条件随机场处理,获取中间过程损失和特征图,在编码单元对应的解码单元中基于特征图和编码特征和相邻解码单元输出的特征基于边缘曝光机制进行解码处理,获取中间过程损失,遍历每一解码单元获得最终输出的真值图,根据中间过程损失和最终的真值图的损失,调整目标检测模型的权重参数,获得训练的目标检测模型,进而对待处理的图像进行检测,获得输出的真值图。本发明的方法能够定位精确边缘,解决了现有技术中边缘无法精确区分的问题。
-
公开(公告)号:CN115782904A
公开(公告)日:2023-03-14
申请号:CN202211637660.1
申请日:2022-12-19
Applicant: 杭州电子科技大学
Abstract: 本发明涉及一种基于非合作博弈的智能汽车换道轨迹规划方法。采用三阶动力学模型,相较于传统的二阶动力学模型,增加了车辆的惯性环节,更贴近真实情况;使用非合作博弈对车辆换道轨迹进行规划,相较于启发式轨迹规划以及图搜索类方法,既考虑多方面因素如安全和舒适度对驾驶员操纵车辆带来的影响,也考虑到了车辆之间的交互性,在未来人类驾驶车辆以及智能驾驶车辆在道路上共存的环境下,更具有实用性;采用了全速度差模型对车辆在换道前后的驾驶做出控制,保障了车辆驾驶的安全性;采用三次B样条插值,改善了离散点的控制量突变问题,更符合实际车辆操纵,且变化曲线相当光滑,使车辆控制更加稳定。
-
公开(公告)号:CN118279709B
公开(公告)日:2024-12-24
申请号:CN202410272861.9
申请日:2024-03-11
Applicant: 杭州电子科技大学
Abstract: 本发明涉及一种显著目标检测方法,包括:S1、获取待检测图像;S2、将待检测图像输入至训练好的显著检测模型中,得到显著图;显著检测模型包括:编码组件、解码组件;解码组件的前n个解码单元和编码单元对应,编码组件基于输入至显著检测模型的图像,输出编码特征以及低维度特征向量;解码组件的第m个解码单元,将低维度特征向量进行解码处理,得到解码特征;第a个解码单元与第a‑1个解码单元之间通过贝叶斯池化模块连接,将第a个解码单元所得到的解码特征贝叶斯池化处理,得到处理后的特征图;第x个解码单元,接收编码特征、贝叶斯池化处理后的特征图,采用边缘紧缩和前景曝光注意力机制进行处理,输出解码特征。
-
公开(公告)号:CN118262141A
公开(公告)日:2024-06-28
申请号:CN202410175080.8
申请日:2024-02-07
Applicant: 杭州电子科技大学
IPC: G06V10/764 , G06V10/774 , G06T3/4038 , G06N3/0464 , G06N3/0455 , G06N3/09
Abstract: 本发明公开一种基于边缘紧缩和曝光的伪装目标检测方法,包括:在训练阶段,针对训练集中每一训练图像及该训练图像的真值图,训练目标检测模型,使用模型中编码单元输出的编码特征经由条件随机场处理,获取中间过程损失和特征图,在编码单元对应的解码单元中基于特征图和编码特征和相邻解码单元输出的特征基于边缘曝光机制进行解码处理,获取中间过程损失,遍历每一解码单元获得最终输出的真值图,根据中间过程损失和最终的真值图的损失,调整目标检测模型的权重参数,获得训练的目标检测模型,进而对待处理的图像进行检测,获得输出的真值图。本发明的方法能够定位精确边缘,解决了现有技术中边缘无法精确区分的问题。
-
公开(公告)号:CN117853616A
公开(公告)日:2024-04-09
申请号:CN202410041920.1
申请日:2024-01-10
Applicant: 杭州电子科技大学
IPC: G06T11/60 , G06N3/0475 , G06N3/0455 , G06N3/096 , G06V10/44 , G06V10/82 , G06V10/764 , G06V10/56 , G06T15/55
Abstract: 本发明涉及计算机图形学和深度学习领域,尤其涉及一种基于神经辐射场的人体动作迁移图像生成方法,包括:将源人体动作图像和目标动作语义掩码进行预处理,并输入训练后的NeRF解耦生成器G,获取G输出的各像素点所属的语义类别概率S、密度σ和颜色C;基于语义类别概率S、密度σ和颜色C生成合成人体图像、合成语义掩码和反转语义掩码;根据合成语义掩码和反转语义掩码自适应调整所述G的参数;并重新获取最终输出的人体动作迁移图像的合成人体图像。上述方法解决了现有方法在动作迁移过程中形状和外观相互粘连的问题,并消除了人体图像合成对骨骼先验的依赖。
-
公开(公告)号:CN116166002A
公开(公告)日:2023-05-26
申请号:CN202211515564.X
申请日:2022-11-30
Applicant: 杭州电子科技大学
IPC: G05D1/02
Abstract: 本发明涉及一种基于分散式自抗扰控制的智能网联汽车编队控制方法,首先建立汽车编队领头车辆的纵向动力学模型,再根据控制目标得到跟随车辆的跟踪误差模型;然后分别设计领头车辆和跟随车辆的自抗扰控制器,其中包括跟踪微分器、扩张状态观测器以及非线性状态误差反馈律三个部分,估计并补偿每个车辆的集总扰动。本发明相较现有的工作采用了三阶动力学模型以及三阶自抗扰控制器,相比于二阶动力学模型多考虑了车辆执行器滞后的动态特性,更接近实际情况,同时采用分散式自抗扰控制,能够更好地保证车辆编队的跟踪安全性能。
-
公开(公告)号:CN115222998A
公开(公告)日:2022-10-21
申请号:CN202211120458.1
申请日:2022-09-15
Applicant: 杭州电子科技大学 , 浙江大华技术股份有限公司
Inventor: 颜成钢 , 殷俊 , 颜拥 , 王洪波 , 胡冀 , 熊剑平 , 李亮 , 郑博仑 , 林聚财 , 孔书晗 , 王亚运 , 孙垚棋 , 金恒 , 朱尊杰 , 高宇涵 , 殷海兵 , 王鸿奎 , 陈楚翘 , 刘一秀 , 李文超 , 王廷宇 , 张勇东 , 张继勇
IPC: G06V10/764 , G06V10/30 , G06V10/40 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种图像分类方法。首先构建通道维度注意力网络和空间维度多尺度自注意力网络;然后将输入图像预处理后输入通道维度注意力网络,生成基于通道维度的注意力特征图;将基于通道维度的注意力特征图输入至空间维度的多尺度自注意力网络,生成基于特征图空间维度的多尺度自注意力特征图;最后将最终生成的多维度多尺度注意力特征图输入到分类器单元中,将模型输出的向量转换成概率表示,完成图像分类。本发明设计了一种新的多尺度自注意力机制,它利用一系列的深度可分离卷积操作,生成特征信息高度相关的局部特征图和区域特征图,不但可以强化自注意力机制的细粒度特征提取能力,还可以高效的提取有效的全局信息。
-
公开(公告)号:CN117853616B
公开(公告)日:2025-02-14
申请号:CN202410041920.1
申请日:2024-01-10
Applicant: 杭州电子科技大学
IPC: G06T11/60 , G06N3/0475 , G06N3/0455 , G06N3/096 , G06V10/44 , G06V10/82 , G06V10/764 , G06V10/56 , G06T15/55
Abstract: 本发明涉及计算机图形学和深度学习领域,尤其涉及一种基于神经辐射场的人体动作迁移图像生成方法,包括:将源人体动作图像和目标动作语义掩码进行预处理,并输入训练后的NeRF解耦生成器G,获取G输出的各像素点所属的语义类别概率S、密度σ和颜色C;基于语义类别概率S、密度σ和颜色C生成合成人体图像、合成语义掩码和反转语义掩码;根据合成语义掩码和反转语义掩码自适应调整所述G的参数;并重新获取最终输出的人体动作迁移图像的合成人体图像。上述方法解决了现有方法在动作迁移过程中形状和外观相互粘连的问题,并消除了人体图像合成对骨骼先验的依赖。
-
公开(公告)号:CN119131174A
公开(公告)日:2024-12-13
申请号:CN202411264576.9
申请日:2024-09-10
Applicant: 杭州电子科技大学
IPC: G06T11/00 , G06T5/30 , G06T5/60 , G06V40/10 , G06V10/44 , G06V10/54 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/084 , G06N3/094
Abstract: 本发明公开了一种姿态驱动的基于注意力机制的人物图像合成方法。首先通过骨架编码器将目标骨架转换为特征映射,通过外观编码器将原图像转换为特征映射;利用多尺度图像细化网络对提取的特征进行多尺度图像细化,获得最终目标人物图像;最后以端到端方式训练模型,同时学习特征融合和目标图像生成。本发明提出了一种姿态驱动的注意力机制,能够有效提取外观特征和姿态特征,通过通道注意力机制的自适应权重获取不同关注度的特征图。最终按权重相加输出,有利于在姿态变换中不丢失原始特征最大程度保留了原图像的信息。
-
-
-
-
-
-
-
-
-