-
公开(公告)号:CN119360182A
公开(公告)日:2025-01-24
申请号:CN202411503456.X
申请日:2024-10-25
Applicant: 杭州电子科技大学
IPC: G06V10/82 , G06V10/42 , G06V10/44 , G06V10/774 , G06V10/766 , G06T7/00 , G06N3/042 , G06N3/0455 , G06N3/0464 , G06N3/0895 , G06N3/096
Abstract: 本发明公开了一种基于结构特征感知的半监督头影测量关键点检测方法,首先进行数据预处理并构建数据集;然后进行二阶段检测模型构建与损失函数设计,二阶段半监督模型框架的主干网络包含两个阶段:第一阶段利用全局上下文信息通过热力图回归方法检测关键点粗略位置;第二阶段通过捕捉关键点之间的全局‑局部相关性进行精细化预测;最后通过学生网络预训练与半监督师生模型训练得到预测结果。本发明采用了由粗略到精细的二阶段检测方法预测头影测量关键点,并引入了半监督师生模型架构的迭代网络设计,在每一轮此由教师网络指导学生网络,并循环迭代网络参数得到最终预测结果。在内部数据集上的实验结果证明了该方法的有效性。
-
公开(公告)号:CN113139587A
公开(公告)日:2021-07-20
申请号:CN202110350164.7
申请日:2021-03-31
Applicant: 杭州电子科技大学
Abstract: 本发明提出了一种自适应交互结构学习的双二次池化模型。本发明步骤如下:首先利用层次化深度模型提取图像的多级深度特征,在跨级特征间获得多组双二次池化特征后,构建维度为池化组个数的权重向量;在深度网络中添加权重与池化特征的乘法模块,在加权池化特征上进行分类;其次对整个权重向量施加L1范数的稀疏约束;然后设计监督模块,在所有加权池化特征上构建分类损失。4、根据上述步骤建立多任务端到端的深度学习模型,在特定数据集上训练并微调整个网络,将最终模型在测试集上测试性能。本发明能针对特定数据集自适应挖掘最合适的交互结构,具有很强的现实性和普适性。
-
公开(公告)号:CN112329538A
公开(公告)日:2021-02-05
申请号:CN202011078852.4
申请日:2020-10-10
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于微波视觉的目标分类方法。本发明步骤如下:1、利用微波发射和接收天线获取电磁散射场数据并进行预处理。2、构建复数卷积神经网络实现目标分类,该网络包括:复数卷积层、复数批归一化层和复数激活层。3、在复数卷积神经网络中引入了注意力机制模块。4、将步骤1中获取的电磁散射场数据作为训练数据,输入到经过步骤2和3搭建的网络中,通过反向传播算法训练网络参数,直至整个网络模型收敛。本发明设计了专门的带有注意力机制的复数卷积神经网络,其学习效果是优于实数卷积神经网络的。同时,使用这种基于微波视觉特征的目标分类方法能在特定困难场景下无法应用RGB图像时,仍能有效进行目标分类。
-
公开(公告)号:CN106997379B
公开(公告)日:2020-08-04
申请号:CN201710165283.9
申请日:2017-03-20
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于图片文本点击量的相近文本的合并方法。本发明包括以下步骤:步骤1:提取查询文本的图像点击特征;步骤2:基于图像相似度矩阵构建点击传播模型,更新点击特征向量,包括:相似度矩阵计算和点击传播模型的构建;步骤3:构建基于热门查询的文本字典;基于查询文本的总的图像点击数,选择点击量相对较高的构成字典;步骤4:基于步骤(3)得到的文本字典,对任意的查询文本利用稀疏编码为其归类。本发明通过改进图像的点击特征向量来提高细粒度分类识别率。
-
公开(公告)号:CN106919951B
公开(公告)日:2020-04-21
申请号:CN201710059373.X
申请日:2017-01-24
Applicant: 杭州电子科技大学
IPC: G06K9/62 , G06F16/583
Abstract: 本发明公开了一种基于点击与视觉融合的弱监督双线性深度学习方法。本发明包括如下步骤:1、从点击数据集中提取每幅图像的文本构成的点击特征,并通过合并语义相近的文本,在合并后的文本空间下构建新的低维紧凑的点击特征;2、点击与视觉特征融合的深度模型构建;3、BP学习网络模型参数;4、计算每一个训练样本的模型预测损失,并构造样本集的相似度矩阵,同时利用样本损失和相似度矩阵学习样本可靠性,利用可靠性给样本加权;5、重复步骤3和4,迭代地优化神经网络模型和样本权重,从而训练整个网络模型直到收敛。本发明融合了点击数据和视觉特征从而构造了新的双线性卷积神经网络框架,能用来更好的对细粒度图像进行识别。
-
公开(公告)号:CN110533024A
公开(公告)日:2019-12-03
申请号:CN201910619662.X
申请日:2019-07-10
Applicant: 杭州电子科技大学
Abstract: 本发明公开了基于多尺度ROI特征的双二次池化细粒度图像分类方法。本发明如下步骤:1.使用Resnet-34网络提取图像的深度视觉特征,并基于该特征生成掩膜;将Mask与视觉特征图进行点乘,构建图像的ROI特征;2.选取Resnet-34网络中低层、中层、高层三种不同尺度的ROI特征,并利用改进的残差采样结构对多尺度特征进行维度变换,实现多尺度特征融合,从而提取多尺度ROI特征;3.利用多层次双二次池化结构,同时建模同层和跨层特征间的交互,并基于池化后的特征向量构建Softmax分类器;4.针对如上步骤构建端到端的网络进行训练,并利用训练好的网络对任一测试图像进行细粒度分类,输出所属类别。本发明在CUB-200-2011、Stanford Cars、FGVC-Aircraft三个数据集上取得了当前领先的准确率。
-
公开(公告)号:CN108647691A
公开(公告)日:2018-10-12
申请号:CN201810199059.6
申请日:2018-03-12
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于点击特征预测的图像分类方法。本发明步骤如下:1、借助有文本点击信息的图像数据集;利用分词技术及词频-逆向文件频率算法构建每张图片的文本点击特征向量;2、在源点击数据集下,以最小化点击特征预测误差为目标,构建带位置约束的非线性词嵌入模型,从而实现基于视觉特征的点击特征预测,并利用融合的深度视觉与预测点击特征对不含点击信息的任一目标图像集分类;3、构建多任务、跨模态迁移深度学习框架,在同时最小化分类与预测损失下,利用源点击数据集、目标数据集训练深度视觉与词嵌入模型;4、通过反向传播算法对步骤2中的网络参数进行训练,直至整个网络模型收敛。本发明使得预测的点击特征更为准确。
-
公开(公告)号:CN106919951A
公开(公告)日:2017-07-04
申请号:CN201710059373.X
申请日:2017-01-24
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于点击与视觉融合的弱监督双线性深度学习方法。本发明包括如下步骤:1、从点击数据集中提取每幅图像的文本构成的点击特征,并通过合并语义相近的文本,在合并后的文本空间下构建新的低维紧凑的点击特征;2、点击与视觉特征融合的深度模型构建;3、BP学习网络模型参数;4、计算每一个训练样本的模型预测损失,并构造样本集的相似度矩阵,同时利用样本损失和相似度矩阵学习样本可靠性,利用可靠性给样本加权;5、重复步骤3和4,迭代地优化神经网络模型和样本权重,从而训练整个网络模型直到收敛。本发明融合了点击数据和视觉特征从而构造了新的双线性卷积神经网络框架,能用来更好的对细粒度图像进行识别。
-
公开(公告)号:CN112329538B
公开(公告)日:2024-07-02
申请号:CN202011078852.4
申请日:2020-10-10
Applicant: 杭州电子科技大学
IPC: G06V20/10 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/084 , G06T3/4007
Abstract: 本发明公开了一种基于微波视觉的目标分类方法。本发明步骤如下:1、利用微波发射和接收天线获取电磁散射场数据并进行预处理。2、构建复数卷积神经网络实现目标分类,该网络包括:复数卷积层、复数批归一化层和复数激活层。3、在复数卷积神经网络中引入了注意力机制模块。4、将步骤1中获取的电磁散射场数据作为训练数据,输入到经过步骤2和3搭建的网络中,通过反向传播算法训练网络参数,直至整个网络模型收敛。本发明设计了专门的带有注意力机制的复数卷积神经网络,其学习效果是优于实数卷积神经网络的。同时,使用这种基于微波视觉特征的目标分类方法能在特定困难场景下无法应用RGB图像时,仍能有效进行目标分类。
-
公开(公告)号:CN116562366A
公开(公告)日:2023-08-08
申请号:CN202310500556.6
申请日:2023-05-06
Applicant: 杭州电子科技大学
IPC: G06N3/098 , G06N3/048 , G06N3/084 , G06F18/2113 , G06F18/214 , G06F18/24 , G06V10/82 , G06V10/764 , G06V10/774 , G06V10/771
Abstract: 本发明公开了一种基于特征选择和特征对齐的联邦学习方法。本发明步骤:1、数据集获取。2、中央服务器下发当前的全局特征提取模块至所有客户机。客户机生成中间层特征并上传至中央服务器。中央服务器利用接收到中间层特征训练客户机鉴别器和特征注意力向量。3、中央服务器选择客户机子集参与本轮联邦学习并下发全局模型。4、被选中的客户机利用得到的特征注意力向量构造特征掩膜向量进行特征筛选,并进行特征对齐。5、利用得到客户机鉴别器,结合对齐损失和预测损失更新全局模型后上传至中央服务器。6、中央服务器聚合接收到的本地模型生成新的全局模型。本发明能够提升联邦学习训练的收敛速度与模型预测精度。
-
-
-
-
-
-
-
-
-