-
公开(公告)号:CN106997379B
公开(公告)日:2020-08-04
申请号:CN201710165283.9
申请日:2017-03-20
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于图片文本点击量的相近文本的合并方法。本发明包括以下步骤:步骤1:提取查询文本的图像点击特征;步骤2:基于图像相似度矩阵构建点击传播模型,更新点击特征向量,包括:相似度矩阵计算和点击传播模型的构建;步骤3:构建基于热门查询的文本字典;基于查询文本的总的图像点击数,选择点击量相对较高的构成字典;步骤4:基于步骤(3)得到的文本字典,对任意的查询文本利用稀疏编码为其归类。本发明通过改进图像的点击特征向量来提高细粒度分类识别率。
-
公开(公告)号:CN111223057A
公开(公告)日:2020-06-02
申请号:CN201911296148.3
申请日:2019-12-16
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于生成对抗网络的增量式聚焦的图像到图像转换方法。本发明包括以下步骤:1、对源图像、目标图像进行数据预处理构成数据二元组;2、网络结构设计,在生成对抗网络模型中加入增强的自我注意力机制模块,并针对网络的两个输出,相应地采用一个鉴别器,进一步增强表征能力以生成更多的细节;3、损失函数设计,提出了增量式聚焦损失以稳定、加速网络训练;4、模型训练,利用反向传播算法训练对抗神经网络模型参数。本发明将增量式聚焦损失和增强的自我注意力机制模块应用于各种无监督和有条件的GANs中来证明它们的有效性,并且达到了训练速度快且稳定的效果。
-
公开(公告)号:CN111209879A
公开(公告)日:2020-05-29
申请号:CN202010029065.4
申请日:2020-01-12
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于深度圈视图的无监督3D物体识别与检索方法。本发明包括如下步骤:步骤1、多圈数据采样;步骤2、训练基于圈数据的多视图深度网络模型;步骤3、相似性匹配与检索;利用训练好的多视图深度网络模型提取各圈视图的特征,并对所有圈视图进行相似性距离计算;通过采用最大池化、均值池化、注意力池化以及最优匹配的方式优化多视图深度网络模型;基于相似性距离,进行排序检索;步骤4、采取圈特征过滤和圈注意力策略滤除重要性低于指定阈值的圈特征,从而在保证识别精度的同时有效减少计算量。本发明提出了新的二维视图采集渲染方式并用其进行无监督训练,在不采用任何人工标注的情况下依然获得了可观的检索精度。
-
公开(公告)号:CN106919951B
公开(公告)日:2020-04-21
申请号:CN201710059373.X
申请日:2017-01-24
Applicant: 杭州电子科技大学
IPC: G06K9/62 , G06F16/583
Abstract: 本发明公开了一种基于点击与视觉融合的弱监督双线性深度学习方法。本发明包括如下步骤:1、从点击数据集中提取每幅图像的文本构成的点击特征,并通过合并语义相近的文本,在合并后的文本空间下构建新的低维紧凑的点击特征;2、点击与视觉特征融合的深度模型构建;3、BP学习网络模型参数;4、计算每一个训练样本的模型预测损失,并构造样本集的相似度矩阵,同时利用样本损失和相似度矩阵学习样本可靠性,利用可靠性给样本加权;5、重复步骤3和4,迭代地优化神经网络模型和样本权重,从而训练整个网络模型直到收敛。本发明融合了点击数据和视觉特征从而构造了新的双线性卷积神经网络框架,能用来更好的对细粒度图像进行识别。
-
公开(公告)号:CN110533024A
公开(公告)日:2019-12-03
申请号:CN201910619662.X
申请日:2019-07-10
Applicant: 杭州电子科技大学
Abstract: 本发明公开了基于多尺度ROI特征的双二次池化细粒度图像分类方法。本发明如下步骤:1.使用Resnet-34网络提取图像的深度视觉特征,并基于该特征生成掩膜;将Mask与视觉特征图进行点乘,构建图像的ROI特征;2.选取Resnet-34网络中低层、中层、高层三种不同尺度的ROI特征,并利用改进的残差采样结构对多尺度特征进行维度变换,实现多尺度特征融合,从而提取多尺度ROI特征;3.利用多层次双二次池化结构,同时建模同层和跨层特征间的交互,并基于池化后的特征向量构建Softmax分类器;4.针对如上步骤构建端到端的网络进行训练,并利用训练好的网络对任一测试图像进行细粒度分类,输出所属类别。本发明在CUB-200-2011、Stanford Cars、FGVC-Aircraft三个数据集上取得了当前领先的准确率。
-
公开(公告)号:CN109978008A
公开(公告)日:2019-07-05
申请号:CN201910141779.1
申请日:2019-02-26
Applicant: 杭州电子科技大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于距离变换的最近邻图潜在相似性优化方法。本发明步骤如下:步骤1:构造最近邻图结构及其谱空间;步骤2:在谱空间的基础上,通过函数分析和推导,构造新的相似性距离函数表达,即距离变换;步骤3:构造全局最近邻域图并将其用于距离变换;步骤4:构造基于一致性惩罚信息ρ的局部最近领域图并将其用于距离变换;步骤5:采用公开数据,分别构造gKNN图和lKNN图,然后利用所提出的距离变换方法优化图结构,输出最终结果。本发明通过使用gKNN图来展开隐藏在数据库中的潜在相似性信息的常见问题。进一步结合惩罚共识信息以构建lKNN图。证实了本方法的鲁棒性和高性能,也证明了PCI信息的优越性。
-
公开(公告)号:CN109271015A
公开(公告)日:2019-01-25
申请号:CN201811177821.7
申请日:2018-10-10
Applicant: 杭州电子科技大学
IPC: G06F1/329 , G06F1/3287 , G06F1/3206 , G06F9/50
Abstract: 本发明公开了一种降低大规模分布式机器学习系统能耗的方法。本发明通过分类器对分布式机器学习系统的负载进行分类识别、状态预测,并通过减少分布式参数服务器间的通信加速任务运行来降低整个分布式机器学习系统的能耗。本发明的方法包含两部分:机器学习负载预测与类型识别方法、分布式机器学习节点间参数“懒同步”机制。本发明通过只将显著更新传递到远程数据中心来减少广域网通信的参数同步机制可以有效减少系统等待时长,加快机器学习收敛速率。对机器学习负载的预测和类型的判别有助于提高工作机的利用率,避免大量工作机开启后处于闲置状态。以上方法缩短了机器学习任务的执行时间,提高了工作机利用率,大大降低了系统能耗。
-
公开(公告)号:CN108830170A
公开(公告)日:2018-11-16
申请号:CN201810510226.4
申请日:2018-05-24
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于分层特征表示的端到端目标跟踪方法。本发明包括以下步骤:1、对视频帧数据进行处理得到输入图像对并提取特征,2、图像对的分层特征表示与对图像对特征进行互相关操作。3、对分层的互相关操作得到的响应图,通过加权融合的方式来平衡形态特征和语义特征得到最终响应图。4、模型训练,利用反向传播算法训练神经网络参数。本发明提出一种针对目标跟踪的神经网络模型,特别是提出一种基于全卷积分层特征融合表示的网络结构,并且获得了目前在目标跟踪领域中拥有比较有竞争力的效果。
-
公开(公告)号:CN108647691A
公开(公告)日:2018-10-12
申请号:CN201810199059.6
申请日:2018-03-12
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于点击特征预测的图像分类方法。本发明步骤如下:1、借助有文本点击信息的图像数据集;利用分词技术及词频-逆向文件频率算法构建每张图片的文本点击特征向量;2、在源点击数据集下,以最小化点击特征预测误差为目标,构建带位置约束的非线性词嵌入模型,从而实现基于视觉特征的点击特征预测,并利用融合的深度视觉与预测点击特征对不含点击信息的任一目标图像集分类;3、构建多任务、跨模态迁移深度学习框架,在同时最小化分类与预测损失下,利用源点击数据集、目标数据集训练深度视觉与词嵌入模型;4、通过反向传播算法对步骤2中的网络参数进行训练,直至整个网络模型收敛。本发明使得预测的点击特征更为准确。
-
公开(公告)号:CN106919951A
公开(公告)日:2017-07-04
申请号:CN201710059373.X
申请日:2017-01-24
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于点击与视觉融合的弱监督双线性深度学习方法。本发明包括如下步骤:1、从点击数据集中提取每幅图像的文本构成的点击特征,并通过合并语义相近的文本,在合并后的文本空间下构建新的低维紧凑的点击特征;2、点击与视觉特征融合的深度模型构建;3、BP学习网络模型参数;4、计算每一个训练样本的模型预测损失,并构造样本集的相似度矩阵,同时利用样本损失和相似度矩阵学习样本可靠性,利用可靠性给样本加权;5、重复步骤3和4,迭代地优化神经网络模型和样本权重,从而训练整个网络模型直到收敛。本发明融合了点击数据和视觉特征从而构造了新的双线性卷积神经网络框架,能用来更好的对细粒度图像进行识别。
-
-
-
-
-
-
-
-
-