-
公开(公告)号:CN116228968A
公开(公告)日:2023-06-06
申请号:CN202310004581.5
申请日:2023-01-03
Applicant: 杭州电子科技大学
IPC: G06T17/00 , G06T7/33 , G06N3/08 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于多尺度纤细网络的诱导迭代前视声呐图像配准方法及系统,本发明方法包括步骤:S1.将前视声呐设备获取的真实声呐图像进行处理,并划分为训练集和测试集;S2.创建层间多尺度结构网络;S3.在各层内搭建多尺度纤细结构,对提取图像特征进行聚合;S4.在各层内利用适配区模型对特征进行由易到难的匹配,并自适应跳出迭代,获取输出形变场;S5.用得到的形变场和空间变换网络对运动的前视声呐图像进行变形,并计算参考图像和配准图像的相似度,得到配准后的图像;S6.将配准后的前视声呐图像进行融合,根据配准后的声呐图像重建水下三维地图。本发明通过对少数声呐图像进行数据增强,无需繁琐的大量数据收集,并使用多尺度迭代网络进行精确的图像配准。
-
公开(公告)号:CN111179196B
公开(公告)日:2023-04-18
申请号:CN201911385343.3
申请日:2019-12-28
Applicant: 杭州电子科技大学
IPC: G06T5/00 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于分而治之的多分辨率深度网络图像去高光方法。本发明方法包括训练方法和测试方法。首先构建去高光网络模型,模型由金字塔结构、嵌套残差网络、融合结构组成。金字塔结构使用拉普拉斯金字塔对图像块进行分级,在不同层次上处理高光,嵌套残差网络中采用卷积网络以及残差网络提取不同级别图像块的特征,融合结构结合嵌套残差网络的输出对无高光图像进行预测。模型训练完成后,直接将测试图像分块并由模型预测无高光图像,最后对预测结果进行拼接即可得到无高光整图。本发明的模型结构能够实时高效地去除图像中的高光现象,并对色彩、纹理复杂的图像具有较大的适应性和较强的鲁棒性。
-
公开(公告)号:CN111243045B
公开(公告)日:2023-04-07
申请号:CN202010024870.8
申请日:2020-01-10
Applicant: 杭州电子科技大学
IPC: G06T9/00
Abstract: 本发明公开了一种基于高斯混合模型先验变分自编码器的图像生成方法,包括步骤:S11.预设生成图像训练数据集;其中训练数据集由若干批次的训练数据组成;S12.搭建高斯混合模型先验的变分自编码器网络;S13.将预设的若干批次的训练数据上传至变分自编码器网络中,并确定变分自编码器网络的后验分布和先验分布;S14.确定高斯混合模型中高斯分量之间的关系,得到映射函数;S15.利用变分自编码器网络和得到的映射函数得到重构损失函数和KL散度函数,计算变分自编码器网络的后验分布和先验分布的损失函数,并对变分自编码器网络的参数进行更新以生成图像;S16.当生成图像时,将伪输入作为输入图像上传至变分自编码器网络,得到最终生成的图片。
-
公开(公告)号:CN115273902A
公开(公告)日:2022-11-01
申请号:CN202210816317.7
申请日:2022-07-12
Applicant: 杭州电子科技大学
Abstract: 本发明涉及一种语音情感识别方法及系统,其方法包括以下步骤:S1、对输入语音特征图进行平行通道注意力加权,得到加权特征图;S2、通过小尺寸残差连接与特征卷积对加权特征图进行特征提取,得到深度融合情感特征图;通过大尺度残差连接对加权特征图进行浅层特征提取,得到浅层情感特征图;S3、将深度融合情感特征图与浅层情感特征图相融合,得到加权融合情感特征图。本发明充分提取语音特征图中的情感特征,减少全局特征的丢失,有效实现融合情感特征的提取,同时模型复杂度较低,避免了网络过于复杂导致的训练缓慢,效率低下等问题。
-
公开(公告)号:CN115223158A
公开(公告)日:2022-10-21
申请号:CN202210836076.2
申请日:2022-07-15
Applicant: 杭州电子科技大学
IPC: G06V20/62 , G06V10/774
Abstract: 本发明公开了基于自适应扩散先验变分自编码器的车牌图像生成方法及系统,方法包括:S1.收集车牌图像数据集;S2.构造自适应扩散先验的变分自编码器网络,确定构建生成车牌图像的字符类及字符域;S3.将训练数据输入变分自编码器的编码网络,得到后验分布;S4.采样数据并输入扩散模型前向过程中,对扩散时间自适应调整,得到隐变量;S5.将隐变量输入得分网络,得到不同扩散时刻的隐变量的得分;S6.确定目标字符域及目标字符类,并解码得到变分自编码器重构出的图像数据;S7.求解重构损失及先验分布和后验分布的KL散度距离损失,对变分自编码器和扩散模型的参数进行更新训练并进行测试生成图像;S8.保存最优模型权重,用已训练好的模型生成图像数据。
-
公开(公告)号:CN112487187B
公开(公告)日:2022-06-10
申请号:CN202011386651.0
申请日:2020-12-02
Applicant: 杭州电子科技大学
IPC: G06F16/35 , G06F40/194 , G06N3/04 , G06K9/62
Abstract: 本发明公开了一种基于图网络池化的新闻文本分类方法,包括步骤:S1.在注意力机制中将结构信息与特征信息相结合,并计算图神经网络中一阶邻域内节点之间的相似性得分,得到具有相似性节点的注意力机制;S2.采用稀疏概率激活函数sparsemax算法将得到的注意力机制进行稀疏化,得到节点相对应的集群;S3.采用局部聚合卷积计算每个集群的分数,并通过得分高低来判断集群所含有的信息量;S4.采用topk选出得分最高的前个集群,并将选择出的集群进行重新连边得到最终池化后的神经网络。
-
公开(公告)号:CN108509834B
公开(公告)日:2022-05-31
申请号:CN201810048588.6
申请日:2018-01-18
Applicant: 杭州电子科技大学
IPC: G06V20/40 , G06V10/46 , G06V10/774 , G06K9/62
Abstract: 本发明属于视频特征优化的技术领域,具体涉及一种基于多元对数高斯分布下视频特征的图结构规约方法。基于多元对数高斯分布下视频特征的图结构规约方法,在保持视频特征的空间相关结构前提下,构建出光流特征网络图结构,图结构顶点处光流特征向量的相位信息蕴藏在序列光流场中,光流特征向量的幅度体现了在相连的两帧中目标的变化情况。鉴于光流特征向量幅度值均大于零,视频场景中图结构顶点处的光流特征向量的幅度服从多元对数高斯分布。本发明提出了一种有效降低特征数据量并能实现快速异常检测的视频特征的图结构规约方法。
-
公开(公告)号:CN110110670B
公开(公告)日:2022-03-25
申请号:CN201910384046.0
申请日:2019-05-09
Applicant: 杭州电子科技大学
Abstract: 一种基于Wasserstein度量的行人跟踪中的数据关联方法,包括:获取行人的外观特征,把提取到的外观特征输入到一个特征提取网络,使用这个网路提取行人的外观特征,对于每个行人都会得到一个特征向量;制作数据集,同一个行人相邻视频帧的特征向量组成一个正样本,正样本的label为0;不同行人的特征向量组成一个负样本,负样本的label为1;由于Wasserstein距离的值反映了行人的外观匹配度,将Wasserstein距离与神经网络相结合进行求解;对于满足外观匹配度的行人,利用行人的运动匹配度进行筛选,再利用Hungarian算法实现行人跟踪中的数据关联。有效的减少行人跟踪中漏报行人的个数达到良好的跟踪效果。
-
公开(公告)号:CN112697657B
公开(公告)日:2021-09-14
申请号:CN202110313821.0
申请日:2021-03-24
Applicant: 杭州电子科技大学
Abstract: 本发明涉及一种基于气溶胶颗粒物图像的智能测风系统,包括气溶胶颗粒物图像拍摄设备和图像处理设备;气溶胶颗粒物图像拍摄设备用于获取空气中的气溶胶颗粒物图像;图像处理设备内设有预处理模块、卷积神经网络模块,预处理模块用于对气溶胶颗粒物图像进行预处理;卷积神经网络模块内含训练完成的卷积神经网络,训练完成的卷积神经网络用于根据输入的预处理后的气溶胶颗粒物图像,以输出风速。本发明的系统拍摄空气中气溶胶颗粒物的图像并通过图像计算得出风速,无外露的探测元件,适用于各种环境的风速遥测,且可以通过调整拍摄设备的拍摄区域以快速调整风速遥测目标区域。
-
公开(公告)号:CN108664885B
公开(公告)日:2021-08-31
申请号:CN201810224634.3
申请日:2018-03-19
Applicant: 杭州电子科技大学
Abstract: 基于多尺度级联HourGlass网络的人体关键点检测方法:一:将输入图片生成128*128、64*64和32*32特征图;二:将128*128的特征图送入前2个Modified HourGlass模块中,此2个模块输入输出都为128*128特征图;三:将第2个Modified HourGlass模块输出的128*128特征图和128*128热点图进行下采样成64*64的特征图与步骤一生成的64*64特征图一并送入中间4个Modified HourGlass模块中,此4个模块的输入和输出均为64*64特征图;四:将第6个Modified HourGlass模块输出的64*64特征图和64*64热点图进行下采样成32*32特征图与步骤一生成的32*32特征图一并送入最后2个模块中;五:提取8个Modified HourGlass模块的损失函数,将损失函数相加;网络根据损失函数进行后向反馈,当损失函数达到预期值并稳定后停止训练。
-
-
-
-
-
-
-
-
-