-
公开(公告)号:CN118155290A
公开(公告)日:2024-06-07
申请号:CN202410442762.0
申请日:2024-04-12
Applicant: 杭州电子科技大学丽水研究院
IPC: G06V40/20 , G06V10/40 , G06V10/80 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种多模态深度感知的高精度集成动态手势识别方法。首先获取动态手势数据集,应用2D和3D数据增强方法增加样本数量;然后将增强后的数据进行灰度变换,并分别输入3D‑CNN子网络、ConvLSTM子网络和TCN子网络分别提取手势序列特征;将手势序列特征直接或融合输入相应分类器;最后将分类器结果集成,输出最终的概率分布。本发明额外对数据进行了数据增强和灰度变换,在数据原有的多模态之外,增加了灰度2D和灰度3D模态,使得本方法能识别分辨率更低的输入图像;并且本发明使用了一种优化加权集成,能够更有效地优化的综合多模态的分类结果。
-
公开(公告)号:CN117793538A
公开(公告)日:2024-03-29
申请号:CN202410200816.2
申请日:2024-02-23
Applicant: 北京理工大学 , 杭州电子科技大学丽水研究院 , 杭州电子科技大学
Abstract: 本申请提出了一种图像自动曝光矫正与增强方法及装置,该方法包括:根据正常曝光Raw图像数据中的线性关系,构造有监督的异常曝光图像数据集;构建全局亮度调整网络与频率增强重建网络,将异常曝光图像数据集输入全局亮度调整网络,得到亮度矫正图像,将亮度矫正图像输入频率增强重建网络,得到矫正增强图像;基于矫正增强图像与正常曝光Raw图像数据,计算损失值,并基于损失值对其网络模型参数进行优化,得到优化模型;将其他图像输入优化模型得到优化图像,根据图像质量评价指标评价优化图像,得到客观评估指标。基于本申请提出的方案,能够对原始Raw图像数据达到自动曝光矫正与增强的效果,从而应对复杂环境下成像质量低的问题。
-
公开(公告)号:CN116310695A
公开(公告)日:2023-06-23
申请号:CN202310393116.5
申请日:2023-04-13
Applicant: 杭州电子科技大学丽水研究院
IPC: G06V10/80 , G06V10/82 , G06V20/40 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于门控融合网络的视频显著性预测方法,首先构建门控融合网络;通过编码器提取视频片段包含的时空特征,用桥接模块增强顶层编码特征,再使用门控融合模块融合编解码特征,最后对门控融合特征进行解码处理,预测最终的显著图。本发明提出了一个门控融合模块用于将编码器的多级特征有效地融入到解码器中。该模块沿着时间、空间和通道维度加权编码特征,从而更加精准地定位显著对象的位置,并过滤掉特征中冗余的时空信息。
-
公开(公告)号:CN116306828A
公开(公告)日:2023-06-23
申请号:CN202310210826.X
申请日:2023-03-07
Applicant: 杭州电子科技大学丽水研究院
Abstract: 本发明公开了一种基于图同构神经网络的脑网络链接预测方法,首先对于脑网络数据进行处理,完成脑结构网络建模;再构建基于图同构神经网络的脑网络链接预测模型,包括子图提取模块和图同构神经网络模块;之后进行脑网络链接预测模型的训练和测试;最后通过训练完成的脑网络链接预测模型完成脑网络链接预测。本发明在实现较为高的准确率的基础上降低了时间成本,极大的提升了模型对于子图结构的学习能力,对于接下来的链接预测有十分重要的意义。
-
公开(公告)号:CN119672107A
公开(公告)日:2025-03-21
申请号:CN202411725640.9
申请日:2024-11-28
Applicant: 杭州电子科技大学丽水研究院
IPC: G06T7/73 , G06T7/00 , G06T5/30 , G06T7/155 , G06T5/70 , G06T5/60 , G06T7/40 , G06V10/764 , G06V10/82 , G06V10/30
Abstract: 本发明公开了脑动脉栓塞位置的检测方法、装置、电子设备和存储介质,首先获取多组的脑动脉图像针对栓塞的标记位置;对得到特征数据进行预处理,通过特征提取算法,从预处理后的脑动脉栓塞图像中提取影像组学的特征数据;再使用随机森林算法对提取的特征进行重要性筛选,使用多种机器学习模型分别对提取的特征进行分类预测,最后选择性能最优的模型对栓塞位置进行预测。本发明利用了影像组学的纹理特征去预测脑动脉栓塞的位置,可以更好的预测脑动脉栓塞的位置。本发明对提取的特征数据利用了随机森林模型进行重要性筛选,这种筛选方法有助于去掉那些对模型预测影响不大的特征,从而简化模型,从而提高模型的训练效率和泛化能力。
-
公开(公告)号:CN118967450A
公开(公告)日:2024-11-15
申请号:CN202411452810.0
申请日:2024-10-17
Applicant: 北京理工大学 , 杭州电子科技大学丽水研究院 , 杭州电子科技大学
IPC: G06T3/4053 , G06T5/50
Abstract: 本发明涉及一种基于结构信息的不对齐多源数据的光谱图像融合超分方法及系统,属于计算摄像技术领域。本发明首先使用梯度计算对输入的高光谱和多光谱图像提取梯度图,再使用纹理编码器和结构编码器分别对图像和梯度图进行编码,获取纹理特征金字塔和结构特征金字塔,然后使用结构注意力引导的特征融合对齐模块在各个层级进行特征融合获得对齐特征,最后使用解码器网络对对齐特征进行解码,生成高分辨率高光谱图像。本发明使特征对齐效果更加鲁棒,使超分辨率效果更好,在真实数据集和仿真数据集的各个倍率的超分任务中均取得很好的结果,在高倍率超分任务中具有优势,易于推广。
-
公开(公告)号:CN118469844A
公开(公告)日:2024-08-09
申请号:CN202410673350.8
申请日:2024-05-28
Applicant: 杭州电子科技大学丽水研究院
IPC: G06T5/60 , G06T5/73 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于Transformer和双域选择机制的图像散焦去模糊方法,包括步骤如下:步骤一:数据集获取及预处理;步骤二:构建一种基于Transformer和双域选择机制的图像散焦去模糊网络模型;步骤三:使用预处理后的数据集训练基于Transformer和双域选择机制的图像散焦去模糊的网络模型;步骤四:通过训练好的网络模型完成图像散焦去模糊测试。本发明通过深度提取初始特征和末尾特征,并通过剔除特征中的低频信息来增强高频信息。采用端到端的方法构建神经网络,其中利用Transformer模块在一个尺度上提取高质量的图像信息,并通过双域选择模块来保持空间细节的精确性。
-
公开(公告)号:CN117274855A
公开(公告)日:2023-12-22
申请号:CN202311058507.8
申请日:2023-08-22
Applicant: 杭州电子科技大学丽水研究院
Inventor: 颜成钢 , 金裕达 , 郭雨晨 , 赵思成 , 孙垚棋 , 朱尊杰 , 高宇涵 , 王鸿奎 , 赵治栋 , 殷海兵 , 王帅 , 张继勇 , 李宗鹏 , 丁贵广 , 付莹 , 李晓林 , 沙雏淋
IPC: G06V20/40 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于多维度信息交互的视频特征提取方法,首先进行数据集获取,采用现有的视频分类数据集;构建基于多维度信息交互的视频特征提取网络,包括前缀卷积网络、时空可分离编码器和视频分类器;之后构建损失函数,最后根据获取的数据集对构建的基于多维度信息交互的视频特征提取网络进行训练。本发明将时序信息交互与空间信息交互相结合,弥补了两者不能共存的短板。使用前缀卷积网络以及时间空间可分离注意力机制,减少了大量的算力开销。
-
-
-
-
-
-
-