-
公开(公告)号:CN115457214A
公开(公告)日:2022-12-09
申请号:CN202211203731.7
申请日:2022-09-29
Applicant: 杭州电子科技大学
IPC: G06T17/00 , G06V10/764 , G06V10/774 , G06T7/246 , G06N20/10
Abstract: 本发明公开了一种基于支持向量机的相机跟踪失败检测方法,包括如下步骤:步骤1:数据集选取与三维重建;步骤2:ICP匹配算法与特征获取;步骤3:计算当前样本特征对应的距离误差,并进行分类,构建用于支撑向量机数据集;步骤4:训练支持向量机模型;步骤5:通过训练好的多分类模型完成相机跟踪失败检测;本发明使用了在机器学习有监督学习分类问题中使用较为广泛的支持向量机来训练模型,具有良好的理论支持。本发明使用多分类而非二分类来训练模型,提高了准确率和精度,能够更好的设立阈值,优化重建结果。
-
公开(公告)号:CN115442620A
公开(公告)日:2022-12-06
申请号:CN202211095417.1
申请日:2022-09-06
Applicant: 杭州电子科技大学
IPC: H04N19/52 , H04N19/149 , H04N19/159 , H04N19/29 , H04N19/48
Abstract: 本发明属于视频编码领域,公开了一种AME低复杂度仿射运动估计方法,包括如下步骤:步骤1:基于划分深度的最优帧间模式的提前预测:根据父CU最优帧间模式来预测子CU最优帧间模式;步骤2:AME内部的低复杂度算法:在AME算法内部,通过CPMV平行与否、迭代过程的提前终止以及有无必要进行细粒度调整优化来加速AME算法;步骤3:AME外部的低复杂度算法:对于需要在传统Inter和AME之间进行模式决策的CU提取相关特征,基于决策树对这样的CU进行提前预测其最优帧间模式,以此跳过RDO决策及次优模式的遍历过程。本发明大大减少了VVC帧间模式决策复杂度。
-
公开(公告)号:CN115409857A
公开(公告)日:2022-11-29
申请号:CN202211215390.5
申请日:2022-09-30
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于深度学习的三维脑积水CT图像分割方法,包括以下步骤:步骤(1)、获取数据集;步骤(2)、数据预处理;步骤(3)、构建残差U‑net卷积网络模型;步骤(4)、通过预处理后的数据对构建的残差U‑net卷积网络模型进行训练;步骤(5)、将测试数据输入训练好的残差U‑net卷积网络模型,对模型进行测试。本发明引入残差卷积作为基本卷积单元,增强分割模型得鲁棒性本发明基于深度学习对CT图像中的脑室区域构建三维分割模型,充分利用数据在三维空间上带来的优势,探究高维度信息给模型带来的可能性,提高最终表现效果的准确度。
-
公开(公告)号:CN115409714A
公开(公告)日:2022-11-29
申请号:CN202211201824.6
申请日:2022-09-29
Applicant: 杭州电子科技大学
IPC: G06T3/40 , G06V10/26 , G06V10/764 , G06V10/82 , G06N3/08
Abstract: 本发明公开了一种基于图片切割分类的视频超分辨率方法,首先制作分类器模块的数据集,然后训练分类器模块;再制作总模型数据集,构建总体模型结构,并通过总模型数据集对总体模型进行训练;最后通过训练好的总体模型完成视频超分辨率重建。本发明使用了一个分类器模块与其他几个现有的超分辨率成果结合,实现了在保证处理质量的同时,大大减少了处理的计算量和存储量。
-
公开(公告)号:CN115409713A
公开(公告)日:2022-11-29
申请号:CN202211201813.8
申请日:2022-09-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种高效实时的单张图像超分变率重建系统及方法,单图像超分辨率重建方法首先进行数据预处理,然后构建高效实时的图像超分辨率重建网络;通过预处理后的数据训练构建好的图像超分辨重建网络,使网络具有图像超分辨重建的效果;最后通过训练好的图像超分辨重建网络完成单图像超分辨率重建。单图像超分辨重建系统,包括数据预处理模块、网络构建模块、训练模块和图像超分辨重建模块。本发明减少网络模型参数量,使得网络模型的计算量减少,资源消耗少;在性能和效率方便达到很好的平衡;能够部署在移动端设备上。
-
公开(公告)号:CN115361557A
公开(公告)日:2022-11-18
申请号:CN202210992815.7
申请日:2022-08-18
Applicant: 杭州电子科技大学
IPC: H04N19/154 , H04N19/149 , H04N19/176 , H04N19/182 , H04N13/128 , H04N13/161
Abstract: 本发明方法公开了结合注意力机制的立体图像舒适度预测方法。本发明方法首先通过对输入的左、右视点图像分别进行半重叠采样,得到多个图像块对作为模型输入,分别得到低、中、高级特征的相加特征图和相减特征图;然后分别将低、中、高级特征的相加和相减特征图拼接成新的特征块,输入并行双注意力模块进行注意力加权;将低、中、高级特征的通道和空间注意力加权特征拼接成新的特征块,并分别输入对应的次要子网络,最终得到三个次要子网络的输出特征向量,合并三个次要子网络的输出特征向量,并输入用于回归预测的全连接层网络进行舒适度回归预测。本发明方法不仅降低了流程复杂度,还规避了因视差计算不准确带来的影响。
-
公开(公告)号:CN114445618A
公开(公告)日:2022-05-06
申请号:CN202111665038.7
申请日:2021-12-31
Applicant: 杭州电子科技大学
IPC: G06V10/25
Abstract: 本发明方法公开了一种跨模态交互RGB‑D图像显著区域检测方法。本发明方法首先分别从彩色图和深度图中利用VGG16网络提取RGB特征和深度特征;然后在RGB‑D交互模块中RGB特征和深度特征相互纠正,并增强边缘细节;深度权重分配模块中根据深度特征计算处理后的多个特征的融合权重;最后在注意力更新模块中细化融合后的特征。本发明方法将RGB与深度联系起来,通过补充丰富的边界信息来增强目标区域;在多尺度深度权重模块中计算权重,根据深度图的质量来决定其对显著区域的影响程度,消除了低质量深度图带来的负面影响,并提升算法的整体性能。本发明方法可以直接应用在3D图像处理,3D质量评估以及物体识别等工程领域中。
-
公开(公告)号:CN114330653A
公开(公告)日:2022-04-12
申请号:CN202111586693.3
申请日:2021-12-23
Applicant: 杭州电子科技大学
Abstract: 本发明属于深度学习领域,公开了一种计算和访存高效的CNN网络模型计算调度映射方法。包括如下步骤:步骤1:根据片上SRAM存储配置确定存储映射方案;步骤2:根据片上可并发MAC计算单元配置确定计算映射方案;步骤3:根据网络模型、存储和计算映射方案,确定流水调度优化方案。本发明的一种计算和访存高效的CNN网络模型计算调度映射方法包括单位MAC计算单元算力、可并发强度、片上缓存颗粒度、缓存大小,并结合算法网络结构特点,为每个网络层实现优化映射,提出计算、存储、访存带宽多目标优化的网络结构映射实现方法。
-
公开(公告)号:CN111405264B
公开(公告)日:2022-04-12
申请号:CN202010068774.3
申请日:2020-01-20
Applicant: 杭州电子科技大学
IPC: H04N13/122 , H04N13/128 , H04N13/15
Abstract: 本发明公开了一种基于深度调整的3D视频舒适度改善方法。解决了一般3D视频观看不舒适、视觉体验不佳的问题。本发明包括以下步骤:S1:对左视点图、右视点图的深度图都进行预处理,得到预处理图;S2:对预处理图进行深度滤波,得到滤波图;S3:对滤波图进行深度去纹理,得到去纹理图;S4:根据去纹理图进行虚拟视点绘制,获得虚拟右视点彩色图;S5:用虚拟右视点彩色图和原始视点图进行替换得到改善的3D视频。本发明的增益效果是降低了视差、梯度变化、纹理对观感体验的影响,实现了整体舒适度的改善。
-
公开(公告)号:CN110428447B
公开(公告)日:2022-04-08
申请号:CN201910638477.5
申请日:2019-07-15
Applicant: 杭州电子科技大学
Abstract: 本发明公开一种基于策略梯度的目标跟踪方法与系统,属于计算机视觉领域。方法包括:(1)将目标图像输入到卷积神经网络中,得到目标外观模板Z;(2)将搜索图像输入到卷积神经网络中,等到搜索区域特征图;(3)将模板图像Z和搜索区域特征图通过相似度度量函数f计算得到响应图ht;(4)将(3)中得到的响应图ht和历史响应图hi输入到策略网络中,选择分数最高的那个动作加入到集合Ct(i=1~N);(5)重复(4)直到遍历响应图模板池中的每一个历史响应图;最后执行集合Ct(i=1~N)中出现次数最多的那个动作。所述系统包括跟踪器和决策器。避免了错误的模板更新,并在目标丢失的时候能够及时发现并重新找到目标。
-
-
-
-
-
-
-
-
-