-
公开(公告)号:CN118784845A
公开(公告)日:2024-10-15
申请号:CN202410741652.4
申请日:2024-06-11
Applicant: 杭州电子科技大学
IPC: H04N19/172 , H04N19/20 , G06V10/80 , G06V10/82 , G06T7/246 , G06T7/269 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了基于多阶层特征融合的虚拟视点绘制空洞填充方法,将局部连续帧和非局部随机帧,通过多阶层编码进行特征细化,从空洞区域以外的已知区域传播时空信息,得到局部特征块和非局部特征块;对局部连续帧进行光流补全,得到带有空洞的相邻帧的光流特征,用于检测虚拟视点序列中的运动对象,以引导特征传播,特征传播结合所述局部特征块,传递和更新运动对象的信息,缓解了前背景混叠问题;将更新后的特征和非局部特征块进行内容重建,再解码重构得到空洞修复帧,加入多头时空自注意力模块和融合前馈神经网络,有利于聚合不同特征的信息,充分利用局部和非局部相邻帧的特征,较好处理伪影的问题。
-
公开(公告)号:CN118537384A
公开(公告)日:2024-08-23
申请号:CN202410592852.8
申请日:2024-05-14
Applicant: 杭州电子科技大学
IPC: G06T7/50 , G06N3/0464 , G06N3/0455 , G06N3/0495
Abstract: 本发明属于深度估计技术领域,公开了一种异构多尺度事件相机单目深度估计优化方法,包括如下步骤:步骤1:异构多尺度事件相机单目深度估计优化模型;步骤2:异构数据匹配优化;步骤3:构建异构特征学习模型。本发明提出了异构多尺度事件相机单目深度估计优化模型,在研究事件相机单目深度估计模型优化的基础上,提出了异构数据匹配优化模型,解决了事件相机传感器与彩色相机传感器数据特征、结构迥异的问题;提出了异构数据学习模型,解决了异构数据特征不匹配的问题、学习约束过大导致部分通道产生负面效果的问题,为深度估计行业方案提供技术选择。
-
公开(公告)号:CN118334663B
公开(公告)日:2024-08-13
申请号:CN202410760236.9
申请日:2024-06-13
Applicant: 杭州宇泛智能科技股份有限公司 , 杭州电子科技大学
IPC: G06V20/70 , G06V10/774 , G06V10/94 , G06V10/764 , G06V10/40 , G06V10/26 , G06V10/75 , G06F16/51
Abstract: 本申请实施例提供一种一站式人工智能图像处理模型构建方法及装置,方法包括:创建图像标注任务,确定对应的图像处理模型的结构,并根据所述标准化标签存储的图像数据进行图像处理模型的训练,得到所述图像处理模型;根据与图像处理模型对应的模型定义规范确定目标部署硬件相应的前处理接口、推理接口以及后处理接口,通过推理接口将经过前处理接口处理后的标准化标签存储的图像数据输入至图像处理模型,并通过后处理接口处理图像处理模型的模型输出,根据模型输出确定对应的模型精度,在模型精度符合预设精度条件时将图像处理模型部署至目标部署硬件;本申请能够实现数据标注、模型训练、模型转换和模型部署等全流程的一体化集成,提高开发效率,降低开发成本,确保训练精度与部署精度的高度一致性。
-
公开(公告)号:CN118469835A
公开(公告)日:2024-08-09
申请号:CN202410673257.7
申请日:2024-05-28
Applicant: 杭州电子科技大学丽水研究院
IPC: G06T5/50 , G06T5/60 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于原始图像的多曝光图像融合方法。本发明对于现有的多曝光融合技术进行了改进,不同于传统的将相机得到的图像直接作为LDR图像进行融合,本发明使用Bayer格式的图像得到图像的原始图像作为输入来学习更多的图像信息。同时本发明结合了DualUNet网络的优点,并改进了Conv模块来增强学习能力;此外利用DIB模块来增强对频域维度的学习能力。本发明提出的基于原始图像LDR‑HDR图像信号处理方法可以更好的获取图像细节信息从而为后续网络训练提供更好的图像信息。同时,本发明改进后的网络利用结构重新参数化技术,显著抑制硬件设备计算需求,符合轻量化使用的现实场景。
-
公开(公告)号:CN112967229B
公开(公告)日:2024-04-26
申请号:CN202110149351.9
申请日:2021-02-03
Applicant: 杭州电子科技大学
IPC: G06T7/00 , G06V20/40 , H04N19/154
Abstract: 本发明公开了基于视频感知特征参量度量计算恰可察觉失真阈值的方法,包括如下步骤:S1,时域感知参量同质化,包括如下步骤:S11,相对运动同质化,得到相对运动的视觉感知显著度;S12,背景运动同质化,得到背景运动导致的视觉感知不确定度;S13,时域持续时间的同质化,得到持续时间的视觉感知显著度;S14,残差波动强度同质化,得到残差波动强度导致的视觉感知不确定度;S2,时域参量融合,通过融合刺激导致的显著度和不确定度,计算时域权重因子,并提出显著度调节因子;S3,空时域JND模型的构建,利用时域权重因子和显著度调节因子对空域JND进行调节获得空时域JND模型。
-
公开(公告)号:CN117915104A
公开(公告)日:2024-04-19
申请号:CN202410074860.3
申请日:2024-01-18
Applicant: 杭州电子科技大学
IPC: H04N19/30 , H04N19/103 , H04N19/149 , H04N19/176 , H04N19/503 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于神经网络的VVC多层次快速帧间编码系统及方法。本发明包括基于运动场与编码信息的CU划分终止模块;基于轻量级全连接网络的CTU深度预测模块;基于编码信息的TT划分终止模块;基于CNN的CU划分模式选择模块;通过四个模块之间多层次的组合,避免冗余的划分方式,降低帧间编码复杂度。本发明针对帧间编码的特性,利用编码上下文信息和神经网络的特征提取能力,从多个层次出发,各层次相互结合,兼顾复杂度与准确性,有效的降低了VVC帧间编码复杂度。
-
公开(公告)号:CN117915095A
公开(公告)日:2024-04-19
申请号:CN202410020227.6
申请日:2024-01-05
Applicant: 杭州电子科技大学
IPC: H04N19/147 , H04N19/436 , H04N19/124 , H04N19/146
Abstract: 本发明属于视频编码领域,涉及一种扫描线级加速并行RDOQ方法,采用SIMD指令,在预量化阶段同时对每个变换系数进行独立的预量化处理;在最优系数水平决策阶段,并行处理预量化后得到的量化系数,通过率失真优化来确定量化系数的最优值;在最后有效系数位置决策阶段,继续以并行处理的方式,同时基于贪婪策略获取到最优的最后有效系数位置。本发明的方法在保证编码性能损失较小的前提下,实现了RDOQ过程并行计算,且相比现有的并行RDOQ方法,本发明适用于硬件加速领域,基于贪婪算法实现LSC位置决策,创新度高,硬件吞吐量和编码性能有一个良好的折衷,为视频编码并行优化相关的算法研究提供了参考,具有重大意义。
-
公开(公告)号:CN112085683B
公开(公告)日:2024-04-09
申请号:CN202010816235.3
申请日:2020-08-14
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种显著性检测中的深度图可信度检测方法。该方法具体包括以下步骤:判断待测深度图像的收敛性;B)对收敛的深度图像做中值滤波处理;C)对中值滤波处理后的深度图像及其参考图像进行边缘检测,并获取边缘信息;D)计算深度图像及其参考图像的边缘的相似度,获得可信度分数。该方法引入图像收敛性概念,过滤显著物体不明显的深度图像,在提取边缘特征前进行中值滤波处理,通过自适应阈值的边缘检测,在像素级别上求取深度图像和参考图像的相似度,使深度图像显著物体的边缘定位更准确,不会受到边缘附近区块因失真等原因导致的数值变化的影响,获得的深度图像的可信度结果更为准确。
-
公开(公告)号:CN117217991A
公开(公告)日:2023-12-12
申请号:CN202311026041.3
申请日:2023-08-15
Applicant: 杭州电子科技大学丽水研究院
Inventor: 颜成钢 , 张文豪 , 陈雨中 , 魏宇鑫 , 汪奇挺 , 傅晟 , 付莹 , 郭雨晨 , 赵思成 , 孙垚棋 , 朱尊杰 , 高宇涵 , 王鸿奎 , 赵治栋 , 殷海兵 , 王帅 , 张继勇 , 李宗鹏 , 丁贵广
IPC: G06T3/40 , G06N3/0455 , G06N3/08 , G06N5/046
Abstract: 本发明公开了一种基于TensorRT的视频超分推理方法及装置,首先对视频超分网络进行训练;然后对网络算子进行分析,对常用算子进行整理,对不支持算子进行编写,对于可优化算子做算子融合;最后对于完整的视频超分网络结构,使用TensorRT编写并生成序列化引擎进行推理。本发明提出了视频超分推理落地的新方法,即是使用TensorRT该推理框架进行部署和加速,建立常用算子库将TensorRT算子和Pytorch算子进行对齐,优化部署过程,并能够比在训练框架下的推理有更好的速度和更低的显存占用。
-
公开(公告)号:CN117217205A
公开(公告)日:2023-12-12
申请号:CN202311186741.9
申请日:2023-09-14
Applicant: 杭州电子科技大学
Inventor: 颜成钢 , 付赫男 , 刘一秀 , 高宇涵 , 孙垚棋 , 朱尊杰 , 王帅 , 王鸿奎 , 殷海兵 , 张继勇 , 李宗鹏 , 赵治栋 , 丁贵广 , 付莹 , 郭雨晨 , 赵思成
IPC: G06F40/211 , G06F40/30 , G06F18/214 , G06N20/00
Abstract: 本发明公开了一种面向CLIP模型的图片文本后门攻击方法,首先生成触发词和触发图片,再将从句选择合适的位置添加进想要攻击的句子中形成中毒样本,将触发图片以特定的噪声比例添加进原始想要下毒的图片中形成中毒图片;最后用中毒数据集训练CLIP模型,推理阶段用触发词与触发图片替换过的句子或图片,从而诱骗目标模型预测目标类别。本发明隐蔽性好,中毒样本在训练集中不容易发现,图片触发器几乎可以看做是隐形的,文本触发器既不改变原句语义,也不会产生语法错误,提高了训练集中有毒样本的隐蔽性;能够达到攻击方法灵活,攻击成功率高,攻击样本质量好的效果。
-
-
-
-
-
-
-
-
-