-
公开(公告)号:CN112967229A
公开(公告)日:2021-06-15
申请号:CN202110149351.9
申请日:2021-02-03
Applicant: 杭州电子科技大学
IPC: G06T7/00 , G06K9/00 , H04N19/154
Abstract: 本发明公开了基于视频感知特征参量度量计算恰可察觉失真阈值的方法,包括如下步骤:S1,时域感知参量同质化,包括如下步骤:S11,相对运动同质化,得到相对运动的视觉感知显著度;S12,背景运动同质化,得到背景运动导致的视觉感知不确定度;S13,时域持续时间的同质化,得到持续时间的视觉感知显著度;S14,残差波动强度同质化,得到残差波动强度导致的视觉感知不确定度;S2,时域参量融合,通过融合刺激导致的显著度和不确定度,计算时域权重因子,并提出显著度调节因子;S3,空时域JND模型的构建,利用时域权重因子和显著度调节因子对空域JND进行调节获得空时域JND模型。
-
公开(公告)号:CN112866694A
公开(公告)日:2021-05-28
申请号:CN202011644521.2
申请日:2020-12-31
Applicant: 杭州电子科技大学
IPC: H04N19/124 , H04N19/13 , H04N19/147 , H04N19/42 , H04N19/597 , G06N3/04
Abstract: 本发明用于基于端到端的智能图像压缩领域,属于图像/视频压缩领域,涉及联合非对称卷积块和条件上下文的智能图像压缩的优化方法,具有训练阶段和推理阶段,在所述训练阶段,搭建整体端到端的图像压缩框架,包括主编码/解码器,超先验编码/解码器,条件上下文模型,熵参数模型,以及因子分解熵模型,其中,所述主编码/解码器,超先验编码/解码器均采用非对称卷积块即ACB模块对视频图像进行特征提取;在推理阶段,利用ACB模块的兼容性对并行卷积核合成。本发明通过非对称卷积块能够提高标准平方卷积的提取特征的能力,邻域/全局域的上下文捕获机制则可以提高潜在特征值的建模精准度,使之更符合客观出现概率情况来减少编码冗余。
-
公开(公告)号:CN109933715B
公开(公告)日:2021-05-28
申请号:CN201910206099.3
申请日:2019-03-18
Applicant: 杭州电子科技大学
IPC: G06F16/953 , G06K9/62
Abstract: 本发明涉及信息检索技术领域,具体涉及一种基于listwise算法在线学习排序方法。首先使用listwise算法的思想,将查询关键字对应的候选记录排序列表作为训练实例;然后利用在线学习排序算法的训练过程,在应用训练实例时,训练实例按照顺序到达神经网络,并且仅被扫描一次;最后通过最小化损失值获取精准的排序模型。本发明将在线学习算法应用到listwise算法中,可以利用在线获得的数据对已有的排序模型进行更新,实现在线处理和提高算法的有效性;保证了online‑listwise算法在信息检索领域的可实施性和性能。通过自适应学习率更新排序模型,使排序模型更加精准和尽快收敛。
-
公开(公告)号:CN112738501A
公开(公告)日:2021-04-30
申请号:CN202011592782.4
申请日:2020-12-29
Applicant: 杭州电子科技大学
IPC: H04N17/00 , H04N13/106
Abstract: 本发明公开了一种立体图像舒适度测试方法。传统的舒适度测试技术提取的特征较为简单,预测结果不够准确。本发明方法首先输入立体图像视差图提取基础视差特征,然后由视差图和中颞区皮层图提取视觉神经活动特征,再与颜色特征线性结合得到最终的舒适度预测特征,采用随机森林回归模型进行不舒适度测试,获得最终的立体视觉不舒适度分值。本发明的视觉神经活动特征模拟了大脑中颞区皮层视觉处理过程,视差特征和颜色特征则代表了图像内容本身。本发明方法充分考虑了影响立体图像舒适度的相关因素,在舒适度测试方面有很好的效果。
-
公开(公告)号:CN112085683A
公开(公告)日:2020-12-15
申请号:CN202010816235.3
申请日:2020-08-14
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种显著性检测中的深度图可信度检测方法。该方法具体包括以下步骤:判断待测深度图像的收敛性;B)对收敛的深度图像做中值滤波处理;C)对中值滤波处理后的深度图像及其参考图像进行边缘检测,并获取边缘信息;D)计算深度图像及其参考图像的边缘的相似度,获得可信度分数。该方法引入图像收敛性概念,过滤显著物体不明显的深度图像,在提取边缘特征前进行中值滤波处理,通过自适应阈值的边缘检测,在像素级别上求取深度图像和参考图像的相似度,使深度图像显著物体的边缘定位更准确,不会受到边缘附近区块因失真等原因导致的数值变化的影响,获得的深度图像的可信度结果更为准确。
-
公开(公告)号:CN109274967B
公开(公告)日:2020-11-10
申请号:CN201811120450.9
申请日:2018-09-25
Applicant: 杭州电子科技大学
IPC: H04N19/122 , H04N19/124 , H04N19/147 , H04N19/149
Abstract: 本发明公开了一种快速RDOQ量化零系数比例估计方法。为了体现不同位置系数差异性,本发明为不同位置系数定义一个不同加权系数,将加权系数构建为位置自适应死区偏移量δ的函数,基于此度量加权SATD,即WSATD。考虑到RDOQ算法复杂性,仅仅考虑q和WSATD还不足以构建精准的ρ模型。假设χ=WSATD/q,发现不同χ样本它们的ρ有不同值,本发明将χ的均值θ作为构建ρ模型的另外一个特征参量。在HEVC编码器中,存在不同类型的变换块(TU),为了区分这种差异性,本发明针对在不同类型TU块分别建模。最后利用统计分析曲线拟合方法构建三维ρ模型。通过该模型能够快速估计出RDOQ后的零系数比例ρ。
-
公开(公告)号:CN109120934B
公开(公告)日:2020-06-23
申请号:CN201811117434.4
申请日:2018-09-25
Applicant: 杭州电子科技大学
IPC: H04N19/147 , H04N19/19 , H04N19/124
Abstract: 本发明公开了一种考虑帧间依赖的帧级量化参数计算方法。首先建立基于帧间依赖的失真预测模型(ΔD‑ΔQp模型),然后将该模型运用到率失真优化中,求得率失真代价最小时的拉格朗日乘子λ,最后由λ‑Qp关系,求出最优帧级量化参数。其中的ΔD‑ΔQp模型不仅体现了帧间依赖,并在建模过程中将视频内容考虑了进来,所以该模型可以根据视频内容自适应调整。本方法具有实施复杂度低的特点,方法中使用的参量均是从视频编码过程中获得,不需要复杂的计算,基本不会增加视频编码复杂度,所以不会造成系统延时。
-
公开(公告)号:CN110049338A
公开(公告)日:2019-07-23
申请号:CN201910344082.4
申请日:2019-04-26
Applicant: 杭州电子科技大学
IPC: H04N19/503 , H04N19/119 , H04N19/96 , H04N19/147 , H04N19/14 , H04N19/30 , H04N19/103
Abstract: 本发明公开了基于多层次分类的HEVC快速帧间编码方法。本发明包括运用CU层次的分类树、PU层次的分类树和TU层次的分类树实现HEVC快速帧间编码,其内容包括基于CU深度分类树的快速CU划分方法、基于帧间模式分类树的快速PU选择方法和基于TU深度分类树的TU划分方法。本发明利用了HEVC编码过程中CU深度、PU模式和TU深度在时空上的相似性,减少了CU划分的复杂度,简化了帧间预测模式的选择过程,同时利用TU的变换系数特征,降低了TU划分的复杂度。
-
公开(公告)号:CN109274967A
公开(公告)日:2019-01-25
申请号:CN201811120450.9
申请日:2018-09-25
Applicant: 杭州电子科技大学
IPC: H04N19/122 , H04N19/124 , H04N19/147 , H04N19/149
CPC classification number: H04N19/147 , H04N19/122 , H04N19/124 , H04N19/149
Abstract: 本发明公开了一种快速RDOQ量化零系数比例估计方法。为了体现不同位置系数差异性,本发明为不同位置系数定义一个不同加权系数,将加权系数构建为位置自适应死区偏移量δ的函数,基于此度量加权SATD,即WSATD。考虑到RDOQ算法复杂性,仅仅考虑q和WSATD还不足以构建精准的ρ模型。假设χ=WSATD/q,发现不同χ样本它们的ρ有不同值,本发明将χ的均值θ作为构建ρ模型的另外一个特征参量。在HEVC编码器中,存在不同类型的变换块(TU),为了区分这种差异性,本发明针对在不同类型TU块分别建模。最后利用统计分析曲线拟合方法构建三维ρ模型。通过该模型能够快速估计出RDOQ后的零系数比例ρ。
-
公开(公告)号:CN115361557B
公开(公告)日:2025-03-25
申请号:CN202210992815.7
申请日:2022-08-18
Applicant: 杭州电子科技大学
IPC: H04N19/154 , H04N19/149 , H04N19/176 , H04N19/182 , H04N13/128 , H04N13/161
Abstract: 本发明方法公开了结合注意力机制的立体图像舒适度预测方法。本发明方法首先通过对输入的左、右视点图像分别进行半重叠采样,得到多个图像块对作为模型输入,分别得到低、中、高级特征的相加特征图和相减特征图;然后分别将低、中、高级特征的相加和相减特征图拼接成新的特征块,输入并行双注意力模块进行注意力加权;将低、中、高级特征的通道和空间注意力加权特征拼接成新的特征块,并分别输入对应的次要子网络,最终得到三个次要子网络的输出特征向量,合并三个次要子网络的输出特征向量,并输入用于回归预测的全连接层网络进行舒适度回归预测。本发明方法不仅降低了流程复杂度,还规避了因视差计算不准确带来的影响。
-
-
-
-
-
-
-
-
-