-
公开(公告)号:CN110730350A
公开(公告)日:2020-01-24
申请号:CN201910911194.3
申请日:2019-09-25
Applicant: 杭州电子科技大学
IPC: H04N19/34
Abstract: 本发明公开了一种结合编码深度估计和贝叶斯判决的SHVC快速编码方法,其实现的方法是在基本层保持原有的编码方法,在增强层采用快速编码方法。SHVC增强层快速编码方法包括编码树单元(CTU)深度范围估计方法、基于最小风险贝叶斯判决的编码单元(CU)快速划分方法和基于最大概率贝叶斯判决的预测单元(PU)快速模式选择方法。本发明大大减少了SHVC增强层编码中的CU深度划分和PU模式选择的复杂度,在保持编码压缩效率的前提下,有效地提高了SHVC的编码速度。
-
公开(公告)号:CN110365978A
公开(公告)日:2019-10-22
申请号:CN201910638183.2
申请日:2019-07-15
Applicant: 杭州电子科技大学
IPC: H04N19/124 , H04N19/176 , H04N19/625 , H04N19/70
Abstract: 本发明公开了一种基于机器学习算法多层次全零块预判决方法及系统。包括:S1:确定阈值Г1,当max(|dij|)<Γ1时,判定TU块经过HDQ量化后,会量化为全零TU,所述 dij是经过DCT变换后的系数;S2:确定阈值Г2,当TU中满足公式(4)的DCT变换系数的个数小于等于Γ2时,则判定该TU经过HDQ方法后是non-AZB,但是经过RDOQ方法后为AZB,所述公式(4)为 所述Г2为 S3:TU块经过RDOQ方法后采用机器学习的方法实现AZB预判决,机器学习方法分别提取了TU级别、系数级别和上下文语法元素级别的特征值。能够在量化之前实现较为准确的AZB预判决,实现减少视频编码负担和节约编码时间的目的。
-
公开(公告)号:CN110113616A
公开(公告)日:2019-08-09
申请号:CN201910488842.9
申请日:2019-06-05
Applicant: 杭州电子科技大学
Inventor: 殷海兵
IPC: H04N19/42 , H04N19/136 , H04N19/142 , H04N19/20 , H04N19/70
Abstract: 本发明公开一种多层级监控视频高效压缩编码、解码装置及方法,属于海量摄像头城域级视频监控应用技术领域。包括:(1)特定语义对象编码:检测出特定语义对象dn,重构对象通过跟踪技术和关键点检测技术检测出关键点序列,传输给解码器;(2)长期背景帧建模:设置多个场景类别,用背景帧场景索引序号区分这些场景类别;编码器里检测场景类别,将背景帧索引序号传输给解码器;(3)短期背景帧建模:采用多模式预测方法,获得当前帧的短期背景帧预测值通过优化选择多模式参考预测,将编码控制参数传输给解码器;(4)前景编码:预测残差 经过HEVC编码产生前景码流,经过解码后获得重构前景 预测残差通过信道传输给解码器。
-
公开(公告)号:CN114286093B
公开(公告)日:2025-05-23
申请号:CN202111599851.9
申请日:2021-12-24
Applicant: 杭州电子科技大学
IPC: H04N19/119 , H04N19/105 , H04N19/14 , H04N19/11 , H04N19/593 , H04N19/147 , H04N19/96 , G06V10/764 , G06V10/82 , G06V10/774 , G06V20/40 , G06N3/0464 , G06N3/0455 , G06N3/0499 , G06N3/084
Abstract: 本发明公开了一种基于深度神经网络的快速视频编码方法。本发明包括基于深度神经网络的CU划分模块、基于邻域相关性的PU模式选择模块;CU块在帧内编码时会先经过PU模式选择计算率失真代价,此时先利用基于邻域相关性的PU模式选择模块进行优化,通过轻量级HCT模型的预测结果来减少RDO计算的候选模式数量;PU模式选择结束后,编码器会进行CU块深度判决,判断该CU块是否进行划分,此时由基于深度神经网络的CU划分模块进行优化,从HCT模型获得预测结果来判断是否提前终止划分。否则继续向下划分子CU块,并继续进行PU模式选择和CU块划分判决。本发明降低了CU递归划分的复杂度,简化了帧内预测模式的选择过程,有效地提高了HEVC编码的时间效率。
-
公开(公告)号:CN115442620B
公开(公告)日:2025-04-22
申请号:CN202211095417.1
申请日:2022-09-06
Applicant: 杭州电子科技大学
IPC: H04N19/52 , H04N19/149 , H04N19/159 , H04N19/29 , H04N19/48
Abstract: 本发明属于视频编码领域,公开了一种AME低复杂度仿射运动估计方法,包括如下步骤:步骤1:基于划分深度的最优帧间模式的提前预测:根据父CU最优帧间模式来预测子CU最优帧间模式;步骤2:AME内部的低复杂度算法:在AME算法内部,通过CPMV平行与否、迭代过程的提前终止以及有无必要进行细粒度调整优化来加速AME算法;步骤3:AME外部的低复杂度算法:对于需要在传统Inter和AME之间进行模式决策的CU提取相关特征,基于决策树对这样的CU进行提前预测其最优帧间模式,以此跳过RDO决策及次优模式的遍历过程。本发明大大减少了VVC帧间模式决策复杂度。
-
公开(公告)号:CN119809303A
公开(公告)日:2025-04-11
申请号:CN202510310668.4
申请日:2025-03-17
Applicant: 杭州电子科技大学丽水研究院 , 丽水学院
IPC: G06Q10/0631 , G06N5/022 , G06Q50/04 , G06Q30/01
Abstract: 本发明属于知识图谱技术领域,本发明公开了一种基于语义关联的知识图谱的行业知识结构化建模方法;采集行业生产数据;根据行业生产数据构建生产知识图谱;获取个性化需求内容;对个性化需求内容进行特征提取,得到实际需求特征数据;将实际需求特征数据输入需求评估模型,得到需求评估得分,并对需求评估得分进行分析处理,得到需求合理性等级;将实际需求特征数据和生产知识图谱输入至参数构建模型,得到对应的生产参数集合;将需求合理性等级、生产参数集合和生产知识图谱输入至需求构建模型,得到预测需求特征数据;动态评估客户需求与系统预测的匹配程度,生成满足客户个性化需求的生产参数集合,提高生产精准性。
-
公开(公告)号:CN119723157A
公开(公告)日:2025-03-28
申请号:CN202411699542.2
申请日:2024-11-26
Applicant: 杭州电子科技大学
IPC: G06V10/764 , G06V10/774 , G06V10/74 , G06V10/82 , G06N3/084 , G06N3/096
Abstract: 本发明公开了一种基于联邦增量学习的智能工厂精益制造故障检测方法,包括以下步骤:S10,本地参与方的本地编码器模型使用对比学习方式进行预训练;S20,对全局编码器模型训练权重和本地参与方的本地编码器模型训练权重进行知识蒸馏,得到本地完整模型,进行本地训练;S30,将经过本地训练后的本地完整模型拆分为本地参与方的本地编码器模型和本地参与方的本地解码器模型,完成聚合训练得到本轮全局编码器训练权重;S40,将全局编码器训练权重下载到本地参与方的本地编码器模型,并与本地参与方的本地解码器模型结合形成本地完整模型;S50,使用本地完整模型对精益制造任务进行故障检测,判断是否发生故障。
-
公开(公告)号:CN119324988A
公开(公告)日:2025-01-17
申请号:CN202411874545.5
申请日:2024-12-19
Applicant: 杭州电子科技大学
IPC: H04N19/147 , H04N19/149 , H04N19/124 , H04N19/159 , H04N19/61 , H04N19/30
Abstract: 本发明公开一种基于多层级架构的VVC全零块跳过方法,从变换块TU中读取变换系数后,通过其最大变换系数的幅值与预先计算的阈值进行比较,若小于阈值则判断为真全零块GAZB,则跳过量化和编码过程,反之则为非GAZB,接着利用率失真优化算法计算非GAZB跳过的代价,判断是否跳过非GAZB的编码过程,若其正常编码的代价大于非GAZB跳过的代价,则将该块判断为伪全零块PAZB进行跳过,反之,则被判断为非全零块NAZB;而在依赖性量化DQ的计算过程中,通过统计CG上下文特征来进行全零检测,以跳过检测为全零CG的编码过程。本发明没有使用机器学习技术,在确保编码质量的情况下减少了计算复杂度,加快编码速度。
-
公开(公告)号:CN119011835A
公开(公告)日:2024-11-22
申请号:CN202410948217.9
申请日:2024-07-16
Applicant: 杭州电子科技大学
IPC: H04N19/124 , H04N19/154 , H04N19/70 , G06T9/00 , G06N3/0475 , G06N3/094
Abstract: 本发明属于视频图像压缩领域,公开了一种适用于机器视觉任务的恰可识别失真预测模型及方法,包括JRD图像生成网络G、判别网络D和残差引导JRD回归网络R;所述JRD图像生成网络G以未压缩的原图像作为输入,以假JRD图像作为输出;之后,将生成图像与原始图像的残差作为对原图的补偿信息一起输入残差引导JRD回归网络R,最终输出预测的JRD分数,其中判别网络D以对抗的方式与生成网络G一起训练,以帮助G产生更接近真JRD图像的生成结果。在本发明提出的无参考模型中,原图像不需要进行若干次的压缩编解码,使预测效率大大提升。同时,在回归网络中,生成图像的残差作为补充信息被输入,使模型最终预测结果更加准确可靠。
-
公开(公告)号:CN118784845A
公开(公告)日:2024-10-15
申请号:CN202410741652.4
申请日:2024-06-11
Applicant: 杭州电子科技大学
IPC: H04N19/172 , H04N19/20 , G06V10/80 , G06V10/82 , G06T7/246 , G06T7/269 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了基于多阶层特征融合的虚拟视点绘制空洞填充方法,将局部连续帧和非局部随机帧,通过多阶层编码进行特征细化,从空洞区域以外的已知区域传播时空信息,得到局部特征块和非局部特征块;对局部连续帧进行光流补全,得到带有空洞的相邻帧的光流特征,用于检测虚拟视点序列中的运动对象,以引导特征传播,特征传播结合所述局部特征块,传递和更新运动对象的信息,缓解了前背景混叠问题;将更新后的特征和非局部特征块进行内容重建,再解码重构得到空洞修复帧,加入多头时空自注意力模块和融合前馈神经网络,有利于聚合不同特征的信息,充分利用局部和非局部相邻帧的特征,较好处理伪影的问题。
-
-
-
-
-
-
-
-
-