-
公开(公告)号:CN118158427A
公开(公告)日:2024-06-07
申请号:CN202410446677.1
申请日:2024-04-15
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/42 , H04N19/174 , H04N19/182
Abstract: 本发明属于视频编码领域,公开了一种面向AV1调色板编码模式的高效k‑means聚类硬件架构及方法,本发明提出三条k‑means电路并行的架构,k‑means电路包括calc_indices和calc_centroids两个模块。calc_indices模块根据像素和簇中心的距离,来计算像素的索引,其中距离采用曼哈顿距离,索引值为像素和簇中心距离最小的簇编号。calc_centroids模块执行簇中心的更新,将索引值相同的像素累加并求平均值,作为下一次迭代的簇中心存储在C‑RAM中,本发明将不同块、同一块的k的聚类计算过程进行交织,从而提高硬件的利用率并减少取数次数。
-
公开(公告)号:CN117319654A
公开(公告)日:2023-12-29
申请号:CN202311392255.2
申请日:2023-10-25
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/124 , H04N19/147 , H04N19/19 , H04N19/70
Abstract: 本发明属于视频编码领域,公开了一种基于扫描线并行RDOQ算法优化的硬件及流水实现方法,本发明在算法上将最优系数决策的之字形扫描线拆解成多个单向扫描线,以实现并行计算。在最优非零位置决策阶段,将迭代计算拆分成单条扫描线的并行计算,最后对各个扫描线上的最优位置进行RD cost的比较,在保证实时效果良好的前提下,减少迭代的周期,以满足视频编码处理的实时需求。本发明优化了传统的RD cost计算算法。Rate的强数据依赖使得运算须在单周期内完成,减少了硬件设计中运算的操作数量,节省了资源消耗。本发明充分利用Distortion无数据依赖的特性将运算拆分到多个流水线中,有效了提高硬件设计的时序表现。
-
公开(公告)号:CN118018877A
公开(公告)日:2024-05-10
申请号:CN202410142890.3
申请日:2024-02-01
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
Abstract: 本发明属于脉冲数据处理技术领域,涉及一种面向脉冲相机的高效数据流处理方法,其编码端的数据压缩过程包括:步骤一,通过脉冲流分块模块将获取的原始脉冲流切割分块,得到原始脉冲块;步骤二,通过脉冲流凝聚模块压缩所述的原始脉冲块,得到压缩脉冲流;步骤三,将原始脉冲块和压缩脉冲流输入脉冲损失像素标记器,分析压缩造成的脉冲损失来进行信息补偿,后经像素级分类器输出量化二进制信息帧;步骤四,通过压缩脉冲‑信息整合器将压缩脉冲流、量化二进制信息帧和解码端的提示信息进行整合,生成最终的二进制数据流。相较于传统的脉冲压缩方案,本发明可以大大降低整个过程的复杂度,具有省时高效的优点。
-
公开(公告)号:CN117041565A
公开(公告)日:2023-11-10
申请号:CN202310887654.X
申请日:2023-07-19
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/11 , H04N19/186 , H04N19/176 , H04N19/593
Abstract: 本发明公开了一种AV1视频帧内粗模式决策优化及硬件架构方法,基于AV1对帧内模式决策优化,粗模式决策减少了计算时间,而计算复杂度上,将原来的61种决策情况分为两次进行,第一次选择13种模式进行;第二次选择6种模式进行决策;此外,不对矩形块的预测代价值做哈达玛变换,而是选择用基于4x4方块SATD值的叠加;在预测代价排序的选择上,选用双调排序,以适合发明所设计的并行架构;系统级优化方面,在每个方块处理流程上,采用流水线设计,缩小了硬件所需的面积资源,也加快了硬件实现的速度。
-
公开(公告)号:CN118573890A
公开(公告)日:2024-08-30
申请号:CN202410705678.3
申请日:2024-06-03
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/436 , H04N19/159 , H04N19/59 , H04N19/20
Abstract: 本发明公开了一种AV1帧内粗略模式决策的硬件友好型架构,像素样本管理单元负责向帧内预测单元、辅助方向预测单元和残差单元提供假重建像素和原始像素。帧内预测单元接收假重建像素,并在非方向模式和主方向模式下进行预测,生成预测像素,然后传递给残差和SATD单元。辅助方向单元接收假重建像素,并利用排序单元确定的最小成本主方向来进行辅助方向模式的预测。生成的预测像素也被转发到残差和SATD单元。残差单元和SATD单元都从像素样本管理单元接收原始像素,并接收预测像素,以计算SATD成本,然后发送到排序单元,排序单元将它们进行排序,以确定最优的模式。本发明提高数据吞吐量,提高硬件架构所能支持的视频分辨率。
-
公开(公告)号:CN116527910A
公开(公告)日:2023-08-01
申请号:CN202310422535.7
申请日:2023-04-11
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/147 , H04N19/149 , H04N19/19 , H04N19/70
Abstract: 本发明属于AVS3视频编码领域,具体涉及一种基于扫描线并行的率失真优化量化方法,在完成预量化过程之后,采用列扫描顺序对预量化系数进行并行计算;每次计算多组预量化系数数据,在多组数据比较下确定最优量化系数;之后对非零位置进行并行决策,确定扫描线上最优非零位置。最后进行移位末位系数置零操作。本发明的方法在RDOQ中,提出了通过局部性优化,在符合zig‑zag扫描模式的情况下,可以进行并行处理,同时保留局部依赖。本发明在保证效果良好的前提下,减小了编码损失。
-
公开(公告)号:CN115131209B
公开(公告)日:2025-04-18
申请号:CN202210740614.8
申请日:2022-06-28
Applicant: 杭州电子科技大学
IPC: G06T3/4038 , G06T5/50 , G06V10/25 , G06V10/46 , G06V10/75
Abstract: 本发明属于图像处理领域,公开了一种基于DSP的实时视频拼接方法,采用select操作方式定向选择数据,借助gather和scatter指令将不连续RAM地址中的数据加载到向量寄存器中;图像配准算法部分:在匹配前设定阈值预筛选特征点,基于汉明距离进行特征点匹配。算法均使用SIMD指令集并行处理多数据,提高计算效率;采用PING‑PONG方式传输数据,旨在隐藏视频拼接过程中外部存储器访问的周期,从而有效提高数据吞吐量。最后,基于DAG生成算法调度表,在双DSP平台上并行执行ORB特征提取算法。本发明减少了计算复杂度;并为计算机视觉相关的算法在DSP平台上研究提供了参考。
-
公开(公告)号:CN118337639B
公开(公告)日:2025-03-18
申请号:CN202410592683.8
申请日:2024-05-14
Applicant: 杭州电子科技大学
IPC: H04L41/14 , H04L43/0894
Abstract: 本发明公开了一种端边云协同视频群智感知多目标性能评价方法,基于码率度量码流数据传输代价,基于码率和相应存储架构度量码流数据存储代价,基于硬件资源和能量资源的消耗度量复杂度代价;将存储、传输和复杂度代价基于消耗的成本进行同质化度量,得到统一量纲度量的参量;计算和存储静态硬件成本折算为每一路摄像头视频所需计算和存储硬件代价;计算和存储动态能耗成本折算为每一路摄像头视频编码分析所需电力消耗代价;传输存储代价根据宽带网络费用折算为每路视频传输所需成本,所有成本基于货币进行度量;基于失真和无失真情况下的多目标性能,构建机器视觉算法性能损失,通过性能损失与所述参量构建代价函数,以不同参量下性能的优劣为判据进行多目标性能评价。
-
公开(公告)号:CN119449979A
公开(公告)日:2025-02-14
申请号:CN202411264570.1
申请日:2024-09-10
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于双向分离相关量的全景视频插帧方法。本发明方法首先提取输入图像的外观特征和相关量特征,然后利用相关量特征进行成本聚合获得初始光流,对初始光流进行迭代更新得到细化光流、最终特征值、掩膜和残差信息,最后对各信息进行融合,得到插帧图像。本发明采用了成本聚合的方法来分离生成的相关量,更有效地处理全景视频中存在的运动各向异性和运动分布的不均匀的特殊问题,有效地解决因不同维度投影的采样率差异所造成的伪影和估计不准确的问题。本发明更好地适应不同纬度上的运动幅度差异所引起的运动查询误差,进而提高光流预测的精度,并最终获得质量更高的中间帧。
-
公开(公告)号:CN118828058A
公开(公告)日:2024-10-22
申请号:CN202410708537.7
申请日:2024-06-03
Applicant: 杭州电子科技大学
IPC: H04N21/2343 , H04N21/4402 , H04N21/44 , H04N21/234 , H04N9/64 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了Transformer与CNN相结合的视频插帧方法。本发明的网络结构包括特征提取网络、光流估计网络和融合与细化网络。特征提取网络不同阶段的输出作为不同尺度的特征,光流估计网络通过对前后两帧视频图像进行特征提取和运动估计,生成前后两帧到中间帧的双向光流信息,融合与细化网络输入为特征提取网络提取的不同阶段的特征信息、光流估计网络生成的输出光流,输出为一张掩膜图像以及一副残差图像。原始图像经过光流的绘制,再通过掩膜做加权最后加上残差图像,输出最终的插帧图像。本发明通过Transformer模型与CNN网络相结合,能够从整个图像范围内提取丰富的语义信息,并有效地捕捉帧间的运动关系。
-
-
-
-
-
-
-
-
-