-
公开(公告)号:CN119273916A
公开(公告)日:2025-01-07
申请号:CN202411301917.5
申请日:2024-09-18
Applicant: 华中科技大学
IPC: G06V10/26 , G06V10/40 , G06V10/774 , G06V10/74 , G06V10/762
Abstract: 本发明公开了一种无监督语义分割模型的构建方法、图像语义分割方法及设备,属于图像处理技术领域;基于同类样本成群出现的先验原则,利用ViT网络得到的批内图像中两两图像块之间的互注意力权重寻找每个图像块的图像块特征在整张图像中的潜在相似特征;通过将分割头输出的批内图像各图像块的分割头特征,基于处理后的两两图像块之间的互注意力权重进行聚合,得到批内图像各图像块的分割头聚合特征,并进一步输入至投影头中,得到对应的投影聚合特征;通过特征聚合的方式提高了分割头和投影头特征的表达能力,在给予大概率出现的强势语义充分表达的同时,还给予了小概率出现的弱势语义足够的表达,进而精细准确地实现图像语义分割。
-
公开(公告)号:CN114170546A
公开(公告)日:2022-03-11
申请号:CN202111357371.1
申请日:2021-11-16
Applicant: 中国人民解放军63861部队 , 华中科技大学
Abstract: 本发明公开了一种视频目标状态的识别模型训练方法及识别方法,其模型训练方法包括:将图像帧输入特征提取模块以获取高层特征;通过空间推理模块对高层特征进行上采样并与显著性标签比对训练,计算第一损失函数并通过训练使第一损失函数收敛至预设程度;将高层特征高层特征依次输入时间推理模块中的ConvLSTM网络、全连接层和Softmax层后获得当前目标的预测状态并与状态标签比对训练,计算第二损失函数并通过训练使第二损失函数收敛至预设程度,获得视频目标状态识别模型。利用该识别模型能够实现视频图像中目标状态的识别。通过时间推理和空间推理相结合的方法具有较高的状态识别精度,实现了自动化的视频图像序列的特征事件检测。
-
公开(公告)号:CN114170067A
公开(公告)日:2022-03-11
申请号:CN202111359868.7
申请日:2021-11-17
Applicant: 中国人民解放军63861部队 , 华中科技大学
Abstract: 本发明公开了一种图像格式转换方法及转换模块以及基于该图像格式转换地图像识别装置及识别方法,其中图像格式转换方法包括将bmp格式文件的位图数据实体保存为16位无符号整型数x;利用第一转换公式将16位无符号整形数x进行归一化处理,得到归一化后的整型数x',其中,max(x)表示16位无符号整型数x的最大值;将归一化后的整型数x'转换为8位无符号整型数y,并利用第二转换公式对8位无符号整型数y进行非线性转换,并将转换结果z保存为png格式文件。将bmp格式文件的位图数据实体进行归一化和非线性转换,保存为png格式文件,避免图像显示的问题,使用常规设备便能显示出完整的图片,提高目标检测地准确度。
-
公开(公告)号:CN103596007B
公开(公告)日:2016-09-07
申请号:CN201310546122.6
申请日:2013-11-06
Applicant: 华中科技大学
IPC: H04N19/164 , H04N19/142 , H04N19/124 , H04N19/87 , H04N19/147
Abstract: 本发明公开了一种根据观看环境变化调整视频编码质量的方法,其中,移动设备获取由携带的传感器采集的环境参数,并使用网络传输协议把环境参数发送给视频服务器,视频服务器分析接收到的环境参数分析,并估测移动设备当前的观看环境状态,根据估测的观看环境状态动态改变视频编码的质量。本发明通过动态调整视频流质量,可最好地匹配当前的观看场景,提高视觉质量与体验质量,并且提高带宽的利用效率。
-
公开(公告)号:CN100394693C
公开(公告)日:2008-06-11
申请号:CN200510018179.4
申请日:2005-01-21
Applicant: 华中科技大学
Abstract: 本发明公开了一种变长码的编码和解码方法。该方法首先根据信源符号的出现概率,按照从大到小的原则对要编码的信源符号集中的信源符号进行重新排序,分配对应的编码序号;利用得到的编码序号计算出编码的码字层次和码字长度;在得到码字层次和码字长度后,产生与该编码序号相对应的码字。而在接收到一个输入变长码码流后;从所接收的变长码码流中得出码字层次和DECINFO字段;然后利用所得出的码字层次和DECINFO字段来确定对应的编码序号,再根据编码序号得到对应的信源符号。本发明的变长码具有非常规则的结构,可以通过简单的算法实现编解码,从而避免传递及存储码表,节省了传输带宽和存储空间。
-
公开(公告)号:CN117351230A
公开(公告)日:2024-01-05
申请号:CN202311250557.6
申请日:2023-09-25
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于SIFT特征匹配的语义图生成方法、电子设备、存储介质,属于图像自动标识技术领域,所述语义图生成方法包括:在目标图中为每个关键像素点配对最相似像素点和次相似像素点,形成一对二匹配对;计算同一匹配对中的关键像素点与最相似像素点的距离和与次相似像素点的距离,剔除错误的匹配对,构造可用匹配集;在可用匹配集中任选四元对并推导出原图与目标图的变换矩阵;计算局内点的出现概率,当概率未达到预设概率,重新选择四元直至达到预设概率,基于当前合格四元对的变换矩阵得到目标图的目标语义图。通过上述方法,可以提高四元对有效性的概率,推导出较为准确的变换矩阵,继而自动生成目标图的目标语义图。
-
公开(公告)号:CN103596007A
公开(公告)日:2014-02-19
申请号:CN201310546122.6
申请日:2013-11-06
Applicant: 华中科技大学
IPC: H04N19/164 , H04N19/142 , H04N19/124 , H04N19/87 , H04N19/147
Abstract: 本发明公开了一种根据观看环境变化调整视频编码质量的方法,其中,移动设备获取由携带的传感器采集的环境参数,并使用网络传输协议把环境参数发送给视频服务器,视频服务器分析接收到的环境参数分析,并估测移动设备当前的观看环境状态,根据估测的观看环境状态动态改变视频编码的质量。本发明通过动态调整视频流质量,可最好地匹配当前的观看场景,提高视觉质量与体验质量,并且提高带宽的利用效率。
-
公开(公告)号:CN101562747B
公开(公告)日:2010-08-25
申请号:CN200910062165.0
申请日:2009-05-19
Applicant: 华中科技大学
Abstract: 一种视频编码预测残差块的分解及重建方法,属于信号处理中的视频编码技术领域,减少现有DCT变换矩阵引起的块效应,并解决该矩阵的值不能进行调整的问题。本发明分解方法包括:预测残差块分类,第一、第三、第二多通道滤波器组横向分解,横向分解系数矩阵分类,第一、第三、第二多通道滤波器组纵向分解步骤;本发明重建方法包括:预测残差块的分解系数矩阵分类,第一、第三、第二多通道滤波器组纵向重建,横向分解系数矩阵分类,第一、第三、第二多通道滤波器组横向重建步骤。本发明能有效地进行去相关性,并能减少DCT变换矩阵和预测残差块尺寸不匹配所引起的块效应,提高编码主客观质量。
-
公开(公告)号:CN101489134B
公开(公告)日:2010-06-16
申请号:CN200910060558.8
申请日:2009-01-16
Applicant: 华中科技大学
Abstract: 本发明提供一种用于视频帧内编码的KLT矩阵训练方法,属于信号处理中的视频编码领域。本发明首先提取每种帧内预测模式下的残差信号的频谱,然后,将残差样本进行分组并采用传统的方法训练得到候选KLT矩阵,对每个候选KLT矩阵采用低频子带优先的置换策略进行优化并计算优化后的变换性能,选择具有最佳变换性能的优化KLT矩阵作为该预测模式下残差信号的变换矩阵。本发明避免了在编码时实时训练KLT矩阵的巨大计算量,减少了用于表示训练矩阵的额外比特开销,训练得到的矩阵具有良好的变换性能。
-
公开(公告)号:CN101562747A
公开(公告)日:2009-10-21
申请号:CN200910062165.0
申请日:2009-05-19
Applicant: 华中科技大学
Abstract: 一种视频编码预测残差块的分解及重建方法,属于信号处理中的视频编码技术领域,减少现有DCT变换矩阵引起的块效应,并解决该矩阵的值不能进行调整的问题。本发明分解方法包括:预测残差块分类,第一、第三、第二多通道滤波器组横向分解,横向分解系数矩阵分类,第一、第三、第二多通道滤波器组纵向分解步骤;本发明重建方法包括:预测残差块的分解系数矩阵分类,第一、第三、第二多通道滤波器组纵向重建,横向分解系数矩阵分类,第一、第三、第二多通道滤波器组横向重建步骤。本发明能有效地进行去相关性,并能减少DCT变换矩阵和预测残差块尺寸不匹配所引起的块效应,提高编码主客观质量。
-
-
-
-
-
-
-
-
-