-
公开(公告)号:CN110493597A
公开(公告)日:2019-11-22
申请号:CN201910624886.X
申请日:2019-07-11
Applicant: 同济大学
IPC: H04N19/147 , H04N19/172 , H04N19/80
Abstract: 本发明涉及一种高效感知视频编码优化方法,该方法以感知失真作为客观失真衡量指标优化HEVC编码器,包括以下步骤:1)建立基于HVS特性的感知失真模型;2)基于所述感知失真模型拟合获得感知失真所对应的码率,进而推导lambda算子,建立基于感知失真的率失真模型;3)基于所述基于感知失真的率失真模型优化HEVC编码器的编码参数。与现有技术相比,本发明具有低复杂度、高鲁棒性与高效率等优点,且能在一定程度上保持视频的感知质量。
-
公开(公告)号:CN110490842A
公开(公告)日:2019-11-22
申请号:CN201910659348.4
申请日:2019-07-22
Applicant: 同济大学
Abstract: 本发明涉及一种基于深度学习的带钢表面缺陷检测方法,该方法通过缺陷判断与缺陷归类双流网络模型提取带钢表面的局部信息,并结合尺度金字塔进行综合分析,得到类热图,最终同时得到缺陷的种类与位置,所述缺陷判断与缺陷归类双流网络模型包括缺陷判断分支和缺陷归类分支。与现有技术相比,本发明具有计算量少、计算效率高、鲁棒性强、标注成本低、精度高、设备成本低等优点。
-
公开(公告)号:CN110072104A
公开(公告)日:2019-07-30
申请号:CN201910292647.9
申请日:2019-04-12
Applicant: 同济大学
IPC: H04N19/149 , H04N19/154 , H04N19/182
Abstract: 本发明涉及一种基于图像级JND预测的感知图像压缩方法,该方法具体为:预测待压缩图像的JND数目,计算每个JND对应的预测QF值,根据给定压缩QF值与各预测QF值间的关系,获得最终的感知QF值,基于所述感知QF值进行图像压缩。与现有技术相比,本发明具有自适应较强、图像压缩效率高等优点。
-
公开(公告)号:CN108229565A
公开(公告)日:2018-06-29
申请号:CN201810011570.9
申请日:2018-01-05
Applicant: 同济大学
IPC: G06K9/62
Abstract: 本发明涉及一种基于认知的图像理解方法,所述方法包括:高认知度的神经网络训练模型建立步骤,将待分类图片数据集与图片标签数据集之间进行关联,根据关联的结果对待分类图片数据集内部进行重新分类,将重新分类后的数据集进行深度卷积神经网络训练,得到高认知度的神经网络训练模型;图像理解步骤,将待理解的图片通过高认知度的神经网络训练模型,得到图片对应的标签。与现有技术相比,本发明具有理解准确程度高、更加符合实际情况以及有效缩短图像理解时间等优点。
-
公开(公告)号:CN103796033B
公开(公告)日:2017-05-24
申请号:CN201410035122.4
申请日:2014-01-24
Applicant: 同济大学
Abstract: 本发明涉及一种高效视频编码零系数块提前检测方法,包括:1)设定量化参数Qp、二维DCT变换矩阵C、残差矩阵Re以及TU块的大小N;2)根据Qp、C、Re和N计算零块检测阈值;3)对于一个大小为N的TU块计算其对应的检测参数SAD;4)对于一个大小N的TU块,首先判断SAD是否满足SAD
-
公开(公告)号:CN104301723A
公开(公告)日:2015-01-21
申请号:CN201310297983.5
申请日:2013-07-16
Applicant: 同济大学
IPC: H04N19/11 , H04N19/557 , H04N19/147
Abstract: 本发明涉及一种基于最优停止理论的高效视频快速编码方法,该方法包括以下步骤:1)获取视频序列中的待编码帧和N个高效视频编码模式,并初始化待编码帧中每个PU的概率信息;2)计算当前待编码PU在每个编码模式下对应的概率^,k=1,2,...,N,并将N个编码模式按其概率降序排列;3)应用最优停止理论根据步骤2)的顺序依次检查各编码模式,计算并获得最佳编码模式和最优停止点;4)采用得到的最佳编码模式对当前待编码PU进行编码,并根据当前最佳编码模式和最优停止点更新参数,直至整个视频序列编码完成。与现有技术相比,本发明降低了HEVC在预测单元模式决定部分的计算量,提高编码速度,促进其在实际中的广泛应用。
-
公开(公告)号:CN104036287A
公开(公告)日:2014-09-10
申请号:CN201410208197.8
申请日:2014-05-16
Applicant: 同济大学
IPC: G06K9/62
CPC classification number: G06K9/4642 , G06K9/00342 , G06K9/6269
Abstract: 本发明涉及一种基于人类运动显著轨迹的视频分类方法,包括以下步骤:将视频集M划分成训练集Mt和测试集Mv,使用SIFT和稠密光流技术在多尺度空间上跟踪每一个视频中人类运动信息,获得每一个视频的运动显著轨迹;分别提取每个轨迹的特征描述向量;使用PCA方法消除特征描述向量中的冗余信息,对每一类特征描述向量进行降维;利用高斯混合模型对训练集Mt中的特征描述向量进行聚类,再使用Fisher Vector方法生成视频集M中每一个视频的Fisher向量;在训练集Mt上,构建线性SVM分类模型;在测试集Mv上,使用该线性SVM分类模型对测试集中的视频进行分类。与现有技术相比,本发明具有鲁棒性好、计算效率高等优点。
-
公开(公告)号:CN103533353A
公开(公告)日:2014-01-22
申请号:CN201310455325.4
申请日:2013-09-29
Applicant: 同济大学
IPC: H04N19/00 , H04N19/147 , H04N19/61 , H04N19/625 , H04N19/573
Abstract: 本发明涉及一种近似视频编码系统,包括:分析器,用于检测各视频间的近似关系,获得一组近似视频,并输出与该近似视频相应的索引文件:编码器,与分析器连接,用于接收分析器输出的索引文件,并根据该索引文件对近似视频进行编码压缩,输出与每个视频相对应的独立码流:集成器,与编码器连接,用于将所有独立码流进行整合,生成一个单一码流:解码器,与集成器连接,用于对整合后的单一码流进行解码。与现有技术相比,本发明具有压缩效率高、可有效降低视频数据库空间消耗等优点。
-
公开(公告)号:CN114549317B
公开(公告)日:2025-04-25
申请号:CN202210167971.X
申请日:2022-02-23
Applicant: 同济大学
Abstract: 本发明涉及一种基于时空超分辨率的视频描述方法及电子设备,所述方法基于一视频描述模型实现,包括以下步骤:获取输入视频,对该输入视频进行采样获得包含若干压缩尺寸帧的视频帧序列;通过所述视频描述模型,对所述视频帧序列进行多模态特征提取和特征编码,动态融合编码后的多模态特征,逐步解码生成视频描述语句;其中,所述视频描述模型训练时,从空间和时间两个维度上重构原始分辨率的帧和相邻采样帧之间的中间缺失帧,以重构误差和解码预测误差构建损失函数,实现模型训练。与现有技术相比,本发明具有描述丰富准确、泛化能力强、计算开销低等优点。
-
公开(公告)号:CN119540088A
公开(公告)日:2025-02-28
申请号:CN202411585152.2
申请日:2024-11-07
Applicant: 同济大学
Abstract: 本发明涉及低光图像技术领域,具体涉及基于可逆神经网络的低光图像增强方法。包括:步骤一搭建可逆神经网络;步骤二可逆神经网络的工作过程和训练;步骤三应用:将在低光照条件下拍摄的图像,输入上述训练后的可逆神经网络进行增强处理。与现有技术相比,本发明提高模型的增强效果和可解释性,增加分解的准确性和模型的泛化能力,本发明引入记忆机制,学习整个数据集的亮度信息,指导图像在亮度方面的恢复过程,提高模型的增强效果。
-
-
-
-
-
-
-
-
-