-
公开(公告)号:CN120013757A
公开(公告)日:2025-05-16
申请号:CN202510085937.1
申请日:2025-01-20
Applicant: 上海交通大学
IPC: G06T3/4038 , G06T3/4046 , G06T5/90 , G06V10/46 , G06V10/75 , G06V10/82
Abstract: 本公开提供一种基于关键点和单应性估计的图像拼接方法及系统,其中,方法,包括:获取同一物体的第一视角图像和第二视角图像;采用增量搜索策略确定增量搜索窗口;在增量搜索窗口确定正确匹配的关键点对集合;对正确匹配的关键点对集合进行离群点消除处理,确定第一阶段的单应性矩阵;采用预设的深度神经网络对增量搜索窗口对应的第一视角图像的图像区域和第二视角图像的图像区域进行单应性估计处理,确定第二阶段的单应性矩阵;根据第一阶段的单应性矩阵和第二阶段的单应性矩阵,确定拼接图像;对拼接图像进行色彩校正优化,确定目标拼接图像。通过本公开,从粗到细地确定两相邻视角图像的重叠区域的单应性关系,提高图像拼接的精度和鲁棒性。
-
公开(公告)号:CN118542659A
公开(公告)日:2024-08-27
申请号:CN202410755733.X
申请日:2024-06-12
Applicant: 上海交通大学医学院附属瑞金医院 , 复旦大学附属儿科医院
Abstract: 本申请涉及机器视觉技术领域,公开了一种基于机器视觉的呼吸监测方法、装置、设备及存储介质。所述方法包括:通过图像传感器采集呼吸运动图像数据;进行动作识别和片段选择,得到运动状态图像序列以及休息状态图像序列;计算初始ROI区域图像;进行图像预处理,得到目标ROI区域图像,并进行时变特征提取,得到时变特征集合;进行呼吸率分析,得到呼吸率分布曲线;进行呼吸率异常检测,得到呼吸率异常检测结果;通过呼吸率异常检测结果从呼吸率异常处理列表中进行呼吸率异常处理策略匹配,得到目标呼吸率异常处理策略并进行呼吸监测告警,本申请采用机器视觉技术提高了呼吸监测的准确率。
-
公开(公告)号:CN115941875A
公开(公告)日:2023-04-07
申请号:CN202211684296.4
申请日:2022-12-27
Applicant: 上海交通大学
IPC: H04N7/14 , H04N19/137 , H04N19/625 , H04N19/61 , G06V40/16 , G06V10/762 , G06V10/82 , G06N3/048 , G06N3/08
Abstract: 本发明提供一种基于神经辐射场的超低带宽视频通话传输系统和方法,包括:三维数字人脸重建模型,其从人脸图像中提取出人脸特征进行超低带宽视频通话传输;并能够以表情特征为输入显示地控制人脸表情,实现三维重建;人脸特征聚类分析模块,其实现人脸特征进行超低带宽视频通话传输的实时性;人脸特征压缩模块,对人脸特征进行压缩;视频通话演示模块,展示实时的超低带宽视频通话传输过程。本发明动态神经辐射场实现人脸重建模型,实现高拟真度无限分辨率的人脸重建,根据模型将人脸表情特征与人脸图像一一对应的特性,由原本的人脸视频的传输转为人脸特征的传输,并通过聚类分析和特征压缩,最终实现超低带宽近乎实时的人脸视频通话传输效果。
-
公开(公告)号:CN105407357A
公开(公告)日:2016-03-16
申请号:CN201510885787.9
申请日:2015-12-04
Applicant: 上海交通大学
IPC: H04N19/503 , H04N19/51 , H04N19/567
Abstract: 本发明提供一种基于聂曼-皮尔逊准则的SKIP模式快速选择方法,步骤是:将一个预测单元预测模式判定建模为“SKIP模式”和“非SKIP模式”两类的分类问题,采用当前编码单元的SKIP模式的率失真代价作为决策特征,在线统计学习前四帧,针对不同量化参数及不同编码单元深度,通过非参数概率密度估计分别得到最优选为SKIP模式和非SKIP模式时的决策特征的条件概率分布。然后基于在线学习的统计信息,利用聂曼-皮尔逊判定准则对剩余帧的SKIP模式进行提前判决。基于聂曼-皮尔逊准则,在限制SKIP模式错判概率的前提下,尽可能多的减少SKIP模式漏判概率,即在保证编码的率失真性能情况下,最大可能的提高编码速度。
-
公开(公告)号:CN103945245A
公开(公告)日:2014-07-23
申请号:CN201410152947.4
申请日:2014-04-16
Applicant: 上海交通大学
IPC: H04N21/262 , H04N21/24 , H04N21/647
Abstract: 本发明提供一种DASH码率切换方法以及快速视频启动的方法,所述切换方法:设置一段固定的缓存区间,只要播放期间缓存处于当前的固定缓存区间,码率就保持不变,只有缓存发生上溢或者下溢时,才进行码率的向上切换和向下切换;在缓存到达固定缓存区间上限之前,通过快速视频启动机制及时将视频质量提升到匹配当前的网络带宽;在缓存到达固定缓存区间下限将要向下切换之前,通过设置预警因子提前进行向下切换,将码率切换到中间视频呈现。该方法通过设置固定的缓存区间并根据缓存状态动态切换码率,有效地减少DASH码率切换次数,引入固定缓存区间来抵消网络的波动,因而可以大量地降低码率切换次数。
-
公开(公告)号:CN102970536A
公开(公告)日:2013-03-13
申请号:CN201210462123.8
申请日:2012-11-15
Applicant: 上海交通大学
Abstract: 本发明提供一种改进的带有预测残差调整的视频编码方法,其中:根据预设的量化参数,获得基于量化的视频编码方法的失真;根据预设的量化参数和预测残差的调整程度,获得在带有预测残差调整的编码方法下,由量化和残差调整所造成的总失真;设得到的两种编码方法的失真相等或近似相等,以此确定在失真等效的意义下,带有预测残差调整的编码方法的等效量化参数;将得到的等效量化参数代入为基于量化的视频编码优化拉格朗日乘子的方法中,得到适用于带有预测残差调整的视频编码的拉格朗日乘子。接着,利用得到的拉格朗日乘子对带有预测残差调整的视频编码进行率失真优化。本发明考虑了由量化和残差调整所造成的总失真,因而能够获得较高的编码效率。
-
公开(公告)号:CN101794448B
公开(公告)日:2012-07-04
申请号:CN201010139976.9
申请日:2010-04-07
Applicant: 上海交通大学
Abstract: 一种图像处理技术领域的主从摄像机系统的全自动标定方法,本发明通过将转动动态摄像机过程中自动获得的图像拼接成马赛克图像,再自动将该图像与主摄像机图像进行特征点的提取与匹配,从而获得静态摄像机图像像素坐标与动态摄像机控制参数之间的标定结果,实现全自动标定主从摄像机系统。通过马赛克拼接图像表示动态摄像机的视场范围,利用了SURF特征点估计两个不同成像平面之间的关系,只需要事先制定好动态摄像机的运动轨迹,就可以自动的标定出该主从摄像机系统,能够在保持标定精度较好的条件下(误差率为3%-5%),实现主从摄像机系统的自动标定,节省了人力与时间,降低了标定过程中的复杂程度。
-
公开(公告)号:CN104333755B
公开(公告)日:2017-11-14
申请号:CN201410582598.X
申请日:2014-10-27
Applicant: 上海交通大学
IPC: H04N19/109 , H04N19/147
Abstract: 本发明提供了一种HEVC中B帧的基于SKIP/Merge RD Cost的CU提前终止方法,步骤是:首先是为每一帧初始化各个阈值,然后是针对每一个CU通过阈值来判断是否能提前终止,包括SKIP/Merge模式的提前跳出和CU停止向下划分两个部分,最后是根据搜索得到的最优模式进行阈值的自适应更新。本发明能够解决HEVC在B帧CU搜索时复杂度过大的问题,在HEVC的参考编码器HM12.0下,针对多个视频序列编码器平均有50%的速度提升,而BD‑rate(相同质量下的码率)仅有1.25%的增加。
-
公开(公告)号:CN105430391A
公开(公告)日:2016-03-23
申请号:CN201510885775.6
申请日:2015-12-04
Applicant: 上海交通大学
IPC: H04N19/105 , H04N19/119 , H04N19/147 , H04N19/159
Abstract: 本发明提供一种基于逻辑回规分类器的帧内编码单元快速选择方法,所述方法将一个编码单元是否向下划分建模为“向下划分”和“不向下划分”两类的分类问题,采用逻辑回规分类器来解决这个两类分类问题。离线学习三个视频序列得到逻辑回规分类器最优的逻辑回规系数,通过计算多个候选特征的有效性来选择最佳的决策特征。利用离线学习得到的逻辑回规分类器对帧内编码单元进行快速选择,从而跳过其它不必要的预测编码模式计算,能够有效的降低HEVC编码器帧内编码复杂度,有利于实时HEVC编码器的实时应用。
-
公开(公告)号:CN102970536B
公开(公告)日:2015-10-28
申请号:CN201210462123.8
申请日:2012-11-15
Applicant: 上海交通大学
IPC: H04N19/567 , H04N19/61
Abstract: 本发明提供一种改进的带有预测残差调整的视频编码方法,其中:根据预设的量化参数,获得基于量化的视频编码方法的失真;根据预设的量化参数和预测残差的调整程度,获得在带有预测残差调整的编码方法下,由量化和残差调整所造成的总失真;设得到的两种编码方法的失真相等或近似相等,以此确定在失真等效的意义下,带有预测残差调整的编码方法的等效量化参数;将得到的等效量化参数代入为基于量化的视频编码优化拉格朗日乘子的方法中,得到适用于带有预测残差调整的视频编码的拉格朗日乘子。接着,利用得到的拉格朗日乘子对带有预测残差调整的视频编码进行率失真优化。本发明考虑了由量化和残差调整所造成的总失真,因而能够获得较高的编码效率。
-
-
-
-
-
-
-
-
-