-
公开(公告)号:CN103489174A
公开(公告)日:2014-01-01
申请号:CN201310460885.9
申请日:2013-10-08
Applicant: 武汉大学
Abstract: 本发明公开了一种基于残差保持的人脸超分辨率方法,本发明是基于学习的方法,首先将高低分辨率训练图像对统一分块,在以位置为依据的块集合内部进行处理:对输入图像的每一个块,在对应位置训练块集上分别估计其平滑高频成分、标准差投影高频成分、以及通过残差训练集估计其高频补偿成分。通过这三种高频信息的线性组合,在高分辨率平均脸上重建出高分辨率图像。以此解决或减轻噪点严重的人脸图像(如监控图像)超分辨率恢复中的噪声问题。
-
公开(公告)号:CN103489174B
公开(公告)日:2016-06-29
申请号:CN201310460885.9
申请日:2013-10-08
Applicant: 武汉大学
Abstract: 本发明公开了一种基于残差保持的人脸超分辨率方法,本发明是基于学习的方法,首先将高低分辨率训练图像对统一分块,在以位置为依据的块集合内部进行处理:对输入图像的每一个块,在对应位置训练块集上分别估计其平滑高频成分、标准差投影高频成分、以及通过残差训练集估计其高频补偿成分。通过这三种高频信息的线性组合,在高分辨率平均脸上重建出高分辨率图像。以此解决或减轻噪点严重的人脸图像(如监控图像)超分辨率恢复中的噪声问题。
-
公开(公告)号:CN118394969A
公开(公告)日:2024-07-26
申请号:CN202410033391.0
申请日:2024-01-09
Applicant: 武汉大学
IPC: G06F16/78 , G06F16/732 , G06N5/04 , G06V10/74
Abstract: 本发明提供一种基于大语言模型的交互式的视频检索方法和系统。本发明利用预训练的大语言模型作为检索的辅助工具,生成相关问题来询问用户的检索意图,并根据用户的反馈情况来实时更新查询内容,通过与用户的交互,进一步细化查询并提供更准确的结果。本发明首先对对数据集进行分帧和提取特征,针对不同的任务类型,对用户的查询条件进行不同的处理,同时进行了相似度分数计算和结果排序。用户可以对检索结果进行反馈包括标记正负样本、添加到提交列表等操作。之后大语言模型可以在用户的提示词的引导下来执行生成问题和更新查询内容的任务,提高检索结果的准确率和检索的高效性。并且这一过程是可以循环进行的,直至用户查找到自己就满意的结果。
-
公开(公告)号:CN102054510A
公开(公告)日:2011-05-11
申请号:CN201010534235.0
申请日:2010-11-08
Applicant: 武汉大学 , 武汉大千信息技术有限公司
IPC: G11B27/10
Abstract: 本发明涉及多媒体技术领域,尤其涉及一种视频预处理与播放的方法及系统。本发明通过使用公开的智能视频技术对视频进行分割,提取出包含用户感兴趣内容的视频段,并把视频片段的信息保存到数据库或附属文件,然后把这些视频段按时间顺序组织起来,构成一个逻辑视频文件,并实现对该逻辑视频文件进行常规的播放控制功能,也可以在视频片段和原始视频文件间平滑切换播放控制,从而减少了需要观看的视频帧数量,让用户集中精力在重要画面上,提高视频浏览的效率。
-
-
-