一种生成剪辑视频的方法及装置

    公开(公告)号:CN110996017B

    公开(公告)日:2020-12-15

    申请号:CN201910950805.5

    申请日:2019-10-08

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种生成剪辑视频的方法及装置,所述方法包括:确定与特定主题相关的文本和视频素材库,所述文本包含至少一个文本片段,所述文本片段包含用户自定义的视频效果属性和至少一个关键词;在所述视频素材库中确定与所述文本片段的语义相对应的候选视频素材;根据所述候选视频素材、所述视频效果属性和预设视频能量优化模型,获取所有候选视频素材对应的优化视频剪辑序列,并根据所述优化视频剪辑序列生成剪辑视频。所述装置执行上述方法。本发明实施例提供的生成剪辑视频的方法及装置,方便进行视频剪辑,且保证剪辑视频具有较好的播放效果。

    视频结构对齐方法和系统

    公开(公告)号:CN108898150B

    公开(公告)日:2020-08-21

    申请号:CN201810903732.X

    申请日:2018-08-09

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种视频结构对齐方法和系统,对齐方法包括:将两个输入视频中任一输入视频的结构边缘信息图和任一输入视频的梯度信息图融合,获取任一输入视频的显著性边缘特征图;对任一输入视频的显著性边缘特征图进行时间维度和空间维度的降采样,构建任一输入视频的显著性边缘特征图层,其中,显著性边缘特征图层自顶层到底层分辨率逐层升高;基于相关性的匹配度量对两个输入视频的显著性边缘特征图层进行匹配,获取预设个数的对齐结果,并选择预设个数的对齐结果中的任一对齐结果进行视频结构的对齐。本发明实施例避免了边缘计算检测等带来的复杂的计算代价,能够高效、快速地做到获取对齐结果进而对齐视频。

    基于区域线索改进文本图像预训练模型的零样本语义分割方法

    公开(公告)号:CN118506004A

    公开(公告)日:2024-08-16

    申请号:CN202410681096.6

    申请日:2024-05-29

    Abstract: 本发明提供一种基于区域线索改进文本图像预训练模型的零样本语义分割方法,包括:为预设的文本图像预训练模型构建输入数据;通过预设的区域级别桥梁对输入数据中的图像进行深度特征提取,区分出各个区域的类别特征;基于各个区域的类别特征通过预设的带有恢复损失的恢复解码器对预设的语义分割解码器添加额外约束条件降低过度拟合;基于经过降低过度拟合的图像特征和文本特征进行零样本语义分割。本发明解决了现有模型进行零样本语义分割泛化性差、像素级分类难以满足实际需求的问题。

    一种生成剪辑视频的方法及装置

    公开(公告)号:CN110996017A

    公开(公告)日:2020-04-10

    申请号:CN201910950805.5

    申请日:2019-10-08

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种生成剪辑视频的方法及装置,所述方法包括:确定与特定主题相关的文本和视频素材库,所述文本包含至少一个文本片段,所述文本片段包含用户自定义的视频效果属性和至少一个关键词;在所述视频素材库中确定与所述文本片段的语义相对应的候选视频素材;根据所述候选视频素材、所述视频效果属性和预设视频能量优化模型,获取所有候选视频素材对应的优化视频剪辑序列,并根据所述优化视频剪辑序列生成剪辑视频。所述装置执行上述方法。本发明实施例提供的生成剪辑视频的方法及装置,方便进行视频剪辑,且保证剪辑视频具有较好的播放效果。

    基于依赖感知对象位置重构的图像增强方法

    公开(公告)号:CN103810674B

    公开(公告)日:2016-09-21

    申请号:CN201210455248.8

    申请日:2012-11-13

    Applicant: 清华大学

    Abstract: 本发明提供了一种基于依赖感知对象位置重构的图像增强方法,该方法包括:初步提取图像的前景物体;将所述图像分成若干区域,并对各个区域进行前景物体依赖分析,得到依赖感知对象;依据摄影学的美观准则及依赖感知对象间的位置关系制定依赖感知对象位置的优化目标,并进行构图优化;对优化后图像的缺失部分进行背景补全,并进行修边处理,得到最终的图像增强结果。本发明能够自动分析和提取图像中的依赖感知对象,并将分析结果用于图像构图优化。

    基于视觉显著性和超像素分割的视频前景目标提取方法

    公开(公告)号:CN102637253B

    公开(公告)日:2014-02-19

    申请号:CN201110458008.9

    申请日:2011-12-30

    Abstract: 本发明是一种基于视觉显著性和超像素分割的视频前景目标提取方法,包括步骤:a.对视频进行多层超像素分割:将视频作为三维的视频体进行超像素分割,将视频体元素分组成为体区域;b.对视频进行关键帧的视觉显著性区域检测并对关键帧前景目标进行提取:对视频的关键帧图像,利用视觉显著性检测方法分析图像中的视觉显著性区域,然后利用视觉显著性区域作为初始值,采用图像前景提取方法获取关键帧前景目标;c.将关键帧前景目标与视频超像素分割结果匹配并在帧间传递:对关键帧前景目标所覆盖的视频体区域进行区域扩散,进而将前景目标提取结果在帧间连续传递。本发明效率很高,结果准确,人工干预少,方法鲁棒。

    基于视觉显著性和超像素分割的视频前景目标提取方法

    公开(公告)号:CN102637253A

    公开(公告)日:2012-08-15

    申请号:CN201110458008.9

    申请日:2011-12-30

    Abstract: 本发明是一种基于视觉显著性和超像素分割的视频前景目标提取方法,包括步骤:a.对视频进行多层超像素分割:将视频作为三维的视频体进行超像素分割,将视频体元素分组成为体区域;b.对视频进行关键帧的视觉显著性区域检测并对关键帧前景目标进行提取:对视频的关键帧图像,利用视觉显著性检测方法分析图像中的视觉显著性区域,然后利用视觉显著性区域作为初始值,采用图像前景提取方法获取关键帧前景目标;c.将关键帧前景目标与视频超像素分割结果匹配并在帧间传递:对关键帧前景目标所覆盖的视频体区域进行区域扩散,进而将前景目标提取结果在帧间连续传递。本发明效率很高,结果准确,人工干预少,方法鲁棒。

    一种图像合成方法及装置

    公开(公告)号:CN111612861A

    公开(公告)日:2020-09-01

    申请号:CN201910133411.0

    申请日:2019-02-22

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种图像合成方法及装置,包括:获取标签域目标图像和目标风格图像;基于训练好的图像合成深度卷积神经网络,对所述标签域目标图像和所述目标风格图像进行图像合成处理,获取到目标合成图像,所述训练好的图像合成深度卷积神经网络是由标签域样本图像和所述标签域样本图像对应的图像域样本图像训练得到的。本发明实施例通过将标签域图像和样例风格图像进行图像处理,合成得到图像域图像,提高了图像合成的真实度,提高了合成图像和样例风格图像之间的风格一致性。

    基于依赖感知对象位置重构的图像增强方法

    公开(公告)号:CN103810674A

    公开(公告)日:2014-05-21

    申请号:CN201210455248.8

    申请日:2012-11-13

    Applicant: 清华大学

    Abstract: 本发明提供了一种基于依赖感知对象位置重构的图像增强方法,该方法包括:初步提取图像的前景物体;将所述图像分成若干区域,并对各个区域进行前景物体依赖分析,得到依赖感知对象;依据摄影学的美观准则及依赖感知对象间的位置关系制定依赖感知对象位置的优化目标,并进行构图优化;对优化后图像的缺失部分进行背景补全,并进行修边处理,得到最终的图像增强结果。本发明能够自动分析和提取图像中的依赖感知对象,并将分析结果用于图像构图优化。

    片网模型及其构建方法
    10.
    发明公开

    公开(公告)号:CN103500176A

    公开(公告)日:2014-01-08

    申请号:CN201310403210.0

    申请日:2013-09-06

    Applicant: 清华大学

    Abstract: 本发明涉及图像处理技术领域,具体涉及一种用于图像表示的片网模型以及该片网模型的构建方法。该用于图像表示的片网模型,为由若干个复合节点以及基本节点组成的森林状结构,每个所述复合节点均为非叶节点,每个所述基本节点均为叶节点;所述基本节点包括图像的某片区域以及代表该片区域表观特征的代表性片;所述复合节点包括图像的某片区域并且可以进一步分解为基本节点和/或复合节点;位于所述森林状结构的同一层、且空间位置相连的两个节点间存在一条边,边上具有用于表示这两个节点空间相对位置的关系矩阵。

Patent Agency Ranking