-
公开(公告)号:CN111915703A
公开(公告)日:2020-11-10
申请号:CN201910390118.2
申请日:2019-05-10
Applicant: 浙江大学
Abstract: 本公开涉及一种图像生成方法和装置。该方法包括:接收用户输入的第一语义分割图像,所述第一语义分割图像中包括至少一类目标场景物体;确定所述第一语义分割图像对应的第一边缘线条图像,所述第一边缘线条图像中包括毎类目标场景物体的边缘信息;将所述第一语义分割图像和所述第一边缘线条图像输入第一条件生成对抗神经网络模型,生成所述第一语义分割图像对应的具备目标风格的图像,所述第一条件生成对抗神经网络模型是根据具备所述目标风格的多个样本图像训练得到的。本公开可以实现根据用户输入的语义分割图像,快速为用户生成具备目标风格且场景内容丰富完整的图像。
-
公开(公告)号:CN111787354A
公开(公告)日:2020-10-16
申请号:CN201910266764.8
申请日:2019-04-03
Applicant: 浙江大学
IPC: H04N21/234 , H04N21/44 , H04N5/265
Abstract: 本申请公开了一种视频生成方法及其装置,所述方法包括:根据景别条件,确定视频拼接模板;根据所述视频拼接模板,从多个原始视频中确定用于视频拼接的多个视频片段;对所述多个视频片段执行拼接,生成拼接视频。采用本申请,可自动完成视频拼接,降低了人力成本。
-
公开(公告)号:CN111613195A
公开(公告)日:2020-09-01
申请号:CN201910132652.3
申请日:2019-02-22
Applicant: 浙江大学
IPC: G10H1/00
Abstract: 本公开涉及音频拼接方法、装置及存储介质。该方法包括:确定各个待拼接音频的音频片段;对于各个待拼接音频中的第一待拼接音频的第一音频片段和第二待拼接音频的第二音频片段,根据第一音频片段的相邻音频片段和第二音频片段的相邻音频片段中的至少一项,确定第一音频片段与第二音频片段之间的和谐度;根据各个待拼接音频中的每两个待拼接音频的音频片段之间的和谐度,确定每两个待拼接音频之间的匹配的音频片段;根据每两个待拼接音频之间的匹配的音频片段,对各个待拼接音频的音频片段进行拼接。本公开能够自动化地进行音频拼接,并能够提高音频片段之间的拼接自然程度。
-
公开(公告)号:CN115761051A
公开(公告)日:2023-03-07
申请号:CN202211512666.6
申请日:2022-11-30
Applicant: 浙江大学
Abstract: 本发明公开了一种基于流模型的信息几何因果场景图像生成方法,通过损失函数的训练构建了节点对中的第一节点和第二节点数据集分别到最终隐编码集的函数关系,并基于到最终隐编码集的函数关系得到了第一节点指向第二节点的函数关系和第二节点指向第一节点的函数关系,基于上述两个函数关系采用IGCI模型分别得到上述两个指向关系的分数,将分数较低的作为第一节点与第二节点的最终指向关系,即因果关系;利用该方法通过引入最终隐编码集能够较为准确的获得节点集之间的函数关系,基于准确的函数关系能够使得IGCI模型能够准确获得节点间因果关系。
-
公开(公告)号:CN111143615B
公开(公告)日:2022-12-06
申请号:CN201911293473.4
申请日:2019-12-12
Applicant: 浙江大学
IPC: G06F16/75 , G06V10/74 , G06V10/774 , G06V10/764
Abstract: 本发明公开了一种短视频情感类别的识别装置,包括:(1)获取待识别的目标短视频,划分目标短视频为多个镜头片段,提取每个镜头片段的帧画面特征,提取目标短视频的镜头特征和动态特征;(2)调用所述情感效价模型对输入的所述帧画面特征进行计算,输出目标短视频的情感效价值;(3)调用所述情感激励模型对输入的由所述帧画面特征、镜头特征、动态特征组成的组合特征进行计算,输出目标短视频的情感激励值;(4)计算由所述情感效价值与所述情感激励值构建的V‑A情感空间与各情感类别坐标中心的欧式距离,依据所述欧式距离确定该目标短视频的情感类别。该识别装置能够快速准确识别短视频的情感类别。
-
公开(公告)号:CN114119803B
公开(公告)日:2022-05-10
申请号:CN202210097140.X
申请日:2022-01-27
Applicant: 浙江大学
IPC: G06T11/00
Abstract: 本发明公开了一种基于因果图谱的场景图像生成方法,包括:获得风格一致的带有标框标注的真实场景图像数据集,基于标框标注构建因果子图,并基于因果子图的实体表示特征,通过线性变换和祖先采样得到具有因果关系的风格表示特征,基于原始全局掩码和通过实体、因果、像素询征与实体键征匹配得到放缩因子构建实体全局掩码,基于全局掩码和风格表示特征通过图像生成器得到生成场景图像,通过因果损失函数和合页损失函数训练因果子图和图像生成器得到最终全局因果子图和最终图像生成器,将绘制的标框标注布局依次输入最终全局因果子图和最终图像生成器得到具有因果关系的场景图像。利用该方法能够快速、高效地获得具有因果关系的复杂场景图像。
-
公开(公告)号:CN112967365A
公开(公告)日:2021-06-15
申请号:CN202110163213.6
申请日:2021-02-05
Applicant: 浙江大学
Abstract: 本发明公开了一种基于用户感知优化的深度图生成方法,包括以下步骤:输入一张平面或2D图像,利用神经网络算法生成粗略深度图,利用神经网络算法或人工标注出图像中物体的区域并生成分割图,所述物体的区域为分割块;计算图像的特征,结合图像的特征计算注意力分数;通过粗略深度图和注意力分数进行能量函数设计,得出优化深度图;对所述优化深度图进行迭代调整,解决分割块的边界深度差异的矛盾,并输出所得的深度图。本发明无需立体摄像机,够输入一张普通平面图片,生成一张效果更佳的深度图,实现立体的图像显示,降低了立体的图像出图的成本;采用基于用户感知优化的方法,解决了立体图生成方法中产出的深度图模糊、效果不佳的问题。
-
公开(公告)号:CN112597695A
公开(公告)日:2021-04-02
申请号:CN202011410140.8
申请日:2020-12-03
Applicant: 浙江大学
IPC: G06F30/27 , G06K9/62 , G06F111/06
Abstract: 本发明涉及一种基于感知特征聚类的计算机辅助设计方法及系统,属于设计图形处理的计算机技术领域。该方法包括:(1)接收当前设计方案的图像与主题标签,获取当前设计方案的多个感知维度的评价结果;(2)显示图像、感知维度的评价结果及筛选限制条件设置界面;(3)基于对筛选限制条件的设置,从数据库中筛选出与设计方案的主题标签同类的设计方案,作为待分类设计方案群组;(4)基于聚类算法对待分类设计方案群组进行聚类分析,获取经聚类分析之后的所有设计方案簇;(5)按照欧式距离在显示界面上,显示设计方案簇与当前设计方案。该辅助设计方案能有效地辅助设计师对当前设计方案进行优化,可广泛用于平面广告等的设计领域中。
-
公开(公告)号:CN111915702A
公开(公告)日:2020-11-10
申请号:CN201910389984.X
申请日:2019-05-10
Applicant: 浙江大学
Abstract: 本公开涉及一种图像处理方法和装置。该方法包括:确定纹理填充区域的形状;至少根据所述纹理填充区域的形状,在纹理素材库中确定与所述纹理填充区域形状匹配的目标纹理样图,所述纹理素材库中包括与所述纹理填充区域的语义标签相一致的多个纹理样图;根据所述目标纹理样图,在所述纹理填充区域中进行纹理合成。本公开可以通过综合考虑纹理填充区域的形状准确确定目标纹理样图,从而可以有效提高基于目标纹理样图对纹理填充区域进行纹理填充的准确性。
-
公开(公告)号:CN111787354B
公开(公告)日:2022-06-07
申请号:CN201910266764.8
申请日:2019-04-03
Applicant: 浙江大学
IPC: H04N21/234 , H04N21/44 , H04N5/265
Abstract: 本申请公开了一种视频生成方法及其装置,所述方法包括:根据景别条件,确定视频拼接模板;根据所述视频拼接模板,从多个原始视频中确定用于视频拼接的多个视频片段;对所述多个视频片段执行拼接,生成拼接视频。采用本申请,可自动完成视频拼接,降低了人力成本。
-
-
-
-
-
-
-
-
-