-
公开(公告)号:CN119205943A
公开(公告)日:2024-12-27
申请号:CN202411152864.5
申请日:2024-08-21
Applicant: 浙江大学
Inventor: 赵磊 , 马骋 , 林怀忠 , 张占杰 , 李光远 , 孙嘉锴 , 尹浩霖 , 蓝泽铧 , 莫竣程 , 张权威 , 王永康 , 陈嘉芙 , 褚天易 , 饶晨 , 焦涵 , 贾世安 , 张玮婧 , 邢卫
Abstract: 本申请涉及一种基于多分辨率码本的三维动态场景压缩方法、计算机设备和程序产品,三维动态场景压缩方法包括:利用同一动态场景不同时刻不同视角下的输入视图,重建获得基于空间中3D高斯点的三维动态场景,各3D高斯点具有高斯点属性;根据输入视图、以及相同时刻相同视角下三维场景的渲染图像,优化高斯点属性;将高斯点位置和动态场景时间均作为输入,获取高斯点属性变化量,将高斯点属性变化量叠加至高斯点属性,获得不同时刻的三维场景;根据变形场特征平面的分辨率数量对应地提供多个特征码本,特征码本用于与变形场特征平面同步地优化,特征码本的特征码本值用于与相应分辨率下的变形场特征平面中的特征值进行一对多的映射和替换。
-
公开(公告)号:CN118967915A
公开(公告)日:2024-11-15
申请号:CN202411041680.1
申请日:2024-07-31
Applicant: 浙江大学
Inventor: 尹浩霖 , 赵磊 , 林怀忠 , 邢卫 , 张权威 , 张占杰 , 李光远 , 孙嘉锴 , 蓝泽铧 , 莫俊程 , 马骋 , 王永康 , 陈嘉芙 , 褚天易 , 饶晨 , 焦涵 , 贾世安 , 张玮婧
IPC: G06T15/20 , G06V10/774 , G06V10/82 , G06N3/09
Abstract: 本申请涉及一种基于2D先验的3D高斯场景风格迁移方法、计算机设备和计算机程序产品,包括:利用3D场景多视角的原始图像集,构建3D高斯;对3D高斯进行图像渲染,获得与原始图像集的视角相对应的渲染图像集;利用预期的风格图像,对渲染图像集内的渲染图像执行风格迁移,获得与渲染图像内容结构相同的风格化图像;利用风格化图像对应替换原始图像集中相应视角的图像,替换完成后组成监督图像集;比较监督图像集和渲染图像集内相同视角下图像的差异损失优化3D高斯。本申请可利用二维风格迁移方法的先验知识获得风格化图像,继而通过差异损失优化3D高斯,将风格化图像的风格信息转移到3D高斯场景中,实现3D高斯的场景风格迁移。
-
公开(公告)号:CN118505498A
公开(公告)日:2024-08-16
申请号:CN202410680199.0
申请日:2024-05-29
Applicant: 浙江大学
Inventor: 赵磊 , 张权威 , 林怀忠 , 张占杰 , 李光远 , 孙嘉锴 , 尹浩霖 , 蓝泽铧 , 莫俊程 , 马骋 , 王永康 , 陈嘉芙 , 褚天易 , 饶晨 , 焦涵 , 贾世安 , 张玮婧 , 邢卫
IPC: G06T3/04 , G06T5/70 , G06T5/60 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及一种基于预训练扩散模型的二维图像风格迁移方法、计算机设备、可读存储介质和程序产品,方法包括:基于内容图像获得内容潜变量,基于风格图像获得风格潜变量,基于内容潜变量获得初始潜变量;将内容潜变量、风格潜变量和初始潜变量,三者同时输入预训练扩散模型,基于内容查询特征、风格键特征和风格值特征获得加权后的风格值特征,加权后的风格值特征用于在每轮解码过程中预测噪声;在预训练扩散模型的解码过程中,基于内容潜变量获得经过自注意力层内残差块输出的第一结果特征,基于初始潜变量获得经过自注意力层内残差块输出的第二结果特征;利用对比损失,约束和引导解码过程,使初始潜变量完成多轮地去除噪声后生成风格化图像。
-
公开(公告)号:CN119206051A
公开(公告)日:2024-12-27
申请号:CN202411152867.9
申请日:2024-08-21
Applicant: 浙江大学
Inventor: 赵磊 , 马骋 , 林怀忠 , 张占杰 , 李光远 , 孙嘉锴 , 尹浩霖 , 蓝泽铧 , 莫竣程 , 张权威 , 王永康 , 陈嘉芙 , 褚天易 , 饶晨 , 焦涵 , 贾世安 , 张玮婧 , 邢卫
Abstract: 本申请提供一种基于3D高斯溅射的稀疏输入场景重建方法及计算机程序产品,基于3D高斯溅射的稀疏输入场景重建方法包括:将同一场景不同视角的2D图像输入colmap软件,获得3D高斯的初始化点云,初始化点云用于确定场景重建开始时的高斯点数量与属性;获得高斯点A和高斯点B的衡量距离,高斯点A为任意一个高斯点,高斯点B为与高斯点A最邻近的高斯点;若衡量距离大于第一阈值,则在高斯点A和高斯点B之间添加高斯点C;基于2D图像规范3D高斯的场景重建,获得重建的三维场景。本申请补充添加了高斯点C之后,初始化点云得以完善,减少了三维场景重建时对大量输入图片的依赖,在三维场景重建优化的过程中,使重建的三维场景保持较好的丰富度。
-
公开(公告)号:CN118158489A
公开(公告)日:2024-06-07
申请号:CN202410261768.8
申请日:2024-03-07
Applicant: 浙江大学
IPC: H04N21/81 , H04N21/44 , H04N21/466 , H04N5/272
Abstract: 本申请涉及一种基于3D高斯模型实现的高效流式传输自由视点视频生成方法、计算机设备和程序产品,高效流式传输自由视点视频生成方法,包括:获得三维场景前一帧的3D高斯模型,3D高斯模型为3D高斯的集合,对于一个3D高斯,其包括空间上的一个位置点、以及该位置点属性;构建包括感知机的神经网络,位置点以位置哈希编码的方式记录,感知机接收位置哈希编码,并将位置哈希编码映射为3D高斯的属性变化,属性变化包括用来表示3D高斯位移的第一部分、以及用来表示3D高斯旋转的第二部分;在后一帧利用3D高斯位移、以及3D高斯旋转,更新3D高斯,渲染得到参考图像;利用参考图像和样本图像的损失,优化神经网络,利用优化后的神经网络生成后帧图像。
-
公开(公告)号:CN118014822A
公开(公告)日:2024-05-10
申请号:CN202311868166.0
申请日:2023-12-29
Applicant: 浙江大学
IPC: G06T3/04 , G06N3/0455 , G06N3/0464 , G06N3/0895
Abstract: 本申请涉及一种基于对比学习和注意力机制的风格迁移方法、计算机设备、可读存储介质和程序产品,风格迁移方法包括:构建包括编码器、解码器的编码器‑解码器结构,编码器‑解码器结构在训练完成后用于将风格图像的艺术风格迁移至内容图像以生成风格化图像,训练过程包括:将内容图像输入第一编码器获得内容特征,将风格图像输入第一编码器获得局部风格特征,将风格图像输入第二编码器获得全局风格特征;将局部风格特征和全局风格特征耦合后获得局部‑全局风格特征;将局部‑全局风格特征和内容特征耦合后获得风格化特征;将风格化特征输入解码器获得风格化图像,根据风格化图像和风格图像的风格差异损失,训练编码器‑解码器结构直至达成预期。
-
公开(公告)号:CN117830154A
公开(公告)日:2024-04-05
申请号:CN202410022360.5
申请日:2024-01-05
Applicant: 浙江大学
IPC: G06T5/73 , G06N3/0464 , G06N3/0455 , G06N3/045 , G06N3/084
Abstract: 本申请涉及一种基于潜变量先验知识引导的视频去模糊方法、计算机设备、可读存储介质和程序产品,视频去模糊方法包括利用训练完成的变换网络将模糊视频去模糊后输出,变换网络的训练过程包括:获得清晰视频、以及与清晰视频相对应的模糊视频;将清晰视频输入第一编码器获得真实特征,对真实特征添加噪声后输入去噪网络;将模糊视频输入第二编码器获得条件特征,将条件特征输入去噪网络;以条件特征为条件,以真实特征为目标,使去噪网络输出先验特征;将模糊视频输入变换网络,利用先验特征训练变换网络,直至达成预期。本申请扩散模型并不直接用于将模糊视频去模糊后输出清晰视频,而是利用扩散模型训练变换网络,节省了计算资源。
-
公开(公告)号:CN117670741A
公开(公告)日:2024-03-08
申请号:CN202311867399.9
申请日:2023-12-29
Applicant: 浙江大学
Abstract: 本申请涉及一种基于体素的神经辐射场的单掩膜修复方法、计算机设备、可读存储介质和程序产品,其中单掩膜修复方法包括:获得场景在不同视角下的若干输入视图,在体素网格中重建获得场景表示;在若干输入视图中获得其中的第一输入图,结合掩膜标注,获得移除物体并填充修复的第一修复图,掩膜标注的区域为物体位置;将第一输入图和掩膜标注,映射至体素网格,获得体素网格的待修复区域;根据第一输入图的视角,从体素网格渲染获得与第一输入图视角相对应的第一渲染图;根据掩膜、第一修复图和第一渲染图,监督训练待修复区域,获得训练完成的场景表示。本申请使用若输入视图和单张掩膜即可完成3D修复,训练完成的场景表示可输出不同视角的视图。
-
公开(公告)号:CN117274042A
公开(公告)日:2023-12-22
申请号:CN202311317134.1
申请日:2023-10-11
Applicant: 浙江大学
Abstract: 本申请涉及一种三维场景风格迁移方法、系统和计算机设备,用于将风格图像的风格迁移至三维场景并保持三维场景的几何结构,三维场景风格迁移方法包括:基于神经辐射场的三维场景,使用体素网格对风格模式空间和几何空间进行建模,获得所述神经辐射场在几何空间下的几何体,获得所述神经辐射场在风格模式空间下的球坐标、以及在视点方向下的外观;利用噪声图像提取风格图像的风格特征图,结合提示向量修正所述风格特征图,解码修正后的所述风格特征图获得风格模式;将所述球坐标对应至所述风格模式,耦合所述外观的颜色、以及所述风格模式的颜色,获得风格化颜色;将所述风格化颜色迁移至所述几何体,渲染获得视点方向下的三维风格迁移渲染图像。
-
公开(公告)号:CN116523733A
公开(公告)日:2023-08-01
申请号:CN202310086656.9
申请日:2023-01-13
Applicant: 浙江大学
IPC: G06T3/00 , G06N3/0455 , G06N3/096
Abstract: 本申请涉及一种图像跨域迁移方法、计算机设备、可读存储介质和程序产品,方法实施网络模型,模型训练过程包括:获得源域和目标域图像,提取源域图像的第一内容特征和第一风格向量,提取目标域图像的第二内容特征和第二风格向量;组合获得符合源域图像风格的第一风格迁移图像;组合获得符合目标域图像风格的第二风格迁移图像;提取第二风格迁移图像的内容特征、与第一风格向量组合获得第一源域重构图像;提取第一风格迁移图像的风格向量、与第一内容特征组合获得第二源域重构图像;当满足训练预期时,完成图像跨域迁移网络模型的训练,输出第一风格迁移图像和/或第二风格迁移图像。本申请一次训练可实现源域至目标域的转换和目标域至源域的转换。
-
-
-
-
-
-
-
-
-