基于神经辐射场和双向反射分布函数的数字地面三维重建方法、装置、设备及存储介质

    公开(公告)号:CN119229033B

    公开(公告)日:2025-04-04

    申请号:CN202411757299.5

    申请日:2024-12-03

    Abstract: 本申请公开了一种基于神经辐射场和双向反射分布函数的数字地面三维重建方法、装置、设备及存储介质,本申请涉及三维重建技术领域,该方法包括:将目标地区对应的卫星采样光线数据输入预设神经辐射场模型获得场景信息;根据场景信息构建基于双向反射分布函数的物理成像模型;基于物理成像模型对预设神经辐射场模型进行优化,获得目标神经辐射场模型;通过目标神经辐射场模型确定目标地区的场景高程信息,生成目标地区对应的地面三维重建模型。本申请基于卫星影像光线数据获取的场景信息构建物理成像模型,再通过物理成像模型优化预设神经辐射场模型,从而基于优化后的目标神经辐射场模型确定高精度的场景高程信息,提升地面三维模型的重建精度。

    基于多视图全景与多标签图割的房屋空间布局估计方法、装置、设备及存储介质

    公开(公告)号:CN119693222B

    公开(公告)日:2025-05-13

    申请号:CN202510208123.2

    申请日:2025-02-25

    Abstract: 本申请公开了一种基于多视图全景与多标签图割的房屋空间布局估计方法、装置、设备及存储介质,本申请涉及三维重建技术领域,该方法包括:对目标房屋的室内多视角全景图进行二维布局预测,获得二维布局视图;基于二维布局视图进行预设光线投射,获得初始平面图;对初始平面图进行预设多标签图割正则化,获得正则化平面图;对正则化平面图进行全景几何转换,获得目标房屋对应的目标布局视图。本申请首先获取房屋室内全景图对应的初始的二维布局视图,然后对其进行光线投射获得初始平面图,再对初始平面图进行正则化,并使用多标签图割获得准确完整的正则化平面图。再将正则化平面图转换获得目标房屋对应真实可靠的具有全景几何关系的目标布局视图。

    基于多视图全景与多标签图割的房屋空间布局估计方法、装置、设备及存储介质

    公开(公告)号:CN119693222A

    公开(公告)日:2025-03-25

    申请号:CN202510208123.2

    申请日:2025-02-25

    Abstract: 本申请公开了一种基于多视图全景与多标签图割的房屋空间布局估计方法、装置、设备及存储介质,本申请涉及三维重建技术领域,该方法包括:对目标房屋的室内多视角全景图进行二维布局预测,获得二维布局视图;基于二维布局视图进行预设光线投射,获得初始平面图;对初始平面图进行预设多标签图割正则化,获得正则化平面图;对正则化平面图进行全景几何转换,获得目标房屋对应的目标布局视图。本申请首先获取房屋室内全景图对应的初始的二维布局视图,然后对其进行光线投射获得初始平面图,再对初始平面图进行正则化,并使用多标签图割获得准确完整的正则化平面图。再将正则化平面图转换获得目标房屋对应真实可靠的具有全景几何关系的目标布局视图。

    基于神经辐射场和双向反射分布函数的数字地面三维重建方法、装置、设备及存储介质

    公开(公告)号:CN119229033A

    公开(公告)日:2024-12-31

    申请号:CN202411757299.5

    申请日:2024-12-03

    Abstract: 本申请公开了一种基于神经辐射场和双向反射分布函数的数字地面三维重建方法、装置、设备及存储介质,本申请涉及三维重建技术领域,该方法包括:将目标地区对应的卫星采样光线数据输入预设神经辐射场模型获得场景信息;根据场景信息构建基于双向反射分布函数的物理成像模型;基于物理成像模型对预设神经辐射场模型进行优化,获得目标神经辐射场模型;通过目标神经辐射场模型确定目标地区的场景高程信息,生成目标地区对应的地面三维重建模型。本申请基于卫星影像光线数据获取的场景信息构建物理成像模型,再通过物理成像模型优化预设神经辐射场模型,从而基于优化后的目标神经辐射场模型确定高精度的场景高程信息,提升地面三维模型的重建精度。

    一种视频裁剪方法及裁剪视频的质量评价方法

    公开(公告)号:CN119342207B

    公开(公告)日:2025-05-09

    申请号:CN202411886091.3

    申请日:2024-12-20

    Abstract: 本发明公开了一种视频裁剪方法及裁剪视频的质量评价方法,属于计算机视觉和视频处理技术领域。首以原视频数据及其需要裁剪视频的宽高比作为输入参数,使用视频自动裁剪模型得到裁剪视频,同时输出中间结果显著图。为了评价裁剪结果的质量,设计了一套基于显著性区域检测和特征分析的裁剪结果质量评价方法,主要包含内容完整性、内容一致性和时序稳定性。最终,通过加权求和方法,综合内容完整性、时序稳定性和内容一致性得分,得到裁剪视频的整体质量评价。本发明提出的视频裁剪方法能够自动确定最佳裁剪位置,并通过定量评价方法综合评估裁剪后视频的质量,从而提供一个全面的解决方案,显著提升视频裁剪的效果和质量。

    一种多模态对话情感识别方法

    公开(公告)号:CN119293740A

    公开(公告)日:2025-01-10

    申请号:CN202411833608.2

    申请日:2024-12-13

    Abstract: 本发明公开了一种多模态对话情感识别方法,涉及多模态情感识别和人机交互技术领域,包括:利用人脸识别模型和姿态识别工具分别得到表情时序特征和姿态时序特征;注意力模块对表情和姿态特征进行自适应加权融合,获得融合的视觉模态特征;构建上下文语境信息的新表达并基于提示的情感建模技术得到情感表示并通过文本编码器提取文本模态特征;使用数据向量化模型提取说话者对应语音的模态特征;提出跳跃连接多头注意力跨模态融合方法,对多模态的模态特征进行跨模态对齐与融合,之后通过情感分类器模块进行情感识别。本发明有效解决了传统多模态情感识别中关键情感线索识别不足及融合不充分的问题,提高了情感识别的准确性和鲁棒性。

    一种基于面部和体态行为感知的渐进性放松训练方法

    公开(公告)号:CN118538367B

    公开(公告)日:2024-11-19

    申请号:CN202411003151.2

    申请日:2024-07-25

    Abstract: 本发明公开了生物行为识别领域的一种基于面部和体态行为感知的渐进性放松训练方法,包括,播放预先设计的用于渐进性放松训练的音频;在音频播放过程中,执行以下训练操作:获取被训练人的图像数据;其中图像数据包括面部图像和躯体图像;基于面部图像,通过Blaze Face算法获取面部关键点信息,面部关键点信息包括双眼关键点信息和嘴巴关键点信息;根据双眼关键点信息计算双眼开合比,根据嘴巴关键点信息计算嘴巴开合比;基于躯体图像,通过Blaze Pose算法获取身体关键点信息,计算头‑肩夹角;根据双眼开合比、嘴巴开合比和头‑肩夹角,确定眼部特征值、嘴巴特征值和体态特征值;根据眼部特征值、嘴巴特征值和体态特征值,控制训练音频的播放。

    一种多模态对话情感识别方法

    公开(公告)号:CN119293740B

    公开(公告)日:2025-03-07

    申请号:CN202411833608.2

    申请日:2024-12-13

    Abstract: 本发明公开了一种多模态对话情感识别方法,涉及多模态情感识别和人机交互技术领域,包括:利用人脸识别模型和姿态识别工具分别得到表情时序特征和姿态时序特征;注意力模块对表情和姿态特征进行自适应加权融合,获得融合的视觉模态特征;构建上下文语境信息的新表达并基于提示的情感建模技术得到情感表示并通过文本编码器提取文本模态特征;使用数据向量化模型提取说话者对应语音的模态特征;提出跳跃连接多头注意力跨模态融合方法,对多模态的模态特征进行跨模态对齐与融合,之后通过情感分类器模块进行情感识别。本发明有效解决了传统多模态情感识别中关键情感线索识别不足及融合不充分的问题,提高了情感识别的准确性和鲁棒性。

Patent Agency Ranking