基于变周期激活函数的隐式神经表示装置及方法、应用

    公开(公告)号:CN117808053A

    公开(公告)日:2024-04-02

    申请号:CN202410001584.8

    申请日:2024-01-02

    Applicant: 南京大学

    Abstract: 本发明提出了一种基于变周期激活函数的隐式神经表示装置及方法、应用。其装置包括:多层感知机网络,用于隐式地表示目标信号,该网络的输入为空域坐标,输出为目标信号值;变周期激活函数模块,用于自适应地将所述多层感知机网络内每一层的输出激活到不同的频段;频谱偏差初始化模块,用于初始化所述多层感知机网络的初始偏置参数以调节网络所支持的频率集。本发明的变周期激活函数及频谱偏差初始化模块可以灵活地调节多层感知机网络所支持的频率集,实现其对具有复杂频率分布的信号更精确的隐式表示。

    基于辅助缓冲区信息和直接光照的全局光照渲染方法及装置

    公开(公告)号:CN116524101A

    公开(公告)日:2023-08-01

    申请号:CN202310379766.4

    申请日:2023-04-11

    Applicant: 南京大学

    Inventor: 杨珊 过洁 郭延文

    Abstract: 本发明公开了一种基于辅助缓冲区信息和直接光照进行全局光照渲染的方法及装置,本发明首先获取XML格式的场景文件,并将其转换为Blender格式;其次对Blender格式的场景文件进行多视角渲染,得到多图层渲染图像,并通过进行图层划分得到缓冲区信息、直接光照和真实渲染结果图;之后建立间接光照渲染网络模型,将缓冲区信息、直接光照作为输入,以最小化预测结果和真实渲染结果图的差为训练目标进行训练;最后将目标视角的辅助缓冲区信息和直接光照输入训练好的光照预测网络模型,得到间接光照贴图,再上采样后与高分辨率直接光照叠加,得到高分辨率全局光照渲染结果。本发明能够更高效地预测高质量的全局光照。

    一种基于直方图匹配的图像匹配方法

    公开(公告)号:CN111444985B

    公开(公告)日:2023-04-07

    申请号:CN202010336937.1

    申请日:2020-04-26

    Applicant: 南京大学

    Inventor: 罗曼琳 郭延文

    Abstract: 本发明提供了一种基于直方图匹配的图像匹配方法,包括了以下步骤:1、图像分割;2、提取通道;3、生成灰度矩阵;4、计算矩阵秩;5、生成直方图;6、计算匹配度。本发明为图像匹配提供了一种高效,快速、并具有较强抗噪声、抗亮度改变的方法。

    一种多媒体播放设置自动调节方法及系统

    公开(公告)号:CN111027675B

    公开(公告)日:2023-03-07

    申请号:CN201911152466.2

    申请日:2019-11-22

    Applicant: 南京大学

    Abstract: 本发明公开了一种多媒体播放设置自动调节方法及系统,方法包括:当按照预设时间间隔或用户操作录制外界环境音频信息,并发送至服务器端;服务器端从接收到的外界环境音频信息中分别提取左声道和右声道的梅尔倒谱系数和恒定Q色度图两种特征,并将两种特征结合后作为各声道的音频特征;服务器端将音频特征输入训练好的深度神经网络中,得到外界环境音频信息对应的环境预测分类标签,并发送至多媒体端;多媒体端判断接收到的环境预测分类标签是否与当前环境分类一致,若不一致,则从预设的设置表中查找与所述环境分类标签对应的推荐播放设置,并按照查找到的推荐播放设置更新多媒体播放设备。本发明可以自动调节多媒体播放设置,更加智能,且调节方法更精确。

    一种基于深度卷积神经网络的文本矫正方法

    公开(公告)号:CN114612920A

    公开(公告)日:2022-06-10

    申请号:CN202210306080.8

    申请日:2022-03-25

    Applicant: 南京大学

    Inventor: 郭延文 孟祥祥

    Abstract: 本发明公开了一种基于深度卷积神经网络的文本矫正方法,包括以下步骤:步骤1:采集文本的图像数据;步骤2:用经过预处理后的边缘检测神经网络进行训练模型;步骤3:根据步骤2得到的训练好的模型处理原始文本图像,得到边缘图像;步骤4:对边缘图像进行霍夫投票;步骤5:对投票结果进行筛选,以获得合理的4条直线,组成文本轮廓;步骤6:对检测到的四边形轮廓,进行单应性变换,得到最终的矫正文本。原本由于拍摄姿势不正,导致照片中文本发生畸变,比如A4纸张被拍摄成了梯形,经过该文本矫正,可还原为A4纸形状,降低了文本检测的错误率,使算法更加鲁棒。

    一种基于平面区域一致的图像拼接方法

    公开(公告)号:CN111429358A

    公开(公告)日:2020-07-17

    申请号:CN202010386239.2

    申请日:2020-05-09

    Applicant: 南京大学

    Inventor: 李奡程 郭延文

    Abstract: 本发明提供了一种基于平面区域一致的图像拼接方法,包括:使用编码器-解码器架构训练平面区域分割网络;使用该网络提取输入图像的平面区域;使用SIFT算法找到输入图像的特征点并进行匹配;利用平面区域分割结果和特征点,得到在多路图像中一致的平面区域及属于该区域的可靠匹配特征点对;使用上述特征点对计算出重叠区域的匹配点和局部的相似变换关系;采用网格变形架构,求解拼接后的网格坐标;利用纹理映射得到翘曲后的图像;对翘曲后的图像进行线性融合得到最终拼接结果。

    一种使用场景特征约束的梯度域渲染图像重构方法

    公开(公告)号:CN109934902A

    公开(公告)日:2019-06-25

    申请号:CN201910188251.X

    申请日:2019-03-13

    Applicant: 南京大学

    Abstract: 本发明公开了一种使用场景特征约束的梯度域渲染图像重构方法,包括:(1)采用梯度域渲染算法将待重构三维场景图像进行渲染,得到高噪声图像及梯度场;(2)从待重构三维场景图像中提取出场景特征;(3)以场景特征作为约束条件,求解目标优化函数,得到重构图像I*。本发明能够合理利用场景特征,指导重构过程,为梯度域渲染提供一种有效的后处理方法,使重构后图像噪声降到人类视觉可接受程度。

    一种大量图片在三维场景中的视点标定方法

    公开(公告)号:CN105787464B

    公开(公告)日:2019-04-09

    申请号:CN201610158627.9

    申请日:2016-03-18

    Applicant: 南京大学

    Abstract: 本发明公开了一种大量图片在三维场景中的视点标定方法,包括以下步骤:1,数据准备,准备好场景中需要标定的多张图片,以及其对应的网格三维模型;2,图片的自标定,在整个图片集上运行SfM算法,恢复出场景的点云三维模型,以及每张图片关于点云三维模型的相机内外参数;3,校准点云三维模型和网格三维模型,在两个模型上分别标定6个以上对应点后,使用数值优化的方法求解两个模型之间的变换;4,确定图片在网格三维模型下的相机内外参数,利用变换的传递性质,得到图片在网格三维模型下的拍摄参数;5,渲染和评价,将相机参数应用于原模型进行渲染,并比较算法的效果。

    一种数据驱动的室内场景着色方法

    公开(公告)号:CN105809742B

    公开(公告)日:2018-08-21

    申请号:CN201610139954.X

    申请日:2016-03-11

    Applicant: 南京大学

    Abstract: 本发明公开了一种数据驱动的室内场景着色方法,包括建立图像‑模型数据库与纹理数据库;对图像‑模型数据库中每一类家具的3D模型训练模型分类器;提取图像‑模型数据库中家具的颜色主题并建立概率模型;根据建立好的概率模型以及用户输入的颜色主题求解出最优着色方案;使用相应的分类器对输入场景中的每个3D模型进行分割;最后根据得到的着色方案为输入场景中的每个家具赋予相应的材质。

Patent Agency Ranking