-
公开(公告)号:CN119762678A
公开(公告)日:2025-04-04
申请号:CN202411850401.6
申请日:2024-12-16
Applicant: 山东大学
IPC: G06T17/00 , G06N3/0499
Abstract: 本公开提供了一种基于隐式神经表征的信号重建方法及系统,涉及信号重建技术领域,包括:为待处理的多媒体数据建立一系列具有不同距离度量的基本度量网格,通过多种距离度量构建不同的特征空间,并在这些空间中建立特征网格,存储不同阶导数相关的特征;通过待重建信号的坐标索引相关的特征网格,从而得到信号在不同阶的特征;利用高阶项外推解码器,在每一层中融合不同阶的特征,逐步细化重建结果,并通过输出层将重建的特征转换为目标信号值;本发明使用多个基本度量网格拟合目标信号在特征空间中的任意非线性,利用哈希映射分别存储不同度量网格提高模型紧凑性,提高了隐式神经表征方法的准确性、适应性和稳定性。
-
公开(公告)号:CN120031936A
公开(公告)日:2025-05-23
申请号:CN202510100856.4
申请日:2025-01-22
Applicant: 山东大学
IPC: G06T7/55 , G06T5/60 , G06T5/70 , G06T3/4038 , G06T3/02 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/084 , G06N3/09
Abstract: 本发明提出基于间接扩散模型的深度估计方法及系统,涉及深度估计技术领域。包括将待处理图像输入至U‑NET的编码器中,得到高级特征和低级特征;将高级特征拼接后输入至去噪扩散网络中进行特征恢复,得到恢复特征;将恢复特征输入至可逆变换增强解码器的高层解码器中,进行逐层特征提取,得到高层解码特征;将低级特征和高层解码特征拼接后得到拼接输入特征,输入至可逆变换增强解码器的低层解码器中,得到拼接输出特征;基于拼接输出特征,得到预测的深度图。本发明通过去噪扩散网络中进行特征恢复,完成对高级特征的优化,确保输入解码器中特征的准确性,且通过仿射耦合层构建可逆变换增强解码器,将特征优化为假设的特征真值。
-
公开(公告)号:CN119068557B
公开(公告)日:2025-03-14
申请号:CN202411556188.8
申请日:2024-11-04
Applicant: 山东大学 , 山东省工业技术研究院
IPC: G06V40/20 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明涉及深度学习技术领域,尤其是提供了基于多层带权残差自注意力和LSTM的手语手势序列识别方法。该方法包括构建并获取优化后的手语手势序列识别模型;通过访问开发的前端网页,以及通过摄像设备采集手语和手势序列视频,并将其传回至服务器进行处理,获得处理后的手语和手势序列信息;将处理后的手语和手势序列信息输入优化后的手语手势序列识别模型,得到识别结果;并将识别结果传回至前端网页,以文本和语音的形式呈现,该方法通过改进模型算法,使用多层带权残差自注意力网络和轻量LSTM实现连续手语和双手手势序列识别,提高了手语手势识别的普及性,降低了操作的复杂性,并请扩大了听障患者的适用范围。
-
公开(公告)号:CN119579661A
公开(公告)日:2025-03-07
申请号:CN202411522321.8
申请日:2024-10-29
Applicant: 山东大学
Abstract: 本发明提供了一种点云配准方法、渐进成形镜像面补偿方法及系统,获取待配准的两个点云数据;利用PCA法提取出点云的边缘点后,使用边缘点拟合出基准点云和被配准点云的边缘平面;计算两个边缘平面的法向量之间的旋转矩阵,使得被配准点云的边缘平面的法向量对齐到基准点云的边缘平面的法向量;对齐基准点云和被配准点云的凸包方向;进行精细对齐,使两个点云边缘点之间的欧几里得距离最小化。基于镜像原理进行机器人加工误差补偿,通过扫描仪测量出实际加工曲面的点云,将目标曲面视为镜像面,将实际加工面通过目标曲面镜像到另一侧,即可获得补偿面,提高了成形零件的几何精度。
-
公开(公告)号:CN119068557A
公开(公告)日:2024-12-03
申请号:CN202411556188.8
申请日:2024-11-04
Applicant: 山东大学 , 山东省工业技术研究院
IPC: G06V40/20 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明涉及深度学习技术领域,尤其是提供了基于多层带权残差自注意力和LSTM的手语手势序列识别方法。该方法包括构建并获取优化后的手语手势序列识别模型;通过访问开发的前端网页,以及通过摄像设备采集手语和手势序列视频,并将其传回至服务器进行处理,获得处理后的手语和手势序列信息;将处理后的手语和手势序列信息输入优化后的手语手势序列识别模型,得到识别结果;并将识别结果传回至前端网页,以文本和语音的形式呈现,该方法通过改进模型算法,使用多层带权残差自注意力网络和轻量LSTM实现连续手语和双手手势序列识别,提高了手语手势识别的普及性,降低了操作的复杂性,并请扩大了听障患者的适用范围。
-
公开(公告)号:CN116188259B
公开(公告)日:2024-07-23
申请号:CN202211572022.6
申请日:2022-12-08
Applicant: 中国科学院水生生物研究所 , 山东大学
IPC: G06F30/27
Abstract: 本发明涉及一种基于压缩感知和生成对抗的鱼类图像生成方法,属于计算机视觉与深度学习技术领域,步骤包括:步骤1,基于高分辨率鱼类数据集训练压缩感知神经网络,获得低维观测信号和重构映射;步骤2,基于上述低维观测信号训练生成对抗网络,获得低维观测信号的生成器;步骤3,利用上述生成器,向生成器中输入噪声产生新的低维观测信号,利用上述重构映射将生成的低维观测信号重构为生成的高分辨率鱼类图片。本发明中生成器的输入为服从高斯分布的随机噪声,不需要从高维数据集中获得,因此本发明中获得的生成器可以将任意服从高斯分布的噪声生成为高清鱼类图像。且本发明可以生成与原始数据集服从同一分布而更加多样的不同高清鱼类图像。
-
公开(公告)号:CN118195888A
公开(公告)日:2024-06-14
申请号:CN202410402466.8
申请日:2024-04-03
Applicant: 山东大学
IPC: G06T3/04 , G06T11/00 , G06V10/40 , G06N3/0455 , G06N3/048 , G06N3/0464 , G06N3/08 , G06V10/44
Abstract: 本发明公开了基于特征随机采样的图像风格迁移方法及系统,所述方法包括:获取内容图像和风格图像;将内容图像和风格图像输入到训练后的图像风格迁移模型中,得到风格迁移后的图像;其中,训练后的图像风格迁移模型,用于:对输入的内容图像和风格图像分别进行特征提取,得到内容特征和风格特征;对内容特征和风格特征均进行随机采样,得到随机采样后的内容特征和风格特征;对随机采样后的内容特征和风格特征进行统计量的迁移,得到迁移后的内容特征;将迁移后的内容特征输入解码器,生成风格迁移图像。
-
公开(公告)号:CN117745785A
公开(公告)日:2024-03-22
申请号:CN202311770181.1
申请日:2023-12-20
Applicant: 山东大学
IPC: G06T7/50 , G06T7/13 , G06N3/0455 , G06N3/048
Abstract: 本发明提出了基于深度学习的单目深度估计方法及系统,涉及单目深度估计技术领域。包括获取原始图像,提取图像空间特征;利用第一组基向量张成深度几何表示子空间,将图像空间特征投影到深度几何表示子空间中并用第一组基向量表示,与原始图像深度中心值进行融合,得到深度几何表示特征;利用第二组基向量张成边缘感知表征子空间,将深度几何表示特征投影到边缘感知表征子空间并用第二组基向量表示,得到边缘感知表征子空间特征;将边缘感知表征子空间特征融合回深度几何表示特征,实现单目深度估计。本发明将与深度无关的外观信息从图像空间特征中分离出来,帮助实现从图像特征到深度特征的转换,同时利用局部边缘信息增强了深度特征。
-
公开(公告)号:CN119922332A
公开(公告)日:2025-05-02
申请号:CN202510092050.5
申请日:2025-01-21
Applicant: 山东大学
IPC: H04N19/52 , H04N19/587 , H04N19/53 , H04N19/34 , H04N19/88 , G06T9/00 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明提出了一种基于隐式神经视频表示的视频编码方法及系统,属于视频编码技术领域;方法包括:获取当前视频帧上一时刻的局部和全部隐藏层状态特征;基于残差网格提取的混合残差特征,对上一时刻的全局隐藏层状态特征进行补偿,利用耦合映射RNN网络对补偿后的全局隐藏层状态特征进行处理,获取局部内容特征和背景特征;基于第一映射RNN模块中,获取全局信息特征;将全局特征和上一时刻全局隐藏层状态特征输入到第二映射RNN模块中,获取当前时刻的全局隐藏层状态特征并输入到上采样模块中进行视频帧的重建,得到重建后的视频。有效增强了视频帧间时域信息处理能力,并实现了视频帧间的全局和局部运动的分解,提高了视频帧重建质量。
-
公开(公告)号:CN118537227A
公开(公告)日:2024-08-23
申请号:CN202410442888.8
申请日:2024-04-12
Applicant: 山东大学
IPC: G06T3/4076 , G06T3/4046 , G06N3/0464
Abstract: 本发明公开了迭代交互参考式立体图像超分辨率重建方法及系统,方法包括:获取待重建的两幅图像;将待重建的两幅图像,输入训练后的图像重建模型中,得到高分辨率左视图立体图像和高分辨率右视图立体图像;其中,训练后的图像重建模型,采用若干个信息感知模块对待重建的两幅图像提取出视图内的特征;所述模型,还基于像素匹配模块和图块匹配模块来模拟视图间的依赖关系;所述像素匹配模块,形成内部交叉和内部迭代;所述图块匹配模块,生成匹配字典;将匹配字典投射到高分辨率空间,通过利用两个视图的特征图作为相互参照,进行高分辨率视图信息交互;所述模型,还通过监督侧输出调制器,对视图的特征图进行重新加权,实现图块级匹配。
-
-
-
-
-
-
-
-
-