基于图像分块的超分辨率增强小目标检测方法

    公开(公告)号:CN115082775A

    公开(公告)日:2022-09-20

    申请号:CN202210888803.X

    申请日:2022-07-27

    Inventor: 杨明浩 黄雷

    Abstract: 本发明属于目标检测领域,具体涉及一种基于图像分块的超分辨率增强小目标检测方法、系统、设备,旨在解决解决现有的小目标检测方法检测准确率较低的问题。本方法包括:获取待进行小目标检测的场景图像,作为输入图像;计算输入图像分块时标准块的宽高;得到输入图像在水平方向、垂直方向上分块的步长;对输入图像进行填充,并对填充后的输入图像进行分块,得到输入图像分块后各图像块;采用预训练的超分别率模型对得到的各图像块进行图像增强,增强后,输入训练好的目标检测模型,得到输入图像中各图像块中小目标物体对应的矩形区域,并进行回归、非极大值抑制处理,进而得到检测结果。本发明提高了小目标检测的准确率。

    面向执行器操作空间的RGBD视觉实时重建方法及系统

    公开(公告)号:CN113269859A

    公开(公告)日:2021-08-17

    申请号:CN202110642486.9

    申请日:2021-06-09

    Abstract: 本发明属于视觉信息实时重建领域,具体涉及了一种面向执行器操作空间的RGBD视觉实时重建方法及系统,旨在解决现有技术实时性低、对人工辅助标定依赖性大、对环境变化适应性低的问题。本发明包括:对执行器操作空间环境下获得的RGB图像物体轮廓进行分割;采用基于深度神经网络的投影方法,将在RGB和深度图像中的物体轮廓映射到执行器操作空间,采用距离限制的离群点消除策略减少重建误差;对RGB轮廓进行Delaunay三角形剖分,并根据RGB图像到执行器操作空间的映射关系按照三角形纹理贴图的方式将剖分后的图像的纹理贴到三维物体轮廓上,完成物体信息的重建。本发明不需要计算摄像机内外参,并且重建速度快、实时性强,无需人工辅助标定,对环境变化适应性强。

    基于2D激光与深度图像融合的扫描定位方法、系统及设备

    公开(公告)号:CN113269803A

    公开(公告)日:2021-08-17

    申请号:CN202110644112.0

    申请日:2021-06-09

    Inventor: 杨明浩 张家清

    Abstract: 本发明属于地图创建与扫描定位领域,具体涉及了一种基于2D激光与深度图像融合的扫描定位方法、系统及设备,旨在解决现有扫描定位结果无法实时显示,效率、准确性及精度低的问题。本发明包括:创建网格地图,使用2D激光雷达数据在网格地图中逐帧创建2D地图轮廓;把RGB‑D相机图像数据压缩为一维特征向量,并与2D激光雷达数据特征向量融合为表示当前角度和位置的图像特征的一维向量;将地图多次采样构建为金字塔结构,把当前视图的RGB‑D相机和2D激光雷达获得的信息转化为一维特征向量,采用由粗到精的策略将转化后的一维向量与地图中保存的一维特征向量对比,确定准确位置。本发明扫描定位效率高,准确性和精度高,并可实时显示定位结果。

    在核磁图像序列中自动提取舌位轮廓的方法和系统

    公开(公告)号:CN105551040B

    公开(公告)日:2018-03-09

    申请号:CN201510929281.3

    申请日:2015-12-15

    Abstract: 本发明提供了一种在核磁图像序列中自动提取舌位轮廓的方法和系统。其中该方法包括:对于核磁图像序列,在舌位运动区域内,利用多方向Sobel算子得到舌位轮廓初始边缘点;建立舌位边缘点映射矩阵,并结合前一帧舌位轮廓位置,对该映射矩阵进行调整;在调整后的映射矩阵中寻找最优边缘点序列,借助过控制点的二次样条曲线拟合技术得到舌位轮廓。本发明能够自动从核磁图像序列中较准确地提取出舌位轮廓,其优势在于当舌位与其他发音器官发生接触时,该方法也具有较好的鲁棒性,且整个过程自动完成,无需人工交互。

    在核磁图像序列中自动提取舌位轮廓的方法和系统

    公开(公告)号:CN105551040A

    公开(公告)日:2016-05-04

    申请号:CN201510929281.3

    申请日:2015-12-15

    Abstract: 本发明提供了一种在核磁图像序列中自动提取舌位轮廓的方法和系统。其中该方法包括:对于核磁图像序列,在舌位运动区域内,利用多方向Sobel算子得到舌位轮廓初始边缘点;建立舌位边缘点映射矩阵,并结合前一帧舌位轮廓位置,对该映射矩阵进行调整;在调整后的映射矩阵中寻找最优边缘点序列,借助过控制点的二次样条曲线拟合技术得到舌位轮廓。本发明能够自动从核磁图像序列中较准确地提取出舌位轮廓,其优势在于当舌位与其他发音器官发生接触时,该方法也具有较好的鲁棒性,且整个过程自动完成,无需人工交互。

    一种基于递归神经网络的离散情感识别方法

    公开(公告)号:CN105469065A

    公开(公告)日:2016-04-06

    申请号:CN201510889388.X

    申请日:2015-12-07

    CPC classification number: G06K9/00315 G06K9/6256 G06K9/6269 G06K9/6288

    Abstract: 本发明提出的一种基于递归神经网络的离散情感识别方法,步骤为:1、对视频中的图像信号进行人脸检测及跟踪,得到人脸区域后,提取人脸关键点作为人脸的形变特征;将人脸区域裁剪并归一化到统一大小,提取人脸的外观特征;2、对视频中的音频信号进行加窗处理,分割出音频序列单元并提取音频特征;3、利用具有长短时记忆模型的递归神经网络分别对上述得到的三项特征进行时序编码,获得固定长度的情感表征向量;并将其相串联,得到最终情感表述特征;4、基于的支持向量机分类器,利用3中得到的最终情感表述特征进行情感类别预测。该方法能够充分利用情感表达过程中的动态信息,从而实现视频中参与者情感的精确识别。

    一种融合长跨度情感历史的语音情感识别方法

    公开(公告)号:CN103531207A

    公开(公告)日:2014-01-22

    申请号:CN201310481318.1

    申请日:2013-10-15

    Abstract: 本发明公开了一种融合长跨度情感历史的语音情感识别方法。该方法包括以下步骤:利用时域和变换域上的不同参数进行端点检测,剔除原始语音序列中的非语音数据,获得待识别语音段数据;将待识别语音段数据切分为独立的语音段数据单元;利用第一支持向量机对语音段数据单元分别进行情感状态初步分类;对情感状态初步分类结果进行加窗,并利用第二支持向量机进行融合,得到融合长跨度情感历史的情感识别结果。本发明在保证对语音信号的局部单元进行高精度分类的同时,又充分利用信号序列的长跨度内的上下文信息,以达到对序列中的每一单元达到最优的分类结果。本发明能够用于语音信号的情感识别,具有实时性好、并能够大幅度提高识别精度等优点。

    在医学影像中获取发音器官轮廓的方法

    公开(公告)号:CN102831606A

    公开(公告)日:2012-12-19

    申请号:CN201210272187.1

    申请日:2012-08-01

    Abstract: 本发明提供了一种在医学影像中获取发音器官轮廓的方法。该方法包括:对于医学图像,利用唇部与背景的自动分割阈值,对医学影像中嘴唇与背景区域进行二值化,得到唇部轮廓;在唇部轮廓包含的面部范围内,提取上牙齿轮廓、下牙齿轮廓、上颌轮廓和下颌轮廓;针对上颌轮廓和下颌轮廓之间图像区域,获取舌位轮廓的可靠边缘点;以及由舌位轮廓的可靠边缘点拟合出舌位边缘轮廓。本发明能自动从影像背景中分割出发音人头部、器官区域,整个过程自动完成,无需人工交互。

    一种三维人脸重建方法
    39.
    发明授权

    公开(公告)号:CN101751689B

    公开(公告)日:2012-02-22

    申请号:CN200910093767.2

    申请日:2009-09-28

    Abstract: 本发明为一种三维人脸重建方法,从单张正面人脸图像自动重建三维人脸模型,提出两种方案,第一种:离线生成人脸形变模型;利用Adaboost自动检测输入图像中的人脸位置;利用主动外观模型在输入图像中自动定位人脸上的关键点;基于人脸形变模型的形状分量和图像上的人脸关键点重建三维人脸的几何形状;以形状无关纹理作为目标图像,利用人脸形变模型的纹理分量进行人脸纹理拟合,得到完整的人脸纹理;纹理映射后得到重建结果。第二种与第一种不同之处在于:在重建三维人脸的几何形状之后,不进行人脸纹理拟合,而是直接以输入图像作为纹理图像,得到重建结果。本发明的方案一适合应用在影视制作、三维人脸识别等领域,方案二重建速度快。

    甘蔗生长高度的测量方法及系统

    公开(公告)号:CN119245527A

    公开(公告)日:2025-01-03

    申请号:CN202411775189.1

    申请日:2024-12-05

    Inventor: 杨明浩 蒋正中

    Abstract: 本发明提供了一种甘蔗生长高度的测量方法及系统,可以应用于农业测量领域与人工智能领域。该测量方法包括:将利用单个深度相机拍摄目标甘蔗所得到的多个图像输入目标检测模型,得到目标甘蔗的甘蔗底部图像和甘蔗顶梢图像,目标检测模型是基于针对甘蔗特征所改进的深度学习模型,深度相机搭载在云台上,云台用于控制深度相机的拍摄角度;根据甘蔗顶梢图像和甘蔗底部图像,从深度相机中获取深度相机到甘蔗顶梢的第一距离以及深度相机到甘蔗底部的第二距离;获取深度相机的目标角度,目标角度是根据拍摄甘蔗顶梢图像的第一拍摄角度和拍摄甘蔗底部图像的第二拍摄角度确定的;根据第一距离、第二距离和目标角度,得到目标甘蔗的目标生长高度。

Patent Agency Ranking