-
公开(公告)号:CN114708469B
公开(公告)日:2025-04-04
申请号:CN202210350763.3
申请日:2022-04-02
Applicant: 河北工业大学
IPC: G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N3/049
Abstract: 本发明公开了一种基于多视图分组感知注意力的三维物体识别方法。首先获取不同三维物体模型不同拍摄角度的多张二维视图,利用卷积神经网络对多个视图进行处理提取视图特征向量,根据相似度分数将视图特征向量进行分组,再分别计算每个视图特征向量在其组内的权重系数,再使用加权求和的方式将一个分组内的所有视图特征向量融合为一个组级融合视图特征向量;最后经过循环神经网络挖掘组级融合视图特征向量之间的相关性,通过多感知组注意力将不同贡献的组级关联视图特征向量自适应地融合为一个三维物体描述符用于物体的分类。本发明结合了卷积神经网络、循环神经网络和注意力算法的优势,显著提高了三维物体识别的精确度和效率。
-
公开(公告)号:CN113076918A
公开(公告)日:2021-07-06
申请号:CN202110422579.0
申请日:2021-04-15
Applicant: 河北工业大学
IPC: G06K9/00 , G06K9/46 , G06K9/62 , G06T7/55 , G06T13/40 , G06T17/20 , G06T19/20 , G06N3/04 , G06N3/08
Abstract: 本发明为基于视频的人脸表情克隆方法,该方法包括以下内容:对提供的视频进行人脸检测;构建基于Ghost Bottleneck结构的轻量级卷积神经网络;整个网络对检测到的人脸图像进行预测,生成每帧图像对应的UV位置映射图,并根据UV位置映射图提取密集人脸关键点的三维位置信息;利用Open3D开源三维数据处理库,在对视频首个含人脸的视频帧进行人脸表情克隆时,结合密集人脸关键点的三维位置信息生成初始人脸模型,之后的每一帧,只对该初始人脸模型的顶点坐标信息进行更新,驱动人脸模型产生变形,并对每帧结果进行可视化,显示克隆出的人脸表情。实现了由人脸图像获取人脸关键点三维位置信息的过程,网络轻量高效,准确率高。
-
公开(公告)号:CN112818950A
公开(公告)日:2021-05-18
申请号:CN202110262815.7
申请日:2021-03-11
Applicant: 河北工业大学
Abstract: 本发明公开了一种基于生成对抗网络和时间卷积网络的唇语识别方法。该方法首先通过ResNet角度分类器判断唇部偏转角度,之后利用的GAN二阶段转换器进行唇部矫正,最后送入TCN中进行特征识别分类生成唇语识别结果的高精度唇语识别方法;该方法克服了传统卷积模型无法解决的唇部特征提取受实际环境中光照强度、光照角度、识别角度、说话人身份等不确定性的影响,使唇语识别的准确性显著提高。本方法设计了密集多角度唇部变化原始数据,不仅实现了单个摄像机自身图像的连续,而且最大限度地实现了唇部图像在观测范围内的连续,有效解决现有多角度模型无法处理实际环境中连续变化的唇部图像的问题,从而提高唇语识别精度。
-
公开(公告)号:CN118154811A
公开(公告)日:2024-06-07
申请号:CN202410326253.1
申请日:2024-03-21
Applicant: 河北工业大学
Abstract: 本发明公开了一种基于形状检测的建筑物三维模型简化方法,首先获取原始三维模型,并进行数据清洗和格式统一;将模型各顶点的邻域拟合为各种基本形状,根据拟合质量对各顶点对应的基本形状进行排序;接着,利用Efficent RANSAC算法对模型进行形状检测,获取区域单元,并根据排序对区域单元进行修正;然后,获取区域单元间的邻接关系,根据区域单元间的邻接关系,提取线段集,由线段集生成候选面;最后,对候选面进行筛选,得到有效候选面;对有效候选面及其结构进行多边形化,得到简化后的三维模型。该方法能更好地适用于包含曲面元素的建筑物三维模型提取,同时通过形状检测对模型结构进行区域划分,在区域内进行多边形化,提高了模型形状的保真度。
-
公开(公告)号:CN112861791A
公开(公告)日:2021-05-28
申请号:CN202110263683.X
申请日:2021-03-11
Applicant: 河北工业大学
Abstract: 本发明公开了一种结合图神经网络和多特征融合的唇语识别方法。该方法首先提取并构建人脸变化序列,标注人脸特征点,再矫正唇部偏转角度,通过训练后唇部语义分割网络预处理后,通过单帧特征点关系的图结构和相邻帧特征点关系的图结构来训练唇语识别网络,最终通过训练后唇语识别网络生成唇语识别结果。本发明将识别网络数据集和唇部语义分割网络数据集经CNN提取和特征融合后的CNN唇部特征和唇部区域特征点经GNN提取和融合后的GNN唇部特征经特征融合后输入到BiGRU中识别,解决时间序列特征提取困难和唇部特征提取受外界因素影响的问题,有效提取唇部的静态特征和唇部变化的动态特征,具有唇部变化特征提取能力强、识别结果准确度高等特点。
-
公开(公告)号:CN107092931B
公开(公告)日:2020-07-03
申请号:CN201710269440.0
申请日:2017-04-24
Applicant: 河北工业大学
Abstract: 本发明一种奶牛个体识别的方法,涉及图像数据处理中的图像识别方法,步骤是:奶牛视频数据采集,将奶牛视频数据转化为图片序列并进行归一化,利用小波变换提取奶牛个体的四个不同分量特征,利用改进的KPCA方法进行四个不同分量特征降维,加权融合四个不同分量特征,将图像特征数据划分为训练集和测试集,分别进行SVM训练和SVM测试,最终识别出奶牛个体;该方法克服了现有技术中,奶牛个体的智能识别方法大都仍采用通用的图像处理方法,没有针对奶牛个体特点,尤其没有根据奶牛躯干黑白花纹形状的唯一性来选取出适合的图像处理方法,导致奶牛个体识别准确率低的缺陷。
-
公开(公告)号:CN107256398A
公开(公告)日:2017-10-17
申请号:CN201710443360.2
申请日:2017-06-13
Applicant: 河北工业大学
Abstract: 本发明基于特征融合的奶牛个体识别方法,涉及图像数据处理中的图像识别方法,是应用改进的LBP‑HOG算法进行特征提取和主成分分析方法结合使用进行奶牛个体识别的方法,进一步说是依据不同奶牛个体头部的鼻镜和额部位存在明显差异的特点,使用改进的HOG进行边缘特征提取,得到奶牛头部的轮廓特征,与之后LBP局部纹理特征提取进行特征融合,再与主成分分析方法结合使用进行奶牛个体识别,克服了早先奶牛个体识别技术中旋转鲁棒性差、易受光照影响、噪声大的缺陷。
-
公开(公告)号:CN114708469A
公开(公告)日:2022-07-05
申请号:CN202210350763.3
申请日:2022-04-02
Applicant: 河北工业大学
Abstract: 本发明公开了一种基于多视图分组感知注意力的三维物体识别方法。首先获取不同三维物体模型不同拍摄角度的多张二维视图,利用卷积神经网络对多个视图进行处理提取视图特征向量,根据相似度分数将视图特征向量进行分组,再分别计算每个视图特征向量在其组内的权重系数,再使用加权求和的方式将一个分组内的所有视图特征向量融合为一个组级融合视图特征向量;最后经过循环神经网络挖掘组级融合视图特征向量之间的相关性,通过多感知组注意力将不同贡献的组级关联视图特征向量自适应地融合为一个三维物体描述符用于物体的分类。本发明结合了卷积神经网络、循环神经网络和注意力算法的优势,显著提高了三维物体识别的精确度和效率。
-
公开(公告)号:CN112801043A
公开(公告)日:2021-05-14
申请号:CN202110262999.7
申请日:2021-03-11
Applicant: 河北工业大学
Abstract: 本发明为基于深度学习的实时视频人脸关键点检测方法,该方法采用卷积神经网络进行单帧的关键点检测,在其中应用深度可分离卷积提升模型检测速率、边界热图作为原有网络的一个附加的子任务提升原有网络全局人脸结构的约束,提升了原有网络的检测准确率、用于热图的解决数据不均衡损失函数提升在有限样本下模型对大姿态样本的泛化能力、光流损失函数加强帧间的平滑性。在检测过程中对于出现极端大角度而导致置信度低于关键点置信度阈值的帧,利用3DMM进行拟合得到密集关键点坐标,对取得的密集关键点根据最小化帧间的投影误差进行68点取样,保持与之前帧的一致性。具有实时性、能利用全局帧间信息、对人脸大姿态情况检测准确度高等优点。
-
公开(公告)号:CN107256398B
公开(公告)日:2020-04-07
申请号:CN201710443360.2
申请日:2017-06-13
Applicant: 河北工业大学
Abstract: 本发明基于特征融合的奶牛个体识别方法,涉及图像数据处理中的图像识别方法,是应用改进的LBP‑HOG算法进行特征提取和主成分分析方法结合使用进行奶牛个体识别的方法,进一步说是依据不同奶牛个体头部的鼻镜和额部位存在明显差异的特点,使用改进的HOG进行边缘特征提取,得到奶牛头部的轮廓特征,与之后LBP局部纹理特征提取进行特征融合,再与主成分分析方法结合使用进行奶牛个体识别,克服了早先奶牛个体识别技术中旋转鲁棒性差、易受光照影响、噪声大的缺陷。
-
-
-
-
-
-
-
-
-