-
公开(公告)号:CN106844524B
公开(公告)日:2019-08-09
申请号:CN201611246378.5
申请日:2016-12-29
Applicant: 北京工业大学
Abstract: 一种基于深度学习和Radon变换的医学图像检索方法涉及计算机视觉和图像检索领域。在“粗”检索阶段,采用BING目标建议算法检测具有显著对象的区域,通过在深度卷积网络架构中引入部分均值Pooling,可提取出基于区域的显著区分性特征并降低特征维度,再聚合形成一个全局特征表达。在特征向量量化过程中,使用乘积量化算法来解决特征向量间相似性度量计算高复杂度问题。“细”检索阶段,借助Radon变换可将图像在多角度做积分投影,获取图像更多细节信息的特性,将“粗”检索中得到的Top50图像经过Radon变换生成Radon条码,经过相似性度量达到更精确检索。本发明提高医学图像检索的准确率,克服了直接使用卷积神经网络带来的特征区分性不强,特征维度高等医学图像检索问题。
-
公开(公告)号:CN106658169B
公开(公告)日:2019-06-07
申请号:CN201611173080.6
申请日:2016-12-18
Applicant: 北京工业大学
Abstract: 一种基于深度学习多层次分割新闻视频的通用方法属于计算机人工智能和视频处理领域。本发明首先根据频道标识符(logo)及主持人脸的特点,进行针对性的方式处理,提高后续训练及检测效果;然后,考虑到多类新闻视频之间的差异性,本文率先提出预先进行新闻logo识别,将识别后的频道再输入至各自的人脸检测通道中依次识别的方法,进而提高了视频分割的通用性;最后,基于主持环节的共同点,本文提出采用人工特征及时间阈值的交叉检测进行精筛选,进而最终检测到各频道的主持环节,实现分割多类新闻视频的通用方法。本方法大大增强了分割各类新闻视频的普适性,进而更好地代替手动分割视频方法,极大地减少了人力成本,提高视频处理的效率。
-
公开(公告)号:CN106920227A
公开(公告)日:2017-07-04
申请号:CN201611228597.0
申请日:2016-12-27
Applicant: 北京工业大学
CPC classification number: G06T7/0012 , G06T2207/20081 , G06T2207/20084 , G06T2207/30041
Abstract: 基于深度学习与传统方法相结合的视网膜血管分割方法,涉及计算机视觉以及模式识别领域。本发明将两种灰度图像都作为网络的训练样本,针对视网膜图像数据少的问题做了相应的数据扩增包括弹性形变,平滑滤波等等,扩大了该发明的广泛适用性。本发明通过构建FCN‑HNED的视网膜血管分割深度网络,该网络极大程度的实现了自主学习的过程,不仅可以分享整个图像的卷积特征,减少特征冗余,又可以从抽象的特征中恢复出多个像素的所属类别,分别将视网膜血管图像的CLAHE图和高斯匹配滤波图分别输入网络使其得到的血管分割图进行加权平均从而得到更好更完整的视网膜血管分割概率图,该种处理方式极大程度的提高了血管分割的鲁棒性与准确性。
-
公开(公告)号:CN108154176B
公开(公告)日:2021-11-05
申请号:CN201711406248.8
申请日:2017-12-22
Applicant: 北京工业大学
Abstract: 本发明公开一种基于单一深度图像的3D人体姿态估计方法。首先提出改进型特征提取办法,综合利用部位尺寸信息和距离变换信息,来指导深度梯度特征提取,可极大增强所提特征的表达能力;为解决随机森林部位分类时存在的误分类问题,提出误分类处理机制—多级随机森林整合算法来去除部位误分点,获得更为准确的部位识别结果;通过改进PDA,利用位置权重阈值处理办法,使能够利用识别的部位尺寸信息,自适应的再次去除部位中的干扰点,从而获得更为准确的主方向向量;最后利用人体部件配置关系得到姿态估计结果。本发明改善了部位分类模型的准确率,并能有效去除识别部位中的误分类干扰点,提高识别部位的准确性,最终获得更为准确的3D人体姿态估计结果。
-
公开(公告)号:CN108573246A
公开(公告)日:2018-09-25
申请号:CN201810431650.X
申请日:2018-05-08
Applicant: 北京工业大学
Abstract: 本发明公开一种基于深度学习的时序动作识别方法,包含视频特征提取和时间边界回归模型构建。针对边界检测过程中长动作特征表达有效性不够的问题,通过双流网络同时提取帧间信息和帧内信息,得到视频单元的特征序列,并提出结合上下文信息的多尺度短动作段截选方案,有效地提高后续回归准确率,利用特征序列训练时间边界模型,减小模型训练时间,提高计算效率。针对长动作边界回归不准确问题,本发明提出一种改进的时间边界回归模型,包含改进的多任务多层感知器和一种全新的针对长动作的拼接机制,在保证动作类别准确的基础上,有效地提高长动作时间边界回归的准确率,提高预测动作段与实际动作段的重叠度,实现时序动作识别率的提高。
-
公开(公告)号:CN108573246B
公开(公告)日:2022-04-05
申请号:CN201810431650.X
申请日:2018-05-08
Applicant: 北京工业大学
Abstract: 本发明公开一种基于深度学习的时序动作识别方法,包含视频特征提取和时间边界回归模型构建。针对边界检测过程中长动作特征表达有效性不够的问题,通过双流网络同时提取帧间信息和帧内信息,得到视频单元的特征序列,并提出结合上下文信息的多尺度短动作段截选方案,有效地提高后续回归准确率,利用特征序列训练时间边界模型,减小模型训练时间,提高计算效率。针对长动作边界回归不准确问题,本发明提出一种改进的时间边界回归模型,包含改进的多任务多层感知器和一种全新的针对长动作的拼接机制,在保证动作类别准确的基础上,有效地提高长动作时间边界回归的准确率,提高预测动作段与实际动作段的重叠度,实现时序动作识别率的提高。
-
公开(公告)号:CN106920227B
公开(公告)日:2019-06-07
申请号:CN201611228597.0
申请日:2016-12-27
Applicant: 北京工业大学
Abstract: 基于深度学习与传统方法相结合的视网膜血管分割方法,涉及计算机视觉以及模式识别领域。本发明将两种灰度图像都作为网络的训练样本,针对视网膜图像数据少的问题做了相应的数据扩增包括弹性形变,平滑滤波等等,扩大了该发明的广泛适用性。本发明通过构建FCN‑HNED的视网膜血管分割深度网络,该网络极大程度的实现了自主学习的过程,不仅可以分享整个图像的卷积特征,减少特征冗余,又可以从抽象的特征中恢复出多个像素的所属类别,分别将视网膜血管图像的CLAHE图和高斯匹配滤波图分别输入网络使其得到的血管分割图进行加权平均从而得到更好更完整的视网膜血管分割概率图,该种处理方式极大程度的提高了血管分割的鲁棒性与准确性。
-
公开(公告)号:CN106658169A
公开(公告)日:2017-05-10
申请号:CN201611173080.6
申请日:2016-12-18
Applicant: 北京工业大学
CPC classification number: H04N21/44004 , G06N3/0454 , G06N3/08
Abstract: 一种基于深度学习多层次分割新闻视频的通用方法属于计算机人工智能和视频处理领域。本发明首先根据频道标识符(logo)及主持人脸的特点,进行针对性的方式处理,提高后续训练及检测效果;然后,考虑到多类新闻视频之间的差异性,本文率先提出预先进行新闻logo识别,将识别后的频道再输入至各自的人脸检测通道中依次识别的方法,进而提高了视频分割的通用性;最后,基于主持环节的共同点,本文提出采用人工特征及时间阈值的交叉检测进行精筛选,进而最终检测到各频道的主持环节,实现分割多类新闻视频的通用方法。本方法大大增强了分割各类新闻视频的普适性,进而更好地代替手动分割视频方法,极大地减少了人力成本,提高视频处理的效率。
-
公开(公告)号:CN108154176A
公开(公告)日:2018-06-12
申请号:CN201711406248.8
申请日:2017-12-22
Applicant: 北京工业大学
Abstract: 本发明公开一种基于单一深度图像的3D人体姿态估计方法。首先提出改进型特征提取办法,综合利用部位尺寸信息和距离变换信息,来指导深度梯度特征提取,可极大增强所提特征的表达能力;为解决随机森林部位分类时存在的误分类问题,提出误分类处理机制—多级随机森林整合算法来去除部位误分点,获得更为准确的部位识别结果;通过改进PDA,利用位置权重阈值处理办法,使能够利用识别的部位尺寸信息,自适应的再次去除部位中的干扰点,从而获得更为准确的主方向向量;最后利用人体部件配置关系得到姿态估计结果。本发明改善了部位分类模型的准确率,并能有效去除识别部位中的误分类干扰点,提高识别部位的准确性,最终获得更为准确的3D人体姿态估计结果。
-
公开(公告)号:CN106844524A
公开(公告)日:2017-06-13
申请号:CN201611246378.5
申请日:2016-12-29
Applicant: 北京工业大学
CPC classification number: G06F16/583 , G06K9/66 , G06N3/08
Abstract: 一种基于深度学习和Radon变换的医学图像检索方法涉及计算机视觉和图像检索领域。在“粗”检索阶段,采用BING目标建议算法检测具有显著对象的区域,通过在深度卷积网络架构中引入部分均值Pooling,可提取出基于区域的显著区分性特征并降低特征维度,再聚合形成一个全局特征表达。在特征向量量化过程中,使用乘积量化算法来解决特征向量间相似性度量计算高复杂度问题。“细”检索阶段,借助Radon变换可将图像在多角度做积分投影,获取图像更多细节信息的特性,将“粗”检索中得到的Top50图像经过Radon变换生成Radon条码,经过相似性度量达到更精确检索。本发明提高医学图像检索的准确率,克服了直接使用卷积神经网络带来的特征区分性不强,特征维度高等医学图像检索问题。
-
-
-
-
-
-
-
-
-