基于残差卷积和递归神经网络的中文场景文本行识别方法

    公开(公告)号:CN109948714B

    公开(公告)日:2022-11-29

    申请号:CN201910221267.6

    申请日:2019-03-22

    Abstract: 本发明公开了基于残差卷积和递归神经网络的中文场景文本行识别方法,包括以下步骤:收集中文场景文本训练图像、对训练图像尺寸做归一化处理、对训练图像做数据增广处理、设计残差卷积神经网络、残差递归神经网络和CTC模型、对水平文本行和竖直文本行训练以及选择取置信度较高的结果为识别结果;本发明通过将卷积神经网络和递归神经网络结合起来,解决中文场景文本行识别的问题,避免了对文本行进行字符分割以及误分割带来的错误识别,通过在卷积神经网络和递归神经网络中加入了残差连接可加速模型的训练,从而得到实用的中文场景文本识别模型,且具有鲁棒性强,能够识别复杂背景、复杂光照和多种字体的中文文本行。

    基于残差卷积和递归神经网络的中文场景文本行识别方法

    公开(公告)号:CN109948714A

    公开(公告)日:2019-06-28

    申请号:CN201910221267.6

    申请日:2019-03-22

    Abstract: 本发明公开了基于残差卷积和递归神经网络的中文场景文本行识别方法,包括以下步骤:收集中文场景文本训练图像、对训练图像尺寸做归一化处理、对训练图像做数据增广处理、设计残差卷积神经网络、残差递归神经网络和CTC模型、对水平文本行和竖直文本行训练以及选择取置信度较高的结果为识别结果;本发明通过将卷积神经网络和递归神经网络结合起来,解决中文场景文本行识别的问题,避免了对文本行进行字符分割以及误分割带来的错误识别,通过在卷积神经网络和递归神经网络中加入了残差连接可加速模型的训练,从而得到实用的中文场景文本识别模型,且具有鲁棒性强,能够识别复杂背景、复杂光照和多种字体的中文文本行。

    一种基于注意力机制的文本行单字分割方法

    公开(公告)号:CN110399879B

    公开(公告)日:2022-05-13

    申请号:CN201910517862.4

    申请日:2019-06-14

    Abstract: 本发明公开一种基于注意力机制的文本行单字分割方法,包括收集文本行训练图像;对图像的尺寸做归一化;对训练图像做数据增广;创建基于注意力机制的文本行识别网络;通过大量训练数据训练得到识别模型;将待分割文本行图像输入到识别模型中,通过注意力机制的权重概率分布计算单字分割结果;本发明注意力机制中的权重概率分布,在识别文本行内容的同时,能够将文本行中的单字分割出来,并且只需要标注文本内容,而不需要标注单字的位置,节省了大量人力,实现了弱监督的文本行单字分割。

    一种基于KNN和像素比梯度特征的静态手语识别方法

    公开(公告)号:CN104866826A

    公开(公告)日:2015-08-26

    申请号:CN201510254132.1

    申请日:2015-05-17

    CPC classification number: G06K9/00355

    Abstract: 本发明公开一种基于KNN和像素比梯度特征的静态手语识别方法。该方法包括:步骤1:拍摄彩色图像;步骤2:基于图像的颜色特征对图像进行二值化;步骤3:基于图像的形状特征定位手的位置,并分割出来;步骤4:对分割后的图像进行归一化;步骤5:提取图像的像素比和梯度特征作为图像的特征向量;步骤6:计算输入的特征向量与标准手语图像特征库的欧氏距离;步骤7:基于KNN算法确定最佳匹配结果;步骤8:将识别结果输出。本发明结合了图像颜色特征、形状特征和像素比梯度特征,并且利用了KNN算法来进行特征匹配,提高了识别率和对不同环境的适应性,而且算法相对较简单,复杂度低,系统运行速度快,设备成本低廉。

    一种基于Hu矩的手语视频帧序列分类方法

    公开(公告)号:CN104866825A

    公开(公告)日:2015-08-26

    申请号:CN201510254121.3

    申请日:2015-05-17

    CPC classification number: G06K9/00355

    Abstract: 本发明公开一种基于Hu矩的手语视频帧序列分类方法,包括以下步骤:步骤1:获取待识别的手语视频;步骤2:对该手语视频进行帧采样,获得帧序列;步骤3:将彩色图像的帧序列转换为二值图像的帧序列;步骤4:将手部与背景分割;步骤5:提取分割后的手部图像的Hu矩得到手部图像的特征向量;步骤6:计算每一帧与前一帧的特征向量之间的欧式距离,判决,贴数字标签,进行初步分类。步骤7:根据标签进行帧序列进一步分类,去除过渡动作帧,顺序输出分类后的标签序列。本发明计算复杂度较低,且对于手语图像的旋转、缩放和平移具有很好的鲁棒性,可直接应用于手语视频识别系统。

    一种基于KNN和像素比梯度特征的静态手语识别方法

    公开(公告)号:CN104866826B

    公开(公告)日:2019-01-15

    申请号:CN201510254132.1

    申请日:2015-05-17

    Abstract: 本发明公开一种基于KNN和像素比梯度特征的静态手语识别方法。该方法包括:步骤1:拍摄彩色图像;步骤2:基于图像的颜色特征对图像进行二值化;步骤3:基于图像的形状特征定位手的位置,并分割出来;步骤4:对分割后的图像进行归一化;步骤5:提取图像的像素比和梯度特征作为图像的特征向量;步骤6:计算输入的特征向量与标准手语图像特征库的欧氏距离;步骤7:基于KNN算法确定最佳匹配结果;步骤8:将识别结果输出。本发明结合了图像颜色特征、形状特征和像素比梯度特征,并且利用了KNN算法来进行特征匹配,提高了识别率和对不同环境的适应性,而且算法相对较简单,复杂度低,系统运行速度快,设备成本低廉。

    一种基于图像美学的人物图像辅助拍摄方法和系统

    公开(公告)号:CN105100625A

    公开(公告)日:2015-11-25

    申请号:CN201510540925.X

    申请日:2015-08-27

    Abstract: 本发明公开了一种基于图像美学的人物图像辅助拍摄方法,包括以下步骤:(1)采用取景框对模特进行取景,进行预拍摄;对预拍摄图像进行人脸检测和人体区域检测,得到人脸图像与人体区域图像;(2)检测人脸图像中人物头部背景是否有直线穿过,若有则提示用户:(3)判断预拍摄图像是否为全身照;若为全身照,根据主体最佳比重规律提示用户;若不为全身照,判断人体比例是否符合构图要求,若否,提示用户;(4)检测模特的位置及人体区域的大小,根据构图美学中的三分法则提示用户。本发明还公开了基于图像美学的人物图像辅助拍摄系统。本发明简单有效,运行速度快,可使得经过指导后用户拍摄的图像满足构图法则而更具美感,可行性强。

    一种基于注意力机制的文本行单字分割方法

    公开(公告)号:CN110399879A

    公开(公告)日:2019-11-01

    申请号:CN201910517862.4

    申请日:2019-06-14

    Abstract: 本发明公开一种基于注意力机制的文本行单字分割方法,包括收集文本行训练图像;对图像的尺寸做归一化;对训练图像做数据增广;创建基于注意力机制的文本行识别网络;通过大量训练数据训练得到识别模型;将待分割文本行图像输入到识别模型中,通过注意力机制的权重概率分布计算单字分割结果;本发明注意力机制中的权重概率分布,在识别文本行内容的同时,能够将文本行中的单字分割出来,并且只需要标注文本内容,而不需要标注单字的位置,节省了大量人力,实现了弱监督的文本行单字分割。

    一种基于Hu矩的手语视频帧序列分类方法

    公开(公告)号:CN104866825B

    公开(公告)日:2019-01-29

    申请号:CN201510254121.3

    申请日:2015-05-17

    Abstract: 本发明公开一种基于Hu矩的手语视频帧序列分类方法,包括以下步骤:步骤1:获取待识别的手语视频;步骤2:对该手语视频进行帧采样,获得帧序列;步骤3:将彩色图像的帧序列转换为二值图像的帧序列;步骤4:将手部与背景分割;步骤5:提取分割后的手部图像的Hu矩得到手部图像的特征向量;步骤6:计算每一帧与前一帧的特征向量之间的欧式距离,判决,贴数字标签,进行初步分类。步骤7:根据标签进行帧序列进一步分类,去除过渡动作帧,顺序输出分类后的标签序列。本发明计算复杂度较低,且对于手语图像的旋转、缩放和平移具有很好的鲁棒性,可直接应用于手语视频识别系统。

    一种基于图像美学的人物图像辅助拍摄方法和系统

    公开(公告)号:CN105100625B

    公开(公告)日:2018-06-12

    申请号:CN201510540925.X

    申请日:2015-08-27

    Abstract: 本发明公开了一种基于图像美学的人物图像辅助拍摄方法,包括以下步骤:(1)采用取景框对模特进行取景,进行预拍摄;对预拍摄图像进行人脸检测和人体区域检测,得到人脸图像与人体区域图像;(2)检测人脸图像中人物头部背景是否有直线穿过,若有则提示用户:(3)判断预拍摄图像是否为全身照;若为全身照,根据主体最佳比重规律提示用户;若不为全身照,判断人体比例是否符合构图要求,若否,提示用户;(4)检测模特的位置及人体区域的大小,根据构图美学中的三分法则提示用户。本发明还公开了基于图像美学的人物图像辅助拍摄系统。本发明简单有效,运行速度快,可使得经过指导后用户拍摄的图像满足构图法则而更具美感,可行性强。

Patent Agency Ranking