一种文本识别中识别网络与语言模型的联合优化方法

    公开(公告)号:CN113704477A

    公开(公告)日:2021-11-26

    申请号:CN202111030020.X

    申请日:2021-09-03

    Abstract: 本发明公开了一种文本识别中识别网络与语言模型的联合优化方法,包括:采集文本数据,将文本数据划分为训练集和测试集,并设置文本行标签;构建识别网络,将文本数据输入识别网络,获得第一概率分布;构建语言模型,将概率分布输入语言模型,通过建模语义,获得第二概率分布;将训练集和文本行标签输入由识别网络和语言模型串联组成的网络进行训练,获得目标网络;将测试集和文本行标签输入目标网络,获得识别结果。本发明利用识别网络和语言模型的联合优化,大大提升了识别的精度,并且适用于不同机制的识别网络。该方案在各个公开的数据集上达到了较高的准确率,具有极高的实用性和应用价值。

    一种基于全局和局部注意力机制的文本识别方法

    公开(公告)号:CN113705713B

    公开(公告)日:2023-08-22

    申请号:CN202111029998.4

    申请日:2021-09-03

    Abstract: 本发明公开了一种基于全局和局部注意力机制的文本识别方法,具体包括如下步骤:使用合成数据以及公开的真实文本行作为训练数据,使用真实场景下采集的文本行作为测试数据;对所有训练和测试样本进行数据预处理;采用有监督的方法训练识别模型,每个文本行都有对应的文本信息;采用卷积层和自注意力层等结构设计识别网络;将训练数据和标签输入到识别网络中进行训练;输入测试数据到训练完成的网络中,得到识别结果。本发明利用全局和局部注意力网络实现文本行识别,能够识别各种场景下复杂多样的联机和脱机文本,并在各个公开的数据集上达到了较高的准确率,具有极高的实用性和应用价值。

    一种文本识别中识别网络与语言模型的联合优化方法

    公开(公告)号:CN113704477B

    公开(公告)日:2022-10-18

    申请号:CN202111030020.X

    申请日:2021-09-03

    Abstract: 本发明公开了一种文本识别中识别网络与语言模型的联合优化方法,包括:采集文本数据,将文本数据划分为训练集和测试集,并设置文本行标签;构建识别网络,将文本数据输入识别网络,获得第一概率分布;构建语言模型,将概率分布输入语言模型,通过建模语义,获得第二概率分布;将训练集和文本行标签输入由识别网络和语言模型串联组成的网络进行训练,获得目标网络;将测试集和文本行标签输入目标网络,获得识别结果。本发明利用识别网络和语言模型的联合优化,大大提升了识别的精度,并且适用于不同机制的识别网络。该方案在各个公开的数据集上达到了较高的准确率,具有极高的实用性和应用价值。

    一种基于全局和局部注意力机制的文本识别方法

    公开(公告)号:CN113705713A

    公开(公告)日:2021-11-26

    申请号:CN202111029998.4

    申请日:2021-09-03

    Abstract: 本发明公开了一种基于全局和局部注意力机制的文本识别方法,具体包括如下步骤:使用合成数据以及公开的真实文本行作为训练数据,使用真实场景下采集的文本行作为测试数据;对所有训练和测试样本进行数据预处理;采用有监督的方法训练识别模型,每个文本行都有对应的文本信息;采用卷积层和自注意力层等结构设计识别网络;将训练数据和标签输入到识别网络中进行训练;输入测试数据到训练完成的网络中,得到识别结果。本发明利用全局和局部注意力网络实现文本行识别,能够识别各种场景下复杂多样的联机和脱机文本,并在各个公开的数据集上达到了较高的准确率,具有极高的实用性和应用价值。

    一种根据性别动态调整特征的人脸愉悦度估计方法

    公开(公告)号:CN110555379B

    公开(公告)日:2022-03-25

    申请号:CN201910692940.4

    申请日:2019-07-30

    Abstract: 本发明公开了一种根据性别动态调整特征的人脸愉悦度估计方法,包括以下步骤:S1、通过对人脸图片进行数据预处理得到经过预处理的图片I;S2、将经过预处理的图片I输入到性别识别网络中进行性别识别;S3、根据性别识别结果,将经过预处理的图片I输入到对应的特征调整网络,得到特征图调整矩阵;S4、将经过预处理的图片I输入到愉悦度估计网络中,通过特征图调整矩阵对愉悦度估计网络的特征图进行调整,最终输出愉悦度估计的结果。所述方法结合人脸的性别特征,自动识别人脸图片的性别,通过特征调整网络动态地调整愉悦度估计网络的特征,得到了准确的愉悦度估计结果,具有广阔的应用前景。

    一种基于深度学习的小人头检测方法

    公开(公告)号:CN109190458B

    公开(公告)日:2022-03-25

    申请号:CN201810800214.5

    申请日:2018-07-20

    Abstract: 本发明公开了一种基于深度学习的小人头检测方法,包括下述步骤:(1)采集大量图像形成训练集和测试集;(2)对训练集和测试集进行精准贴边的人头标注;(3)利用R‑FCN框架,构造深度卷积神经网络,然后利用训练集图像并采用批量训练的随机梯度下降法对所构造的深度神经网络进行训练;(4)基于视觉透视变换对测试图像进行切割再部分放大;(5)将切割并放大后的测试图像,输入步骤(3)所构造的深度卷积神经网络,神经网络输出结果通过Softmax激活函数得到每个预测框的概率分布,计算最小损失函数,根据最小损失函数输出检测结果。本发明通过深度学习算法从图片样本中自动学习出人头与其它背景的不同特征,能够智能的对密集的小人头进行检测。

    一种基于视觉令牌高效处理的多模态大语言模型免训练加速方法

    公开(公告)号:CN120046656A

    公开(公告)日:2025-05-27

    申请号:CN202510115032.4

    申请日:2025-01-24

    Abstract: 本发明公开了一种基于视觉令牌高效处理的多模态大语言模型免训练加速方法,包括以下步骤:获取多模态问答数据,并将多模态问答数据划分为验证集和测试集;将验证集输入到目标多模态大语言模型中,并通过搜索方法来进行模型各层的冗余度排序;根据冗余度排序,将测试集输入到目标多模态大语言模型中,获取目标多模态大语言模型每一层的冗余度大小;根据冗余度大小,对目标多模态大语言模型的部分层进行关于视觉令牌处理的加速操作。本发明利用视觉令牌所需算力要少于文本令牌的特点,通过定位大语言模型中的冗余层并对其中关于视觉令牌的自注意力操作和前馈神经网络操作进行优化,实现模型推理效率的大幅提升。

    一种轻量化文字识别模型设计方法、系统、装置及介质

    公开(公告)号:CN114596569B

    公开(公告)日:2024-05-24

    申请号:CN202210128901.3

    申请日:2022-02-11

    Abstract: 本发明公开了一种轻量化文字识别模型设计方法、系统、装置及介质,其中方法包括:选取基准模型:采用基于卷积递归神经网络的文本行识别模型作为基准模型;网络结构搜索:采用ProxylessNAS网络结构搜索算法搜索适用于文字识别任务的主干网络,使用LayeNorm层作为特征序列的归一化层;知识蒸馏:采用基于特征的知识蒸馏方法提升轻量化模型性能,基于SVD分解对蒸馏方法中回归器权重进行赋值,对教师模型提取的特征进行降维;蒸馏辅助网络结构搜索:通过在网络搜索过程中加入蒸馏学习辅助搜索过程。本发明通过将知识蒸馏与网络结构搜索模型进行有机结合,解决现有方法计算量与存储量过大问题,使得文字识别模型能够部署到移动端设备上,可广泛应用于人工智能技术领域。

    一种基于双深度神经网络的图片类别自动标注方法及系统

    公开(公告)号:CN110533074A

    公开(公告)日:2019-12-03

    申请号:CN201910694450.8

    申请日:2019-07-30

    Abstract: 本发明公开了一种基于双深度神经网络的图片类别自动标注方法及系统,所述方法包括:S1、准备已经标注完成的图片及需要进行自动标注的未标注图片,将已经标注完成的图片分为分别用于训练分类网络和判别网络的两部分图片;S2、搭建包含分类网络和判别网络的双深度神经网络模型;S3、使用已经标注完成的图片训练双深度神经网络模型;S4、使用已训练的双深度神经网络模型对未标注图片的类别进行预测;S5、对未标注图片的预测结果进行处理并选择开启下一次迭代或者结束自动标注。本发明基于双深度神经网络模型,通过判别模型对分类模型的输出进一步优化,实现了低成本、高质量的数据标注,具有广阔的应用前景。

    一种根据性别动态调整特征的人脸愉悦度估计方法

    公开(公告)号:CN110555379A

    公开(公告)日:2019-12-10

    申请号:CN201910692940.4

    申请日:2019-07-30

    Abstract: 本发明公开了一种根据性别动态调整特征的人脸愉悦度估计方法,包括以下步骤:S1、通过对人脸图片进行数据预处理得到经过预处理的图片I;S2、将经过预处理的图片I输入到性别识别网络中进行性别识别;S3、根据性别识别结果,将经过预处理的图片I输入到对应的特征调整网络,得到特征图调整矩阵;S4、将经过预处理的图片I输入到愉悦度估计网络中,通过特征图调整矩阵对愉悦度估计网络的特征图进行调整,最终输出愉悦度估计的结果。所述方法结合人脸的性别特征,自动识别人脸图片的性别,通过特征调整网络动态地调整愉悦度估计网络的特征,得到了准确的愉悦度估计结果,具有广阔的应用前景。

Patent Agency Ranking