- 专利标题: 机器学习模型训练方法和装置、文本识别方法和装置
-
申请号: CN202210110721.2申请日: 2022-01-29
-
公开(公告)号: CN114139729B公开(公告)日: 2022-05-10
- 发明人: 刘军 , 秦勇
- 申请人: 北京易真学思教育科技有限公司
- 申请人地址: 北京市昌平区未来科学城英才北三街16号院16号楼401室
- 专利权人: 北京易真学思教育科技有限公司
- 当前专利权人: 北京易真学思教育科技有限公司
- 当前专利权人地址: 北京市昌平区未来科学城英才北三街16号院16号楼401室
- 主分类号: G06N20/00
- IPC分类号: G06N20/00 ; G06N3/04 ; G06V30/40
摘要:
本公开提供一种机器学习模型训练方法和装置、文本识别方法和装置。机器学习模型训练方法包括:对样本图像进行预设变换处理,以生成待处理图像;将待处理图像输入第一机器学习模型,以得到n个特征图,其中n个特征图的尺寸互不相同、且均小于待处理图像的尺寸,n为大于2的自然数;将n个特征图中除尺寸最大的特征图之外的其它n‑1个特征图输入第二机器学习模型,以得到识别概率矩阵;根据识别概率矩阵对第一机器学习模型和第二机器学习模型进行训练;在n个特征图中,选择一个特征图作为待处理特征图;将待处理特征图输入增广模型,以得到增广样本;将增广样本输入第一机器学习模型,以便利用增广样本训练第一机器学习模型和第二机器学习模型。
公开/授权文献
- CN114139729A 机器学习模型训练方法和装置、文本识别方法和装置 公开/授权日:2022-03-04