一种基于计数模块的手写数学公式多尺度识别方法

    公开(公告)号:CN118968528A

    公开(公告)日:2024-11-15

    申请号:CN202411455744.2

    申请日:2024-10-18

    Abstract: 一种基于计数模块的手写数学公式多尺度识别方法,涉及图像识别技术领域,解决现有技术针对手写体数字识别模型存在的识别准确性低的问题,本方法通过构建手写数学公式图像数据集,将手写数学公式图像输入构建基于计数模块的手写数学公式识别模型,采用ResNet对处理后的图像数据集中手写数学公式图像提取特征图,采用符号计数模块对特征图添加全局信息,通过LSTM输出预测的LaTeX序列。本方法将手写数学公式识别建模为一个图像至序列的任务。利用编码器被用于提取输入图像的特征,而解码器则逐步预测对应LaTeX序列。本方法有效地将手写数学公式识别问题转化为一个端到端的序列生成问题,简化了问题的复杂性。

    基于深度学习的计算题图像识别及自动判别方法

    公开(公告)号:CN119418348A

    公开(公告)日:2025-02-11

    申请号:CN202411458826.2

    申请日:2024-10-18

    Abstract: 基于深度学习的计算题图像识别及自动判别方法,涉及OCR中文字识别和深度学习技术领域,解决现有技术中针对小学生手写数学计算题的图像字符和二维结构识别困难,导致对计算题识别准确率较低的问题,本方法首先对含算式图像进行数据处理,将处理后的图像数据划分为训练集和测试集;构建具有计数模块的编码器和解码器结构的深度学习模型并利用训练集训练模型,然后调用训练好的学习模型对计算题算式进行识别,完成习题的自动批改。最终能够实现一种功能强大的小学生数学作业自动识别与批改。本方法针对注意力不准的问题,提出通过添加计数模块,来使注意力更加准确,同时,计数结果可以表示符号的数量,作为额外的全局信息提高识别的准确性。

    一种基于计数模块的手写数学公式多尺度识别方法

    公开(公告)号:CN118968528B

    公开(公告)日:2025-01-28

    申请号:CN202411455744.2

    申请日:2024-10-18

    Abstract: 一种基于计数模块的手写数学公式多尺度识别方法,涉及图像识别技术领域,解决现有技术针对手写体数字识别模型存在的识别准确性低的问题,本方法通过构建手写数学公式图像数据集,将手写数学公式图像输入构建基于计数模块的手写数学公式识别模型,采用ResNet对处理后的图像数据集中手写数学公式图像提取特征图,采用符号计数模块对特征图添加全局信息,通过LSTM输出预测的LaTeX序列。本方法将手写数学公式识别建模为一个图像至序列的任务。利用编码器被用于提取输入图像的特征,而解码器则逐步预测对应LaTeX序列。本方法有效地将手写数学公式识别问题转化为一个端到端的序列生成问题,简化了问题的复杂性。

Patent Agency Ranking