一种文本识别方法、文本识别装置及可读存储介质

    公开(公告)号:CN112036330A

    公开(公告)日:2020-12-04

    申请号:CN202010912265.4

    申请日:2020-09-02

    Abstract: 本申请提供了一种文本识别方法、文本识别装置及可读存储介质,应用于涉密文件,文本识别方法包括:获取非涉密文本样本和已过保密期的涉密文本样本;构建深度学习网络模型,并使用非涉密文本样本对构建好的深度学习网络模型进行预训练;使用已过保密期的涉密文本样本对预训练完毕的深度学习网络模型进行调优训练,得到训练好的文本识别模型;将待识别的涉密文本输入至文本识别模型中进行文本识别,得到所述涉密文本的文本信息。本发明采用已过保密期限的小样本的涉密文本样本对用于识别文本的深度学习网络模型进行调优训练,从而提高了对涉密文件的文字识别的准确度,并通过文本提取模型进一步实现了文本信息的提取,提高了提取的准确度。

Patent Agency Ranking