-
公开(公告)号:CN115880694A
公开(公告)日:2023-03-31
申请号:CN202211675304.9
申请日:2022-12-26
Applicant: 中国科学技术大学
IPC: G06V30/18 , G06V30/19 , G06V30/26 , G06V10/82 , G06N3/0442
Abstract: 本申请公开了一种多语种文本识别方法、装置、设备及可读存储介质,获取文本图像,将文本图像输入预先训练的多语种文本识别模型,输出与文本图像对应的文本识别结果,多语种文本识别模型为基于预先构建的词汇表,以训练文本图像作为训练样本,以训练文本图像对应的文本作为训练标签训练得到,而该词汇表中包括256个单字节的Unicode码,且词汇表中的不同单字节的Unicode码的组合足以覆盖所有语种的不同字符单元,所有语种的不同字符单元均由不同单字节的Unicode码的组合来表示,在实现多语种文本识别的基础上,将词汇表的大小固定为256,极大程度上降低了词汇表中的词汇量,使得模型的训练将变得非常简单,提高了多语种文本识别的效率。