-
公开(公告)号:CN117789233A
公开(公告)日:2024-03-29
申请号:CN202410132267.X
申请日:2024-01-30
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本申请实施例公开了一种文本识别方法、装置、设备及存储介质,对图片进行编码,得到编码特征后,对编码特征进行解码时,按文本片段进行解码,且每个文本片段的解码过程引入了该文本片段在图片中的位置,也就是说,本申请在对编码特征解码过程中不仅对文本进行解码,还对文本片段在图片中的位置进行解码,且每个文本片段是基于先解码得到的该文本片段在图片中的位置解码得到的,因此,文本片段的解码过程参考了更多的上下文信息,从而提高文本识别准确率。
-
公开(公告)号:CN117909459A
公开(公告)日:2024-04-19
申请号:CN202311693737.1
申请日:2023-12-06
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F18/213 , G06F18/22 , G06N3/045 , G06N3/096
Abstract: 本申请公开了一种问题回答方法及相关装置、设备和存储介质,其中,问题回答方法包括:将待回答问题的问题特征输入至在问题回答任务上经参数微调的大语言模型;其中,参数微调时冻结大语言模型的网络参数;获取大语言模型中目标网络层的输出特征,并获取大语言模型在参数微调时为目标网络层确定的特征迁移参数;基于目标网络层的输出特征和特征迁移参数,得到目标网络层的输出特征迁移至问题回答任务之后的迁移特征;其中,迁移特征用于供大语言模型中目标网络层之后的网络层继续处理,直至大语言模型中输出层;获取由输出层所输出的问题回答。上述方案,能够提升大语言模型的问题回答精度。
-
公开(公告)号:CN118334679A
公开(公告)日:2024-07-12
申请号:CN202410515060.0
申请日:2024-04-26
Applicant: 科大讯飞股份有限公司
IPC: G06V30/19 , G06V30/16 , G06V10/82 , G06T3/40 , G06N3/0455
Abstract: 本申请实施例公开了一种文本识别方法、装置、设备、存储介质和计算机程序产品,对待识别图像进行缩放处理,得到第一图像和第二图像;第一图像小于第二图像;对第一图像进行编码,得到第一编码特征;对第二图像分块进行编码,得到各个图像块的编码特征;将各个图像块的编码模特征拼接,得到第二编码特征;将第一编码特征和第二编码特征融合,得到融合特征;对融合特征进行解码,得到文本识别结果。本申请提高了文本识别准确率。
-
-