-
公开(公告)号:CN116152839A
公开(公告)日:2023-05-23
申请号:CN202310156082.8
申请日:2023-02-20
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V30/18 , G06V10/82 , G06N3/08 , G06N3/04
Abstract: 本发明提供了一种表格识别方法、装置、设备及存储介质,方法包括:获取用户在屏幕上书写时收集的轨迹点序列,并对轨迹点序列进行预处理;从预处理后的轨迹点序列中确定出表格轨迹点以及文本轨迹点;将表格轨迹点渲染成图像,得到纯表格图像,并将文本轨迹点渲染成图像,得到文本图像;对纯表格图像进行表格识别,得到表格识别结果,并对文本图像进行文本识别,得到文本识别结果;将表格识别结果与文本识别结果匹配,得到匹配结果;基于包含表格识别结果、文本识别结果以及匹配结果的识别信息,生成包含文本内容的表格。本发明提供的表格识别方法可还原出用户书写的包含文本内容的表格。