一种对电子卷宗的标题自动识别的方法及装置

    公开(公告)号:CN110728240A

    公开(公告)日:2020-01-24

    申请号:CN201910972986.1

    申请日:2019-10-14

    Abstract: 本发明提供了一种对电子卷宗的标题自动识别的方法及装置,对所述电子卷宗分类,分为文本格式卷宗和表格格式卷宗;分别对文本格式卷宗和表格格式卷宗进行标题识别,输出标题识别结果。对于表格类卷宗,通过表格区域识别,可以识别表头文本区域,并提取表头文本,按行做标题判断,提升表格格式卷宗的标题识别准确性。本发明的标题判断模型采用深度神经网络的方式进行训练,分别对标题和非标题的文本进行标注训练,使得此模型的适用性更强,匹配的结果更为精确。

Patent Agency Ranking