一种数据提取方法、装置、电子设备和存储介质
摘要:
本申请提供了一种数据提取方法、装置、电子设备和存储介质,包括:依次对接收到待解析文章中的每个自然段进行第一排序;针对标题自然段在待解析文章中的位置、标题内容,确定各标题自然段之间的第一层级关系,并确定标题自然段与内容自然段之间的第二层级关系;根据标点符号将每个内容自然段中拆解为短语,并分别对短语、由短语组成的句子进行第二排序和第三排序;基于第一排序、第二排序、第三排序、第一层级关系、第二层级关系,构建结构化解析内容;根据为待解析文章的文章类别预设的提取格式,从结构化解析内容中提取出目标数据,以在显示终端展示目标数据或导出为目标文件格式。通过上述方法,有助于提高特殊领域文章的内容提取精度。
0/0