-
公开(公告)号:CN118607525A
公开(公告)日:2024-09-06
申请号:CN202410647889.6
申请日:2024-05-23
Applicant: 中国民用航空飞行学院
IPC: G06F40/295 , G06F40/284 , G06N3/0442 , G06N3/045 , G06N3/047 , G06N3/082 , G06N3/084
Abstract: 本发明公开了一种航行通告文本信息特征实体抽取方法,属于航行通告信息处理技术领域,包括以下步骤:构建航行通告文本信息的本体模型;对空域限制类航行通告数据集进行数据预处理;将预处理后的数据集中不符合AIXM标准格式的数据进行语料标注;构建BiLSTM‑CRF模型并进行训练;采用正则表达式提取航行通告的第一特征实体;采用BiLSTM‑CRF模型提取航行通告的第二特征实体,将第一特征实体和第二特征实体作为航行通告的特征实体。本发明解决了现有航行通告文本信息抽取方法存在提取文本特征知识信息不准确、不能提取上下文文本序列信息、需制定特定特征模板以及通告判读费时费力的问题。
-
公开(公告)号:CN119106680A
公开(公告)日:2024-12-10
申请号:CN202410522367.3
申请日:2024-04-28
Applicant: 中国民用航空飞行学院
IPC: G06F40/295 , G06F40/18 , G06F40/186 , G06F17/16 , G06F17/18 , G06N5/01 , G06N20/00
Abstract: 本发明公开了一种基于本体驱动的航空情报表格信息结构化抽取方法,属于航空数据信息处理技术领域,包括以下步骤:构建航空情报数据的本体框架模型;对航空情报数据进行结构化信息抽取,得到航空情报表格数据;通过正则表达式匹配模板中的正则表达式提取航空情报表格数据中的英文结构化文本数据,得到结构化实体;构建条件随机场模型CRF,对航空情报表格数据中的英文半结构化和非结构化文本数据进行命名实体识别,得到半、非结构化实体;将结构化实体和半、非结构化实体进行汇总,得到航空情报数据特征实体,完成航空情报表格信息结构化抽取。本发明解决了现有人工对航空情报领域数据中的表格信息查找费时、费力、易错以及不够自动化的问题。
-