-
公开(公告)号:CN119721218A
公开(公告)日:2025-03-28
申请号:CN202411752907.3
申请日:2024-12-02
Applicant: 中国电建集团华东勘测设计研究院有限公司
Abstract: 本发明提供一种基于同类别非结构化文档提取专业领域实体对信息的方法。包括:统计每个待提取专业领域实体对在文档中的表述特征,确定文本和信息的提取规则,将规则总结在模板中;去除文档中的分割线、水印、目录或前言页之前的无效页面、页眉页脚,并根据文本范围提取正文内容,所述正文内容包括文本内容及表格内容;构建过滤式的三层组合提取模型实现实体信息提取,所述三层组合提取模型涉及基于规则的提取、基于表格的提取、基于大模型问答的提取方案及其按序组合,通过准确性核验判定结果准确性,并将准确性反馈至方案层进行策略调优。本发明能够克服现有基于规则抽取信息泛化能力不足,而机器学习和深度学习方法缺乏专业领域的标注数据的问题。
-
公开(公告)号:CN118887569A
公开(公告)日:2024-11-01
申请号:CN202411014109.0
申请日:2024-07-26
Applicant: 中国电建集团华东勘测设计研究院有限公司
Abstract: 本发明提供了一种基于无人机多相机倾斜摄影的建筑立面图像提取方法,包括以下步骤:S1对无人机航拍数据进行图像特征点提取;S2将图像的特征点进行三维重建得到每个特征点的空间地理位置坐标;S3将特征点的像素坐标与空间地理坐标进行匹配;S4基于建筑地籍图将空间上属于同一建筑的特征点进行分类;S5对同类特征点间进行离群值分析并剔除在三维建模计算过程中可能出现的误差点;S6针对不同分类的特征点进行最小外接矩形识别并以此为边界进行航空图像的裁剪从而得到不同建筑编号对应的建筑立面影像。本发明采用全自动的方式从无人机摄影图像中实现了批量提取建筑立面纹理信息的功能,为后续的建筑信息提取、建筑三维建模及其他有关应用提供了全新可行的路径。
-