一种使用语义标注的中文地址RoBERTa-BiLSTM-CRF耦合解析方法

    公开(公告)号:CN112560478B

    公开(公告)日:2024-03-12

    申请号:CN202011483732.2

    申请日:2020-12-16

    Applicant: 武汉大学

    Abstract: 本发明提出了一种使用语义标注的中文地址RoBERTa‑BiLSTM‑CRF耦合解析方法。本发明将多条地址文本依次进行分词,对分词后的字符进行人工语义标注,得到分词后去重的字符集及语义标注集。通过RoBERTa模型字典和语义标注集将地址文本及其对应的语义标注转化为地址信息矩阵。将地址信息矩阵输入到RoBERTa神经网络,得到地址的语义信息矩阵。将地址的语义信息矩阵输入到BiLSTM对上下文语义信息进行删减,得到标签的得分序列。将标签的得分序列作为输入到CRF模型筛选最优语义标注序列。本发明采用语义标注,能够识别地址中地址元素的层级及空间关系;能够从非标准地址提取标准地址,解决未登录词问题、剔除非标准和错误地址元素,根据地址中的空间关系实现空间推理。

    一种基于中文分词器的地址匹配方法及系统

    公开(公告)号:CN112612863B

    公开(公告)日:2023-03-31

    申请号:CN202011572828.6

    申请日:2020-12-23

    Applicant: 武汉大学

    Abstract: 本发明提供一种基于中文分词器的地址匹配方法及系统,进行地址数据集准备,包括多源地址数据的清洗和去重;地址匹配索引库创建,包括依据地址结构特点构建带有地理属性的地址分级数据库并生成索引文件;地址匹配引擎构建,包括对地址分级数据库中的地址元素进行编码,构建基于三叉拼音搜索树的中文地址分词器,增加匹配集的二次比对计算,形成一种基于分词器的匹配引擎;在地址匹配引擎的基础上实现正向或逆向的地址匹配。本发明对多源地址进行了集成,提供了一套地址数据库的构建和编码方案,面向非标准地址的查询,能够对含有拼音和同义词的地址进行解析且提供匹配地址集。本发明提供的地址匹配接口能有效的服务于市政、物流、导航等应用。

    一种主客观结合的变压器健康状态综合评价方法

    公开(公告)号:CN114418329A

    公开(公告)日:2022-04-29

    申请号:CN202111612813.2

    申请日:2021-12-27

    Applicant: 武汉大学

    Abstract: 本发明涉及变压器健康状态评价技术,具体涉及一种主客观结合的变压器健康状态综合评价方法,包括:首先建立含有一级指标和二级指标的变压器状态评价指标体系;其次选用层次分析法确定了变压器状态评价指标体系中各评价指标的主观权重,选取熵权法确定了各评价指标的客观权重,并计算出主客观权重的综合赋权;再次采用半梯形和三角形的分布函数构建了电气和油气、绝缘油中溶解气体的隶属函数,并将最终得到的权重值应用于隶属度函数中;最后计算得到变压器健康程度评估因子,表征变压器的健康状态。该方法使用层次分析法、熵权法和模糊统计法相融合的方法计算变压器指标的综合权重,最大限度减少权重受主观性差异和矩阵阶数的影响。

    一种GIS隔离开关热点温度感知的外壳温度监测点选取方法

    公开(公告)号:CN114357828A

    公开(公告)日:2022-04-15

    申请号:CN202111573625.3

    申请日:2021-12-21

    Applicant: 武汉大学

    Abstract: 本发明公开了一种GIS隔离开关内部热点温度感知的外壳监测点选取方法,实施步骤包括:建立GIS隔离开关有限元仿真三维模型;对模型各部件材料属性进行设置;通过局部网格控制对模型进行网格剖分;设置电磁场计算的边界条件和激励条件;开展电磁场损耗计算;将损耗作为热源导入到流体‑温度场中;设置流体‑温度场中的边界条件和激励;开展稳态热分析计算;从热分析计算中提取出SF6流体域的流线;根据流体域整体的流线分布和特征流线在外壳选择温度监测点。本发明使得监测点的选取可以从热点热量传递的角度去解释,让选点更为可靠,也使得GIS隔离开关温度规律更为直观,节省了大量的时间,效率高,且切实可行。

    一种GIS隔离开关热点温度感知的外壳温度监测点选取方法

    公开(公告)号:CN114357828B

    公开(公告)日:2024-07-09

    申请号:CN202111573625.3

    申请日:2021-12-21

    Applicant: 武汉大学

    Abstract: 本发明公开了一种GIS隔离开关内部热点温度感知的外壳监测点选取方法,实施步骤包括:建立GIS隔离开关有限元仿真三维模型;对模型各部件材料属性进行设置;通过局部网格控制对模型进行网格剖分;设置电磁场计算的边界条件和激励条件;开展电磁场损耗计算;将损耗作为热源导入到流体‑温度场中;设置流体‑温度场中的边界条件和激励;开展稳态热分析计算;从热分析计算中提取出SF6流体域的流线;根据流体域整体的流线分布和特征流线在外壳选择温度监测点。本发明使得监测点的选取可以从热点热量传递的角度去解释,让选点更为可靠,也使得GIS隔离开关温度规律更为直观,节省了大量的时间,效率高,且切实可行。

    一种基于中文分词器的地址匹配方法及系统

    公开(公告)号:CN112612863A

    公开(公告)日:2021-04-06

    申请号:CN202011572828.6

    申请日:2020-12-23

    Applicant: 武汉大学

    Abstract: 本发明提供一种基于中文分词器的地址匹配方法及系统,进行地址数据集准备,包括多源地址数据的清洗和去重;地址匹配索引库创建,包括依据地址结构特点构建带有地理属性的地址分级数据库并生成索引文件;地址匹配引擎构建,包括对地址分级数据库中的地址元素进行编码,构建基于三叉拼音搜索树的中文地址分词器,增加匹配集的二次比对计算,形成一种基于分词器的匹配引擎;在地址匹配引擎的基础上实现正向或逆向的地址匹配。本发明对多源地址进行了集成,提供了一套地址数据库的构建和编码方案,面向非标准地址的查询,能够对含有拼音和同义词的地址进行解析且提供匹配地址集。本发明提供的地址匹配接口能有效的服务于市政、物流、导航等应用。

    一种使用语义标注的中文地址RoBERTa-BiLSTM-CRF耦合解析方法

    公开(公告)号:CN112560478A

    公开(公告)日:2021-03-26

    申请号:CN202011483732.2

    申请日:2020-12-16

    Applicant: 武汉大学

    Abstract: 本发明提出了一种使用语义标注的中文地址RoBERTa‑BiLSTM‑CRF耦合解析方法。本发明将多条地址文本依次进行分词,对分词后的字符进行人工语义标注,得到分词后去重的字符集及语义标注集。通过RoBERTa模型字典和语义标注集将地址文本及其对应的语义标注转化为地址信息矩阵。将地址信息矩阵输入到RoBERTa神经网络,得到地址的语义信息矩阵。将地址的语义信息矩阵输入到BiLSTM对上下文语义信息进行删减,得到标签的得分序列。将标签的得分序列作为输入到CRF模型筛选最优语义标注序列。本发明采用语义标注,能够识别地址中地址元素的层级及空间关系;能够从非标准地址提取标准地址,解决未登录词问题、剔除非标准和错误地址元素,根据地址中的空间关系实现空间推理。

Patent Agency Ranking