一种地理信息服务元数据文本多层级多标签分类方法

    公开(公告)号:CN110704624B

    公开(公告)日:2021-08-10

    申请号:CN201910942287.2

    申请日:2019-09-30

    Applicant: 武汉大学

    Abstract: 本发明公开了一种地理信息服务元数据文本多层级多标签分类方法,包括:1)获取地理信息服务元数据文本集进行文本预处理,将每条数据样本划分为文本特征词组合;2)设定一级分类目录,生成与分类类别语义关联的典型词词表;3)根据典型词词表对文本特征词进行筛选;4)选取ML‑KNN作为协同训练的一个基模型;5)建立主题预测模型ML‑CSW作为协同训练的另一基模型;6)设计协同机制,为元数据文本匹配多标签主题,作为一级粗粒度主题分类结果;7)选取某一分类标签对应的元数据文本,得到不同级别的细粒度主题类别目录。本发明方法考虑地理信息服务元数据的领域特色和文本语义,仅依赖少量的标记数据样本且分类结果相比传统多标签分类方法整体表现更好。

Patent Agency Ranking