一种基于动态自聚合主题模型的文本聚合系统

    公开(公告)号:CN112507713A

    公开(公告)日:2021-03-16

    申请号:CN202011479879.4

    申请日:2020-12-15

    Abstract: 本发明涉及一种基于动态自聚合主题模型的文本聚合系统,包括文本获取模块,在设定的时间间隔的时间片上,获取待聚合短文本数据;预处理模块,对待聚合短文本数据进行数据清洗和文本分词形成文本数据集;动态自聚合主题模型,结合相邻时间片上的文本数据集,来捕获文本数据集中主题的多项分布和词的多项分布;吉布斯采样模块,用于对动态自聚合主题模型中的多项分布进行推导,统计出每个时间片上的主题分布和词分布;聚合模块,根据每个时间片上的主题分布和词分布,计算与主题相关的短文本聚合的概率。本发明自动聚合短文本为标准长文档,能克服短文本稀疏性问题,并且不需要启发式的前处理或者后处理技术,使得模型简单,处理效率较高。

    地下管线管理系统
    2.
    发明公开

    公开(公告)号:CN115994654A

    公开(公告)日:2023-04-21

    申请号:CN202211521905.4

    申请日:2022-11-30

    Abstract: 本发明涉及一种地下管线管理系统,属于管线管理技术领域,解决了现有技术中针对管线数据进行人工逐条校准更新费时费力的问题。所述管理系统包括:数据获取单元,用于获取新增的折点、跨点;数据存储单元,用于存储原管线数据和更新后的管线数据;数据处理单元,用于对原管线数据进行更新,得到更新后的管线数据;数据比较单元,用于基于所述原管线数据和所述更新后的管线数据,得到新增的管线数据。实现了管线数据的自动校准和更新管理。

    建立地下管线三维模型与目标GIS系统关联的方法及系统

    公开(公告)号:CN112364116A

    公开(公告)日:2021-02-12

    申请号:CN202011336755.0

    申请日:2020-11-25

    Abstract: 本发明涉及一种建立地下管线三维模型与目标GIS系统关联的方法及系统,属于地下管线数据处理技术领域,解决了现有地下管线三维模型利用率低,重建成本高、耗时长的问题。该方法包括,将地下管线三维模型转换为预设格式的第一模型文件;获得其包含的每一几何对象的坐标;根据几何对象的坐标判断几何对象是否为管线对象或管点对象,若是管线对象,则确定其在目标GIS系统数据库中对应的管线数据并进行关联;若是管点对象,则确定其在目标GIS系统数据库中对应的管点数据并进行关联,以获得与所述目标GIS系统关联的第一模型文件。该方法无需重建三维模型,即可实现与目标GIS系统的数据关联,提高了模型的利用率,且建立数据关联的成本低,效率高。

    建立地下管线三维模型与目标GIS系统关联的方法及系统

    公开(公告)号:CN112364116B

    公开(公告)日:2021-06-01

    申请号:CN202011336755.0

    申请日:2020-11-25

    Abstract: 本发明涉及一种建立地下管线三维模型与目标GIS系统关联的方法及系统,属于地下管线数据处理技术领域,解决了现有地下管线三维模型利用率低,重建成本高、耗时长的问题。该方法包括,将地下管线三维模型转换为预设格式的第一模型文件;获得其包含的每一几何对象的坐标;根据几何对象的坐标判断几何对象是否为管线对象或管点对象,若是管线对象,则确定其在目标GIS系统数据库中对应的管线数据并进行关联;若是管点对象,则确定其在目标GIS系统数据库中对应的管点数据并进行关联,以获得与所述目标GIS系统关联的第一模型文件。该方法无需重建三维模型,即可实现与目标GIS系统的数据关联,提高了模型的利用率,且建立数据关联的成本低,效率高。

    一种基于动态语义建模的短文本聚合方法

    公开(公告)号:CN112446220A

    公开(公告)日:2021-03-05

    申请号:CN202011479885.X

    申请日:2020-12-15

    Abstract: 本发明涉及一种基于动态语义建模的短文本聚合方法,包括以下步骤:在设定间隔的时间片上,获取待聚合短文本数据,进行数据预处理,形成数据集;在每个时间片上,通过建立动态自聚合主题模型捕获数据集中主题的多项分布和词的多项分布;采用吉布斯采样对动态自聚合主题模型中的多项分布进行推导,最后采样收敛时,统计每个时间片上的主题分布和词分布;根据每个时间片上的主题分布和词分布,计算与主题相关的短文本聚合的概率,自适应地聚合短文本。本发明自动聚合短文本为标准长文档,使得其能够捕获到更多的一致性主题,来克服短文本稀疏性问题,并且不需要启发式的前处理或者后处理技术,使得模型简单,处理效率较高。

Patent Agency Ranking