-
公开(公告)号:CN115761287A
公开(公告)日:2023-03-07
申请号:CN202211368794.8
申请日:2022-11-03
Applicant: 武汉大学
IPC: G06V10/762 , G06V10/764 , G06V10/74 , G06V40/16
Abstract: 本发明公开了一种图聚类方法,包括:提取所有图像的多种图像特征降维到低维空间并进行拼接,将所有图像划分为内部点、边界点;计算所有内部点的距离矩阵,并将距离矩阵转化为权重矩阵;构建所有内部点的最大生成树并根据最大生成树构建路径相似度矩阵;根据相似度矩阵计算度矩阵和拉普拉斯矩阵;将所有内部点按照度的大小进行降序排列,将未被赋予簇标签的点逐个加入到簇中并计算该点的MeanCut值;若MeanCut的值较之前降低,则遍历下一个点;否则,拒绝当前点加入到簇中;从头遍历未赋予簇标签的点,生成下一个簇,直到所有内部点被赋予簇标签;对于每个边界点,将距离最近的内部点标签赋予它,生成最终的聚类结果。本发明能够提高图像聚类精度和效率。
-
公开(公告)号:CN110765130A
公开(公告)日:2020-02-07
申请号:CN201910912399.3
申请日:2019-09-25
Applicant: 武汉大学
IPC: G06F16/22 , G06F16/2458 , G06F16/28
Abstract: 本发明公开了一种分布式环境下基于Ripley’s K函数的时空POI数据点模式分析方法,首先配置面向时空对象与时空索引的定制序列化器,然后,建立时空KDB树,对观测点进行数据重分区,接着构建局部时空R树索引,构造一系列点对;接着对于每个点对,在双层缓存中查找与点对对应的时空权重;然后计算观测点对应的不同时空距离阈值下时空Ripley’s K函数计算结果;然后基于观测点生成模拟点,得到模拟点对应的不同时空距离阈值下的时空Ripley’s K函数计算结果;再获得时空Ripley’s K函数模拟的上下界;最后,根据时空Ripley’s K函数模拟的上下界,获得最终的数据分布输出结果。本发明的方法可以大大提高时空POI数据点模式分析的效率。
-
公开(公告)号:CN110704624A
公开(公告)日:2020-01-17
申请号:CN201910942287.2
申请日:2019-09-30
Applicant: 武汉大学
IPC: G06F16/35 , G06F16/387 , G06F16/34 , G06F40/284 , G06F40/30 , G06K9/62
Abstract: 本发明公开了一种地理信息服务元数据文本多层级多标签分类方法,包括:1)获取地理信息服务元数据文本集进行文本预处理,将每条数据样本划分为文本特征词组合;2)设定一级分类目录,生成与分类类别语义关联的典型词词表;3)根据典型词词表对文本特征词进行筛选;4)选取ML-KNN作为协同训练的一个基模型;5)建立主题预测模型ML-CSW作为协同训练的另一基模型;6)设计协同机制,为元数据文本匹配多标签主题,作为一级粗粒度主题分类结果;7)选取某一分类标签对应的元数据文本,得到不同级别的细粒度主题类别目录。本发明方法考虑地理信息服务元数据的领域特色和文本语义,仅依赖少量的标记数据样本且分类结果相比传统多标签分类方法整体表现更好。
-
公开(公告)号:CN118551232B
公开(公告)日:2025-01-24
申请号:CN202410233953.6
申请日:2024-03-01
Applicant: 武汉大学
Abstract: 本发明提供一种融合时空与地理语义的轨迹相似度计算方法及系统,属于时空轨迹数据分析技术领域,包括:识别轨迹的关键点和普通点,根据普通点的空间邻近对象对其进行相似度修正,综合各点相似度求解轨迹对的空间相似度。将轨迹的时间信息转化为概率密度曲线,根据两条曲线的距离求解轨迹对的时间相似度。基于兴趣点数据和文本主题模型,将原始轨迹转化为语义轨迹,以求解轨迹对的语义相似度。为各维相似度赋予权重,加权求和得到综合相似度。本发明深入挖掘维度特性,分别构建各维相似度计算方案,解决了逆序轨迹、出行时段无重叠和出行频次差异较大等场景下相似度计算效果不佳和轨迹语义表达不准确等问题,并为轨迹聚类、检索等任务提供支持。
-
公开(公告)号:CN111291276B
公开(公告)日:2023-05-19
申请号:CN202010032456.1
申请日:2020-01-13
Applicant: 武汉大学
IPC: G06F16/9537 , G06F18/231 , G06F18/22 , G06F18/2413
Abstract: 本发明公开了一种基于局部方向中心性度量的聚类方法,包括S1、根据企业POI位置数据的空间分布,建立KD‑Tree的二维空间索引;S2、遍历每个POI点,基于KD‑Tree的回溯操作搜索它的空间K最邻近;S3、计算每个点与其KNN邻域构成的角度方差,并将它归一化;S4、根据指定的角度方差阈值把所有点划分为内部点和边界点;S5、根据连接的规则把内部点连接成多个聚类簇,直到所有内部点都已经有归属的聚类簇;S6、将所有边界点归类到与其最邻近的内部点的聚类簇。本发明采用基于KNN和基于方向的核心思想能够有效解决这两个问题,既能同时准确地识别密集和稀疏的聚类簇,也能将连接的多个不同簇进行合理的分割。
-
公开(公告)号:CN115512770A
公开(公告)日:2022-12-23
申请号:CN202211350243.9
申请日:2022-10-31
Applicant: 武汉大学
IPC: G16B30/00
Abstract: 本发明公开了一种单细胞RNA序列数据集的降维处理方法,包括:搜索每个细胞的k个最邻近对象KNN,并通过KNN统计RNN;按照RNN的降序对细胞进行遍历,若该点被抽取,则剔除该细胞的KNN,直至所有细胞被遍历,输出采样得到的锚点细胞;构建所有锚点细胞的KNN图网络,计算所有锚点细胞两两之间的最短路径,并计算它们的高维概率分布;将所有锚点细胞降维至低维空间并不断其低维坐标,直到满足迭代条件终止迭代;对于每个未被采样的非锚点细胞,根据d+1个锚点细胞更新前与更新后的低维坐标之间的映射关系计算该非锚点细胞的低维空间坐标;将所有锚点细胞与非锚点细胞的低维坐标整合,输出其低维坐标。本发明大幅度提升了降维效率并降低了计算的复杂程度。
-
公开(公告)号:CN110704624B
公开(公告)日:2021-08-10
申请号:CN201910942287.2
申请日:2019-09-30
Applicant: 武汉大学
IPC: G06F16/35 , G06F16/387 , G06F16/34 , G06F40/284 , G06F40/30 , G06K9/62
Abstract: 本发明公开了一种地理信息服务元数据文本多层级多标签分类方法,包括:1)获取地理信息服务元数据文本集进行文本预处理,将每条数据样本划分为文本特征词组合;2)设定一级分类目录,生成与分类类别语义关联的典型词词表;3)根据典型词词表对文本特征词进行筛选;4)选取ML‑KNN作为协同训练的一个基模型;5)建立主题预测模型ML‑CSW作为协同训练的另一基模型;6)设计协同机制,为元数据文本匹配多标签主题,作为一级粗粒度主题分类结果;7)选取某一分类标签对应的元数据文本,得到不同级别的细粒度主题类别目录。本发明方法考虑地理信息服务元数据的领域特色和文本语义,仅依赖少量的标记数据样本且分类结果相比传统多标签分类方法整体表现更好。
-
公开(公告)号:CN108537274A
公开(公告)日:2018-09-14
申请号:CN201810307824.1
申请日:2018-04-08
Applicant: 武汉大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于网格的空间多尺度快速聚类方法,包括:S1、选择数据尺度,确定网格的尺寸,对样本数据进行网格化,统计各网格的密度值;S2、指定初始密度阈值保留满足阈值条件的所有网格,得到初步的密度矩阵;S3、根据观察尺度指定滤波器模板,对全局网格空间进行卷积操作;S4、通过邻域搜索生成连通区作为初步聚类结果;对网格进行积分操作将网格空间映射到原始点集上得到原始点集聚类结果;S5、调整观察尺度,用变换的新滤波器对结果矩阵重复S3和S4,得到下一个观察尺度的聚类结果;S6、改变数据尺度,重复S1至S5,得到不同数据尺度下的聚类结果。本发明算法复杂度低,聚类效率和精度高,能满足海量点集实时多尺度聚类及可视化分析需求。
-
公开(公告)号:CN108537274B
公开(公告)日:2020-06-19
申请号:CN201810307824.1
申请日:2018-04-08
Applicant: 武汉大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于网格的空间多尺度快速聚类方法,包括:S1、选择数据尺度,确定网格的尺寸,对样本数据进行网格化,统计各网格的密度值;S2、指定初始密度阈值保留满足阈值条件的所有网格,得到初步的密度矩阵;S3、根据观察尺度指定滤波器模板,对全局网格空间进行卷积操作;S4、通过邻域搜索生成连通区作为初步聚类结果;对网格进行积分操作将网格空间映射到原始点集上得到原始点集聚类结果;S5、调整观察尺度,用变换的新滤波器对结果矩阵重复S3和S4,得到下一个观察尺度的聚类结果;S6、改变数据尺度,重复S1至S5,得到不同数据尺度下的聚类结果。本发明算法复杂度低,聚类效率和精度高,能满足海量点集实时多尺度聚类及可视化分析需求。
-
公开(公告)号:CN111291276A
公开(公告)日:2020-06-16
申请号:CN202010032456.1
申请日:2020-01-13
Applicant: 武汉大学
IPC: G06F16/9537 , G06K9/62
Abstract: 本发明公开了一种基于局部方向中心性度量的聚类方法,包括S1、根据企业POI位置数据的空间分布,建立KD-Tree的二维空间索引;S2、遍历每个POI点,基于KD-Tree的回溯操作搜索它的空间K最邻近;S3、计算每个点与其KNN邻域构成的角度方差,并将它归一化;S4、根据指定的角度方差阈值把所有点划分为内部点和边界点;S5、根据连接的规则把内部点连接成多个聚类簇,直到所有内部点都已经有归属的聚类簇;S6、将所有边界点归类到与其最邻近的内部点的聚类簇。本发明采用基于KNN和基于方向的核心思想能够有效解决这两个问题,既能同时准确地识别密集和稀疏的聚类簇,也能将连接的多个不同簇进行合理的分割。
-
-
-
-
-
-
-
-
-