-
公开(公告)号:CN119322946A
公开(公告)日:2025-01-17
申请号:CN202411468082.2
申请日:2024-10-21
Applicant: 南京邮电大学
IPC: G06F18/22 , G06F18/213 , G06F16/29
Abstract: 本发明属于空间数据集样例搜索领域,公开了一种基于卷积与池化的空间数据集相似度计算方法,该方法包括(1)数据集特征图生成阶段:对空间数据集仓库建立网格坐标系,统计二维坐标数量生成特征图;(2)卷积与池化阶段:利用高斯平滑卷积核平滑特征图,提取特征图结构特征,再通过池化窗口选最大值生成池化特征图;(3)相似度计算阶段:将最终的特征图展平为特征向量并归一化处理,计算相对余弦相似量,得到数据集之间的相似度。本发明处理了具有复杂结构的空间数据集相似度问题,有效提取了数据集主要特征并减小了计算规模,兼顾准确性和效率,高效处理大规模具有复杂结构的空间数据集,并准确反应数据集间的相似性。
-
公开(公告)号:CN119106292A
公开(公告)日:2024-12-10
申请号:CN202411288892.X
申请日:2024-09-14
Applicant: 南京邮电大学
IPC: G06F18/22 , G06F18/10 , G06F16/953
Abstract: 本发明属于多标签空间数据集样例搜索领域,公开了一种基于哈希的多标签空间数据集相似性度量方法,包括数据预处理:将空间数据集中的点坐标映射为外边框范围内的平面坐标,并计算每个网格内带有各标签的数据点密度值,得到密度矩阵;类多通道图像生成:将密度值映射为对应通道下的“颜色通道值”,并计算复合通道值;哈希字符串生成:使用均值哈希、差值哈希和感知哈希方法生成每个数据集的哈希字符串,得到哈希字符串元组;相似度计算:通过计算哈希字符串之间的汉明距离,得到多标签空间数据集之间的相似度。本发明兼顾算法的准确性和效率,维持了较低的时间复杂度,准确且快速地衡量多个带有标签的空间数据集之间的相似程度。
-