一种基于哈希的多标签空间数据集相似性度量方法

    公开(公告)号:CN119106292A

    公开(公告)日:2024-12-10

    申请号:CN202411288892.X

    申请日:2024-09-14

    Abstract: 本发明属于多标签空间数据集样例搜索领域,公开了一种基于哈希的多标签空间数据集相似性度量方法,包括数据预处理:将空间数据集中的点坐标映射为外边框范围内的平面坐标,并计算每个网格内带有各标签的数据点密度值,得到密度矩阵;类多通道图像生成:将密度值映射为对应通道下的“颜色通道值”,并计算复合通道值;哈希字符串生成:使用均值哈希、差值哈希和感知哈希方法生成每个数据集的哈希字符串,得到哈希字符串元组;相似度计算:通过计算哈希字符串之间的汉明距离,得到多标签空间数据集之间的相似度。本发明兼顾算法的准确性和效率,维持了较低的时间复杂度,准确且快速地衡量多个带有标签的空间数据集之间的相似程度。

Patent Agency Ranking