一种数据处理的方法、装置、设备及存储介质
摘要:
本申请公开了一种数据处理的方法,包括:获取第一数据集和第二数据集,第一数据集中包括C个第一场景数据,第二数据集中包括D个第二场景数据,C为大于0的整数,D为大于0的整数;根据第一数据集中的C个第一场景数据生成第一场景树,根据第二数据集中的D个第二场景数据生成第二场景树;确定第一场景树与第二场景树的场景相似度;根据第一场景树与第二场景树的场景相似度,确定第一数据集第二数据集的数据集相似度。本申请技术方案可以通过构建统一场景树的方式对不同的数据集进行相似度检测,可以提高相似度检测的准确性。
公开/授权文献
0/0