一种文件分类方法和装置

    公开(公告)号:CN111858486B

    公开(公告)日:2024-07-23

    申请号:CN202010631285.4

    申请日:2020-07-03

    IPC分类号: G06F16/16 G06F16/18 G06F21/16

    摘要: 本发明公开了一种文件分类方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:响应于对目标文件的查询标签操作,获取目标文件的文件指纹,确定本地指纹库中与文件指纹的相似度超出预定相似度阈值的相似文件指纹;获取与相似文件指纹对应的元信息,根据元信息中的标签标识进行标签确定,得到第一标签集;传输文件指纹至服务端进行标签查询,以接收服务端返回的第二标签集;对第一标签集和第二标签集取并集,得到目标文件的已打标签集,根据已打标签集中的标签确定目标文件所属分类。该实施方式文件指纹仅与文件内容关联,突破现有仅针对特定类型文件的限制;通过与其关联的文件的标签对其进行打标处理,提高了文件分类正确性。

    一种文件分类方法和装置

    公开(公告)号:CN111858486A

    公开(公告)日:2020-10-30

    申请号:CN202010631285.4

    申请日:2020-07-03

    IPC分类号: G06F16/16 G06F16/18 G06F21/16

    摘要: 本发明公开了一种文件分类方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:响应于对目标文件的查询标签操作,获取目标文件的文件指纹,确定本地指纹库中与文件指纹的相似度超出预定相似度阈值的相似文件指纹;获取与相似文件指纹对应的元信息,根据元信息中的标签标识进行标签确定,得到第一标签集;传输文件指纹至服务端进行标签查询,以接收服务端返回的第二标签集;对第一标签集和第二标签集取并集,得到目标文件的已打标签集,根据已打标签集中的标签确定目标文件所属分类。该实施方式文件指纹仅与文件内容关联,突破现有仅针对特定类型文件的限制;通过与其关联的文件的标签对其进行打标处理,提高了文件分类正确性。