一种多次迭代对折词汇层级分类方法及系统

    公开(公告)号:CN113032562B

    公开(公告)日:2024-02-02

    申请号:CN202110289396.6

    申请日:2021-03-18

    Abstract: 本发明涉及一种多次迭代对折词汇层级分类方法及系统,所述层级分类方法包括:计算各待分类词汇的使用频率;根据待分类词汇的使用频率对待分类词汇进行升序排列,并标注序号;根据待分类词汇的总数及待分类词汇的所属领域,确定层级级数及迭代阈值;初始化各层级的候选分界阈值;各层级的候选分界阈值为待分类词汇的总数量;根据各层级的候选分界阈值、待分类词汇的序号以及迭代阈值,对待分类词汇进行迭代查询,得到各层级的分界阈值;根据各层级的分界阈值,得到待分类词汇的层级分类。以词频为基准,利用大类词汇出现的频率高于小类词汇出现的频率,通过循环迭代对折的方式对词汇层级进行划分,提高了划分效率,且层级划分精准。

    一种多次迭代对折词汇层级分类方法及系统

    公开(公告)号:CN113032562A

    公开(公告)日:2021-06-25

    申请号:CN202110289396.6

    申请日:2021-03-18

    Abstract: 本发明涉及一种多次迭代对折词汇层级分类方法及系统,所述层级分类方法包括:计算各待分类词汇的使用频率;根据待分类词汇的使用频率对待分类词汇进行升序排列,并标注序号;根据待分类词汇的总数及待分类词汇的所属领域,确定层级级数及迭代阈值;初始化各层级的候选分界阈值;各层级的候选分界阈值为待分类词汇的总数量;根据各层级的候选分界阈值、待分类词汇的序号以及迭代阈值,对待分类词汇进行迭代查询,得到各层级的分界阈值;根据各层级的分界阈值,得到待分类词汇的层级分类。以词频为基准,利用大类词汇出现的频率高于小类词汇出现的频率,通过循环迭代对折的方式对词汇层级进行划分,提高了划分效率,且层级划分精准。

Patent Agency Ranking