-
公开(公告)号:CN113032562B
公开(公告)日:2024-02-02
申请号:CN202110289396.6
申请日:2021-03-18
Applicant: 中国人民解放军火箭军工程大学
IPC: G06F16/35 , G06F16/33 , G06F16/335 , G06F16/36
Abstract: 本发明涉及一种多次迭代对折词汇层级分类方法及系统,所述层级分类方法包括:计算各待分类词汇的使用频率;根据待分类词汇的使用频率对待分类词汇进行升序排列,并标注序号;根据待分类词汇的总数及待分类词汇的所属领域,确定层级级数及迭代阈值;初始化各层级的候选分界阈值;各层级的候选分界阈值为待分类词汇的总数量;根据各层级的候选分界阈值、待分类词汇的序号以及迭代阈值,对待分类词汇进行迭代查询,得到各层级的分界阈值;根据各层级的分界阈值,得到待分类词汇的层级分类。以词频为基准,利用大类词汇出现的频率高于小类词汇出现的频率,通过循环迭代对折的方式对词汇层级进行划分,提高了划分效率,且层级划分精准。
-
公开(公告)号:CN113032562A
公开(公告)日:2021-06-25
申请号:CN202110289396.6
申请日:2021-03-18
Applicant: 中国人民解放军火箭军工程大学
IPC: G06F16/35 , G06F16/33 , G06F16/335 , G06F16/36
Abstract: 本发明涉及一种多次迭代对折词汇层级分类方法及系统,所述层级分类方法包括:计算各待分类词汇的使用频率;根据待分类词汇的使用频率对待分类词汇进行升序排列,并标注序号;根据待分类词汇的总数及待分类词汇的所属领域,确定层级级数及迭代阈值;初始化各层级的候选分界阈值;各层级的候选分界阈值为待分类词汇的总数量;根据各层级的候选分界阈值、待分类词汇的序号以及迭代阈值,对待分类词汇进行迭代查询,得到各层级的分界阈值;根据各层级的分界阈值,得到待分类词汇的层级分类。以词频为基准,利用大类词汇出现的频率高于小类词汇出现的频率,通过循环迭代对折的方式对词汇层级进行划分,提高了划分效率,且层级划分精准。
-