一种基于主题语义感知的特征关键词提取方法

    公开(公告)号:CN112100317A

    公开(公告)日:2020-12-18

    申请号:CN202011017875.4

    申请日:2020-09-24

    Abstract: 本发明公开一种基于主题语义感知的特征关键词提取方法,具体包括如下过程:首先,利用关键词与文档主题之间的语义相关度的量化方法,计算关键词集合中每一个关键词的信息增益得分,并计算文档中每一个关键词的主题频率‑逆主题频率(TF‑ITF)得分;然后,选取信息增益得分最大的前κ个关键词,构成信息增益特征关键词集合;并分别针对每个文档,选取该文档中主题相关度得分最大的前λ个关键词,进而构成全局主题信息特征关键词集合;最终,对全局信息增益特征关键词集合和全局主题信息特征关键词集合进行合并,生成最终的特征关键词集合。本发明综合考虑关键词之间以及关键词和文档之间的主题语义关系,实现表征文档主题语义信息的特征关键词提取。

    一种面向云环境密文检索效率优化的检索过滤阈值选取方法

    公开(公告)号:CN112597268B

    公开(公告)日:2022-09-20

    申请号:CN202011525642.5

    申请日:2020-12-22

    Abstract: 本发明公开一种面向云环境密文检索效率优化的检索过滤阈值选取方法,包括:第一阶段为构建关键词区块:利用关键词和文档之间的相关度量化方法,计算每一个文档和每一个关键词的单关键词‑单文档相关度得分;对该相关度得分进行降序排列,并进行等量划分,生成全局区块表和对应的下边界数组;再利用全局区块表和下边界数组信息,为每个关键词构建相应的关键词区块表;第二阶段为确定检索过滤阈值:在执行密文检索时,根据检索关键词及其对应的关键词区块表信息,计算并确定检索过滤阈值。本发明提供的检索过滤阈值选取方法,适用于面向云环境的基于树形结构索引的密文检索应用场景,且能够在不影响检索结果精度的情况下,提升检索效率。

    一种面向云环境密文检索效率优化的检索过滤阈值选取方法

    公开(公告)号:CN112597268A

    公开(公告)日:2021-04-02

    申请号:CN202011525642.5

    申请日:2020-12-22

    Abstract: 本发明公开一种面向云环境密文检索效率优化的检索过滤阈值选取方法,包括:第一阶段为构建关键词区块:利用关键词和文档之间的相关度量化方法,计算每一个文档和每一个关键词的单关键词‑单文档相关度得分;对该相关度得分进行降序排列,并进行等量划分,生成全局区块表和对应的下边界数组;再利用全局区块表和下边界数组信息,为每个关键词构建相应的关键词区块表;第二阶段为确定检索过滤阈值:在执行密文检索时,根据检索关键词及其对应的关键词区块表信息,计算并确定检索过滤阈值。本发明提供的检索过滤阈值选取方法,适用于面向云环境的基于树形结构索引的密文检索应用场景,且能够在不影响检索结果精度的情况下,提升检索效率。

    一种基于关键词分组倒排索引的多关键词密文排序检索方法

    公开(公告)号:CN111966778B

    公开(公告)日:2022-07-29

    申请号:CN202010649370.3

    申请日:2020-07-08

    Abstract: 本发明公开了一种基于关键词分组倒排索引的多关键词密文排序检索方法。其步骤:一、数据处理与外包阶段,首先,数据拥有者生成一组密钥并共享给数据使用者;接着,对关键词进行分组,生成关键词分组集合及其对应的文档倒排列表集合;其次,生成文档向量、关键词分组向量及关键词分组倒排索引,并进行加密;将加密后的文档集合和关键词分组倒排索引外包至云服务器进行存储;二、检索阶段,首先,数据使用者生成检索陷门并发送至云服务器;然后,云服务器根据陷门在加密的关键词分组倒排索引上进行排序检索,并将其结果返回给数据使用者;最后,数据使用者通过密钥解密获得明文形式的检索结果。本发明实现安全、高效的多关键词密文排序检索功能。

    一种基于关键词分组倒排索引的多关键词密文排序检索方法

    公开(公告)号:CN111966778A

    公开(公告)日:2020-11-20

    申请号:CN202010649370.3

    申请日:2020-07-08

    Abstract: 本发明公开了一种基于关键词分组倒排索引的多关键词密文排序检索方法。其步骤:一、数据处理与外包阶段,首先,数据拥有者生成一组密钥并共享给数据使用者;接着,对关键词进行分组,生成关键词分组集合及其对应的文档倒排列表集合;其次,生成文档向量、关键词分组向量及关键词分组倒排索引,并进行加密;将加密后的文档集合和关键词分组倒排索引外包至云服务器进行存储;二、检索阶段,首先,数据使用者生成检索陷门并发送至云服务器;然后,云服务器根据陷门在加密的关键词分组倒排索引上进行排序检索,并将其结果返回给数据使用者;最后,数据使用者通过密钥解密获得明文形式的检索结果。本发明实现安全、高效的多关键词密文排序检索功能。

    一种基于主题语义感知的特征关键词提取方法

    公开(公告)号:CN112100317B

    公开(公告)日:2022-10-14

    申请号:CN202011017875.4

    申请日:2020-09-24

    Abstract: 本发明公开一种基于主题语义感知的特征关键词提取方法,具体包括如下过程:首先,利用关键词与文档主题之间的语义相关度的量化方法,计算关键词集合中每一个关键词的信息增益得分,并计算文档中每一个关键词的主题频率‑逆主题频率(TF‑ITF)得分;然后,选取信息增益得分最大的前κ个关键词,构成信息增益特征关键词集合;并分别针对每个文档,选取该文档中主题相关度得分最大的前λ个关键词,进而构成全局主题信息特征关键词集合;最终,对全局信息增益特征关键词集合和全局主题信息特征关键词集合进行合并,生成最终的特征关键词集合。本发明综合考虑关键词之间以及关键词和文档之间的主题语义关系,实现表征文档主题语义信息的特征关键词提取。

Patent Agency Ranking