-
公开(公告)号:CN114490818A
公开(公告)日:2022-05-13
申请号:CN202210092565.1
申请日:2022-01-26
Applicant: 南京邮电大学
IPC: G06F16/2458 , G06F16/26
Abstract: 本发明提供了一种面向移动对象的多源传染事件发掘方法。首先将初始传染源对象按照多源传染事件三元组Eobj=(Sobj,obj,ts)的形式加入挖掘结果集合R,同时将obj加入传染源集合S。步骤为:选择轨迹数据时间点集合T中的第一个时间点t,并清空临时传染源集合St;对移动对象集合O中的每一个尚未被感染的对象oi进行分析,更新oi在t时刻的候选传染源集合C[i][t]。并根据C[i][t]的状态,判断是否发生多源传染事件;若发生,则求取传染源集合Soi,并构造新的多源传染事件(Soi,oi,t)加入R,同时将oi加入临时St;将St加入S;选择下一个时间点进行处理,直到T中的时间点都被处理完,R即为确定的多源传染模式挖掘结果。本发明采用滑动窗口机制,能够挖掘更多潜在的传染事件。
-
公开(公告)号:CN115757435A
公开(公告)日:2023-03-07
申请号:CN202211579597.0
申请日:2022-12-09
Applicant: 南京邮电大学
IPC: G06F16/22 , G06F16/2455 , G06F40/30 , G06F40/295
Abstract: 本发明属于信息检索技术领域,公开了一种支持语义感知密文检索加速的筛选因子确定方法,其第一阶段为每个关键词构建其与各文档的语义相关度划分序列:利用语义感知模型计算每个文档的语义向量;提取关键词,并计算每个关键词的语义向量;为每个关键词计算其与每个文档的语义相关度,形成语义相关度序列,并按降序对该序列进行排序;执行划分,为每个关键词生成该关键词与各文档的语义相关度划分序列;第二阶段根据检索关键词,利用语义相关度划分序列,计算并确定筛选因子。本发明提供的加速筛选因子确定方法,适用于支持语义感知的密文检索中基于树形结构索引的应用场景,能够显著提升检索速度,并且对搜索结果准确率没有影响。
-
公开(公告)号:CN114298020B
公开(公告)日:2024-07-02
申请号:CN202111659209.5
申请日:2021-12-30
Applicant: 南京邮电大学
IPC: G06F40/279 , G06F40/216 , G06F40/30 , G06F18/2321
Abstract: 本发明公开一种基于主题语义信息的关键词向量化方法及其应用,具体包括:首先利用Sentence‑BERT模型为每个文档生成具有文档语义信息的向量;再通过UMAP降维算法对生成的文档向量进行降维并突显局部语义特征;然后,在降维后的文档向量上进行HDBSCAN主题聚类,并将每个文档归类到一个或多个主题中;最后,利用文档和主题之间的关系,计算主题中每一个关键词的主题词频率‑逆主题频率(TTF‑ITF)得分,对该关键词与每个主题的主题词频率‑逆主题频率(TTF‑ITF)得分进行合并,生成最终的关键词向量。本发明实现高精度表征主题语义信息的关键词向量化,可应用于主题词提取、文本分类和文档检索。
-
公开(公告)号:CN114579999B
公开(公告)日:2024-06-04
申请号:CN202210222518.4
申请日:2022-03-07
Applicant: 南京邮电大学
IPC: G06F21/60 , G06F21/64 , G06F16/31 , G06F16/383
Abstract: 一种面向外包云环境的动态可验证关键词密文检索方法,包括三个模块:第一个模块为数据预处理模块,首先从文档集中抽取关键词集合并将文档加密;其次,构造一个本地证据并为每个关键词计算一个认证码;然后构造RAP‑tree索引;最后将索引和加密文档集外包至云服务器。第二个模块是更新模块,首先生成更新陷门并发送给云服务器;随后,云服务器根据陷门更新索引和密文集合。第三个模块是搜索模块,首先由授权用户生成搜索陷门并发送给云服务器;随后云服务器执行搜索程序并将搜索结果返回给用户;最后用户验证搜索结果的完整性。采用本方法可以保护外包云环境中的数据隐私,能够在密文状态下执行完整性可验证关键词搜索,并且支持数据的动态更新。
-
公开(公告)号:CN114298020A
公开(公告)日:2022-04-08
申请号:CN202111659209.5
申请日:2021-12-30
Applicant: 南京邮电大学
IPC: G06F40/279 , G06F40/216 , G06F40/30 , G06K9/62
Abstract: 本发明公开一种基于主题语义信息的关键词向量化方法及其应用,具体包括:首先利用Sentence‑BERT模型为每个文档生成具有文档语义信息的向量;再通过UMAP降维算法对生成的文档向量进行降维并突显局部语义特征;然后,在降维后的文档向量上进行HDBSCAN主题聚类,并将每个文档归类到一个或多个主题中;最后,利用文档和主题之间的关系,计算主题中每一个关键词的主题词频率‑逆主题频率(TTF‑ITF)得分,对该关键词与每个主题的主题词频率‑逆主题频率(TTF‑ITF)得分进行合并,生成最终的关键词向量。本发明实现高精度表征主题语义信息的关键词向量化,可应用于主题词提取、文本分类和文档检索。
-
公开(公告)号:CN114490818B
公开(公告)日:2024-11-08
申请号:CN202210092565.1
申请日:2022-01-26
Applicant: 南京邮电大学
IPC: G06F16/2458 , G06F16/26
Abstract: 本发明提供了一种面向移动对象的多源传染事件发掘方法。首先将初始传染源对象按照多源传染事件三元组Eobj=(Sobj,obj,ts)的形式加入挖掘结果集合R,同时将obj加入传染源集合S。步骤为:选择轨迹数据时间点集合T中的第一个时间点t,并清空临时传染源集合St;对移动对象集合O中的每一个尚未被感染的对象oi进行分析,更新oi在t时刻的候选传染源集合C[i][t]。并根据C[i][t]的状态,判断是否发生多源传染事件;若发生,则求取传染源集合Soi,并构造新的多源传染事件(Soi,oi,t)加入R,同时将oi加入临时St;将St加入S;选择下一个时间点进行处理,直到T中的时间点都被处理完,R即为确定的多源传染模式挖掘结果。本发明采用滑动窗口机制,能够挖掘更多潜在的传染事件。
-
公开(公告)号:CN117312486A
公开(公告)日:2023-12-29
申请号:CN202311262003.8
申请日:2023-09-27
Applicant: 南京邮电大学
IPC: G06F16/31 , G06F16/35 , G06F16/36 , G06F18/23213 , G06F21/60
Abstract: 本发明属于用户数据隐私保护技术领域,公开了一种支持快速加密文档排序检索的字典划分两层结构加密索引创建方法,包括如下步骤:首先,提取文档集合中各文档中的关键词,构造初始全局字典;其次,采用二分k‑means聚类方法对全局字典中的关键词进行聚类处理,实现全局字典中关键词的重排列;紧接着,对重排列后的全局字典进行等长划分,生成互不相交的等长子字典;然后,构造该子字典对应的独热码选择向量,并对包含关键词属于该子字典的每一个文档构造对应的文档子向量,构建两层结构明文索引;最后对明文索引进行加密处理,生成两层结构加密索引。本发明所创建的加密索引,可用于针对外包环境中加密文档的快速排序检索,提高检索效率。
-
公开(公告)号:CN114579999A
公开(公告)日:2022-06-03
申请号:CN202210222518.4
申请日:2022-03-07
Applicant: 南京邮电大学
IPC: G06F21/60 , G06F21/64 , G06F16/31 , G06F16/383
Abstract: 一种面向外包云环境的动态可验证关键词密文检索方法,包括三个模块:第一个模块为数据预处理模块,首先从文档集中抽取关键词集合并将文档加密;其次,构造一个本地证据并为每个关键词计算一个认证码;然后构造RAP‑tree索引;最后将索引和加密文档集外包至云服务器。第二个模块是更新模块,首先生成更新陷门并发送给云服务器;随后,云服务器根据陷门更新索引和密文集合。第三个模块是搜索模块,首先由授权用户生成搜索陷门并发送给云服务器;随后云服务器执行搜索程序并将搜索结果返回给用户;最后用户验证搜索结果的完整性。采用本方法可以保护外包云环境中的数据隐私,能够在密文状态下执行完整性可验证关键词搜索,并且支持数据的动态更新。
-
-
-
-
-
-
-