一种基于LDA主题特征的日志异常检测方法

    公开(公告)号:CN114969761B

    公开(公告)日:2024-11-15

    申请号:CN202210689100.4

    申请日:2022-06-17

    Abstract: 本发明是一种基于LDA主题特征的日志异常检测方法。该方法包含模型训练和异常检测两个阶段。在模型训练阶段,利用日志解析器将系统日志解析为日志模板集合和日志三元组集合,日志模板集合用以训练LDA模型,得到日志模板主题分类模型;利用LDA‑CM模型将日志三元组转换为进程日志模板主题,进而利用滑动窗口机制构造训练样本,最后将训练样本输入LSTM模型,训练生成日志异常检测模型。在异常检测阶段,将待检测的进程日志转换为对应的模板主题序列,然后输入LSTM‑ADM模型,实现针对进程日志的异常检测,本发明能够更加准确的学习日志间的语义关系特征以及更有效地通过非结构化的日志记录检测出进程或系统的异常行为。

    一种基于轨迹数据分析的k度密接查询方法

    公开(公告)号:CN117520669A

    公开(公告)日:2024-02-06

    申请号:CN202311482742.8

    申请日:2023-11-08

    Abstract: 本发明属于轨迹数据挖掘领域,公开了一种基于轨迹数据分析的k度密接查方法,包括:执行初始化操作,构建滑动窗口集合并且选取首个滑动窗口开始;其次,检查O’中的每一个移动对象是否发生密接关系,然后,根据密接事件三元组的传染源在候选序列中密接路径的所处位置的情况,对候选序列执行融合处理操作,如果发现新的k度密接记录,则将该k度密接记录加入查询结果R中;接着,若O’中存在待处理的移动对象,则按照上述过程处理O’中的下一个移动对象;否则进入下一个滑动窗口,对集合O’按照上述过程进行处理;最终,全部滑动窗口处理完毕后后即确定的k度密接查询结果集合。本发明提供了查询k度密接记录的方法,结构简单且易于实现。

    一种支持高效隐私保护空间关键词查询的加密索引构建方法

    公开(公告)号:CN117494205A

    公开(公告)日:2024-02-02

    申请号:CN202311521557.5

    申请日:2023-11-15

    Abstract: 本发明属于隐私保护技术领域,公开了一种支持高效隐私保护空间关键词查询的加密索引构建方法,包括如下过程:首先,根据空间数据集提取位置点信息并构建关键词字典;其次,构建关键词‑位置集二元组序列,对于关键词‑位置集二元组序列中的每一个二元组,根据划分参数进行等长拆分,对于拆分后的二元组序列中的每个关键词‑位置集,构建与之对应的AVL查找树,生成关键词‑查找树二元组序列;最后,对每一个关键词‑查找树二元组序列中的位置点和关键词分别进行加密处理并进行排序,得到最后的支持高效隐私保护空间关键词查询的加密索引。采用本发明所创建的加密索引,可用于实现在保护隐私的情况下对空间关键字进行精确搜索,提高检索效率。

    基于压缩的本地化差分隐私保护的逻辑回归方法

    公开(公告)号:CN116611030A

    公开(公告)日:2023-08-18

    申请号:CN202310576399.7

    申请日:2023-05-22

    Abstract: 本发明公开了一种基于压缩的本地化差分隐私保护的逻辑回归方法。在该方法中,用户根据服务器发布的模型参数计算梯度向量,对其编码处理得到输入向量;通过随机响应机制扰动得到输出向量,实现隐私保护。服务器聚合并校正输出向量,得到无偏均值可用于更新模型参数,并向下一轮参与训练的用户发布更新参数。经多轮迭代后训练出逻辑回归模型。最后,利用逻辑回归模型可对未知类标签的用户数据分类预测。本发明引入压缩的本地化差分隐私模型,该模型在保护用户隐私的同时提高了数据统计的效用和估计精度,平衡了隐私保护和数据可用性,为用户提供分类预测的同时,确保了攻击者无法逆向推理出训练数据中个体的数据,并具有较高的分类准确率。

    一种基于混合索引的多关键词密文排序检索方法

    公开(公告)号:CN109739945B

    公开(公告)日:2022-11-08

    申请号:CN201811523922.5

    申请日:2018-12-13

    Abstract: 本发明公开了一种基于混合索引的多关键词密文排序检索方法,包括两个阶段:第一阶段为数据预处理和外包,首先加密明文文档,并生成加密文档向量;其次,将关键词对应的文档集合进行等长分块,并为各分块构造块向量;然后,加密块向量,并构造出查找表和分块倒排索引;最后,将生成的加密文档和分块倒排索引外包至云服务器,将密钥和查找表共享给授权用户。第二阶段为多关键词密文排序检索,首先,授权用户利用查找表生成检索陷门并作为检索指令发送至云服务器;然后,云服务器执行排序检索,并将密文检索结果返回给授权用户,此时,授权用户通过解密获得明文检索结果。采用本发明可在保护数据隐私且不降低检索精度的同时,提高检索效率。

    一种基于主题语义感知的特征关键词提取方法

    公开(公告)号:CN112100317B

    公开(公告)日:2022-10-14

    申请号:CN202011017875.4

    申请日:2020-09-24

    Abstract: 本发明公开一种基于主题语义感知的特征关键词提取方法,具体包括如下过程:首先,利用关键词与文档主题之间的语义相关度的量化方法,计算关键词集合中每一个关键词的信息增益得分,并计算文档中每一个关键词的主题频率‑逆主题频率(TF‑ITF)得分;然后,选取信息增益得分最大的前κ个关键词,构成信息增益特征关键词集合;并分别针对每个文档,选取该文档中主题相关度得分最大的前λ个关键词,进而构成全局主题信息特征关键词集合;最终,对全局信息增益特征关键词集合和全局主题信息特征关键词集合进行合并,生成最终的特征关键词集合。本发明综合考虑关键词之间以及关键词和文档之间的主题语义关系,实现表征文档主题语义信息的特征关键词提取。

    一种面向智慧医疗大数据的隐私分级保护方法

    公开(公告)号:CN111832037B

    公开(公告)日:2022-09-23

    申请号:CN202010427908.6

    申请日:2020-05-20

    Abstract: 本发明公开了一种面向智慧医疗大数据的隐私分级保护方法,包括如下内容:为了进一步区分智慧医疗系统中的数据,提出基于字段的数据隐私分级,将一个数据包中的不同字段按照其隐私重要程度划分为不同等级。其次,为了控制数据的流通,提出进行数据流控制,从访问控制层面对数据流的传输进行限制,以保证数据的隐私安全。最后,基于自适应分级隐私保护加密步骤,根据应用场景下的隐私需求,选择数据包对应隐私等级的字段进行加密,以最小的开销实现隐私保护等级需求。本发明能够在有限的资源和时间限制下,使隐私达成度达到最大化,这对于加强智慧医疗大数据的隐私保护具有积极意义。

    一种基于LDA主题特征的日志异常检测方法

    公开(公告)号:CN114969761A

    公开(公告)日:2022-08-30

    申请号:CN202210689100.4

    申请日:2022-06-17

    Abstract: 本发明是一种基于LDA主题特征的日志异常检测方法。该方法包含模型训练和异常检测两个阶段。在模型训练阶段,利用日志解析器将系统日志解析为日志模板集合和日志三元组集合,日志模板集合用以训练LDA模型,得到日志模板主题分类模型;利用LDA‑CM模型将日志三元组转换为进程日志模板主题,进而利用滑动窗口机制构造训练样本,最后将训练样本输入LSTM模型,训练生成日志异常检测模型。在异常检测阶段,将待检测的进程日志转换为对应的模板主题序列,然后输入LSTM‑ADM模型,实现针对进程日志的异常检测,本发明能够更加准确的学习日志间的语义关系特征以及更有效地通过非结构化的日志记录检测出进程或系统的异常行为。

    一种面向差分隐私保护的频繁项集挖掘方法

    公开(公告)号:CN109409128B

    公开(公告)日:2022-05-17

    申请号:CN201811276452.7

    申请日:2018-10-30

    Abstract: 本发明公开了一种面向差分隐私保护的频繁项集挖掘方法,包括以下步骤:计算出所有项集的支持度,从中挑选出频繁项集;统计数据集中各条事务的长度,计算出截断长度L后截断数据集;计算频繁项集包含项的个数上限m和频繁项个数λ,根据λ值构造频繁项组成的集合F;构造最大频繁项集MFI集合B及候选项集集合C;使用集合B对集合C中的项集进行加噪;使用初始MFI集合B计算得到各个候选项集的支持度之后,计算与真实支持度的误差之和E;在B中搜索B、B,用B取代B并且更新误差和E的值;当误差和不再减小时停止迭代并输出结果。本发明可以很好地防止发布频繁项集会造成的个人隐私泄露,同时截断数据集的操作也有效地提高了挖掘结果的可用性。

Patent Agency Ranking