一种LLVM编译选项选择方法

    公开(公告)号:CN113900662B

    公开(公告)日:2024-07-09

    申请号:CN202111397828.1

    申请日:2021-11-19

    IPC分类号: G06F8/41

    摘要: 本发明涉及一种LLVM编译选项选择方法,首先通过在线均匀采样覆盖尽可能多的选项交互场景,然后基于优化目标的基准值将样本集分为有无目标改进两个子集,并同时在其中挖掘频繁选项,接着通过引入判定表对两种挖掘结果进行相互确认,并借助可执行代码的CRC码减少确认中的不确定性。该方法有利于选择出保障解质量并可有效减少搜索空间的一组选项。

    GCC编译选项选择两阶段优化方法及系统

    公开(公告)号:CN117149205A

    公开(公告)日:2023-12-01

    申请号:CN202310663420.7

    申请日:2023-06-06

    摘要: 本发明涉及一种GCC编译选项选择两阶段优化方法及系统,该方法包括:随机生成初始样本集并分为有无目标改进的样本集;使用正向挖掘和逆向挖掘技术在两个样本集上挖掘出选项是否有改进效果的判定表,进而生成不确定有无目标改进的选项集Sud和确定有目标改进的选项集Sde;通过可执行代码的CRC码基于选项集Sud生成潜在有改进的选项集Spo;合并Sde和Spo得到预选后的选项集;通过遗传算法进行选项选择演化优化以得到最优解;在此过程中,通过外部文档构建选项交互图用于帮助生成高质量的新解,同时基于随机森林构建分类模型,用于预判解的优劣;最终找到具有最小待优化软件执行时间的最佳选项集。该方法及系统有利于在提高优化质量的同时降低优化时间。

    一种嵌入式软件编译时能耗演化优化方法

    公开(公告)号:CN110704067B

    公开(公告)日:2022-09-20

    申请号:CN201910984810.8

    申请日:2019-10-16

    IPC分类号: G06F8/41 G06N3/00

    摘要: 本发明涉及一种嵌入式软件编译时能耗演化优化方法,包括以下步骤:1、输入嵌入式软件源代码,初始化参数,生成随机种群;2、计算初始种群中各个体的适应度,获取事务表;3、基于事务表,挖掘获取频繁选项模式集表;4、判断演化代数是否小于最大演化代数,是则转下一步,否则转最后一步;5、对种群中个体执行交叉操作,生成临时种群;6、对于临时种群中个体,基于模式集表,运用最大匹配算法进行多点变异生成新个体;7、计算更新后临时种群中各个体的适应度,更新事务表以及挖掘获取模式集表;8、生成下一代种群,并返回步骤4,直至满足终止条件;9、得到并输出最优解。该方法有利于降低软件能耗,加快收敛速度。

    一种基于会话特征相似性模糊聚类的异常用户检测方法

    公开(公告)号:CN108595655B

    公开(公告)日:2022-04-01

    申请号:CN201810398688.1

    申请日:2018-04-27

    IPC分类号: G06F16/95 G06V10/762 G06K9/62

    摘要: 本发明涉及一种基于会话特征相似性模糊聚类的异常用户检测方法,包括以下步骤:步骤S1:为每个会话建立滑动窗口,收集用户的网页访问信息;步骤S2:对收集到的网页访问信息进行数据预处理,生成用户会话信息;步骤S3:采用PageRank算法计算网页权重信息;步骤S4:基于得到的用户会话信息和网页权重信息,采用SimHash算法计算用户之间的相似性,建立用户相似性矩阵;步骤S5:采用基于模糊聚类的λ‑截算法对每个会话滑动窗口得到的用户相似性矩阵进行切割,得出嫌疑用户;步骤S6:根据所有会话滑动窗口返回的嫌疑用户信息,检测并定位异常用户。该方法有利于快速准确地检测并定位异常用户。

    基于最大频繁模式的动态规则库构建方法

    公开(公告)号:CN108173876B

    公开(公告)日:2020-11-06

    申请号:CN201810092166.9

    申请日:2018-01-30

    IPC分类号: H04L29/06

    摘要: 本发明涉及一种基于最大频繁模式的动态规则库构建方法,包括以下步骤:输入Web日志数据集,并对其进行数据过滤,将时间格式转化为时间戳,将IP和URL映射为数字;进行用户识别和会话识别,构造WASD;遍历WASD的每行,过滤出每个用户的近期访问行为,构成该用户的近期访问序列,进而由所有用户的近期访问序列构成DWASD;构造Spark运行环境变量sc;计算min_support;对前缀进行权重计数,并提取频繁1项集;遍历频繁1项集,递归寻找频繁项集;计算最大频繁项集,得到基于最大频繁模式的动态规则库。该方法有利于降低计算量,快速有效地构建出更加具有时效性的规则库。

    一种基于分布式日志的最大频繁序列模式挖掘方法

    公开(公告)号:CN108874952A

    公开(公告)日:2018-11-23

    申请号:CN201810571573.8

    申请日:2018-05-31

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种基于分布式日志的最大频繁序列模式挖掘方法,基于Spark分布式计算框架,提取局部最大频繁序列;利用前缀投影来划分搜索空间,递归提取出局部最大频繁序列;其中,利用频繁1序列删除日志序列数据集里面非频繁项,降低扫描数据库的规模,同时利用频繁序列模式与最大频繁序列模式之间对应关系减少候选序列数;提取全局最大频繁序列;将局部最大频繁序列按不同长度保存,相邻长度的序列模式进行超集检测,判断是否存在超集关系;如果存在,删除冗余序列,提取出全局最大频繁序列。本发明提出的一种基于分布式日志的最大频繁序列模式挖掘方法,具有更高效率,并支持更大规模事件序列数据的挖掘。

    一种基于会话特征相似性模糊聚类的异常用户检测方法

    公开(公告)号:CN108595655A

    公开(公告)日:2018-09-28

    申请号:CN201810398688.1

    申请日:2018-04-27

    IPC分类号: G06F17/30 G06K9/62

    摘要: 本发明涉及一种基于会话特征相似性模糊聚类的异常用户检测方法,包括以下步骤:步骤S1:为每个会话建立滑动窗口,收集用户的网页访问信息;步骤S2:对收集到的网页访问信息进行数据预处理,生成用户会话信息;步骤S3:采用PageRank算法计算网页权重信息;步骤S4:基于得到的用户会话信息和网页权重信息,采用SimHash算法计算用户之间的相似性,建立用户相似性矩阵;步骤S5:采用基于模糊聚类的λ-截算法对每个会话滑动窗口得到的用户相似性矩阵进行切割,得出嫌疑用户;步骤S6:根据所有会话滑动窗口返回的嫌疑用户信息,检测并定位异常用户。该方法有利于快速准确地检测并定位异常用户。

    基于最大频繁模式的动态规则库构建方法

    公开(公告)号:CN108173876A

    公开(公告)日:2018-06-15

    申请号:CN201810092166.9

    申请日:2018-01-30

    IPC分类号: H04L29/06

    摘要: 本发明涉及一种基于最大频繁模式的动态规则库构建方法,包括以下步骤:输入Web日志数据集,并对其进行数据过滤,将时间格式转化为时间戳,将IP和URL映射为数字;进行用户识别和会话识别,构造WASD;遍历WASD的每行,过滤出每个用户的近期访问行为,构成该用户的近期访问序列,进而由所有用户的近期访问序列构成DWASD;构造Spark运行环境变量sc;计算min_support;对前缀进行权重计数,并提取频繁1项集;遍历频繁1项集,递归寻找频繁项集;计算最大频繁项集,得到基于最大频繁模式的动态规则库。该方法有利于降低计算量,快速有效地构建出更加具有时效性的规则库。

    频繁序列挖掘帮助的LLVM编译时能耗优化方法及系统

    公开(公告)号:CN114564184B

    公开(公告)日:2024-11-08

    申请号:CN202210183569.0

    申请日:2022-02-25

    IPC分类号: G06F8/30 G06F8/41 G06F8/65

    摘要: 本发明涉及一种频繁序列挖掘帮助的LLVM编译时能耗优化方法及系统,该方法首先生成初始候选解集S,并基于候选解集S构建初始的带能耗改进标注的选项序列事务数据库DBE,然后基于DBE挖掘生成带能耗改进标注的频繁选项序列前缀树prefixTreeE和后缀树postfixTreeE,再基于前缀树prefixTreeE和后缀树postfixTreeE生成带能耗改进标注频繁选项序列帮助的新解,评估生成新解并更新DBE;不断生成新解直至达到预设的停机时间或解质量,输出S中的最优解。该方法及系统有利于在同等停机时间下提高解质量及其收敛速度。