一种正则表达式DFA空间压缩方法和系统

    公开(公告)号:CN109977275A

    公开(公告)日:2019-07-05

    申请号:CN201910134200.9

    申请日:2019-02-22

    Inventor: 高曌 孙毅 张志强

    Abstract: 本发明涉及一种正则表达式DFA空间压缩方法和系统,包括:对状态转移边进行扫描,读入转移矩阵,将转移矩阵中每一列的值以字符串形式存储;将相等的字符串对应的字符表元素合并,得到多个哈希表;计算正则表达式的状态机中两两状态间的相似度和相似度对应的权值,通过相似度构建相似度矩阵;根据状态机中各状态点的状态深度,更新相似度矩阵;从相似度矩阵对应的有向图中的每个状态节点开始遍历,选取状态节点对应的最大相似度转移边,从而完成默认路径的构造,保存默认路径作为最大生成树,以找到默认路径的相似度对应的权值以及对应的哈希表,删除在边压缩前DFA中的状态转移边,并在删除前的状态转移路径中增添一条权值为默认路径权值的默认路径。

    基于知识图谱的个人直播用户观看主播预测的方法及系统

    公开(公告)号:CN109960748A

    公开(公告)日:2019-07-02

    申请号:CN201910133577.2

    申请日:2019-02-22

    Inventor: 高曌 孙毅 张志强

    Abstract: 本发明提出了一种基于知识图谱的个人直播用户观看主播预测的方法及系统,包括在知识图谱中查询与待预测用户有邻接边的主播节点,并采用待预测用户与主播节点之间的权重,作为第一贡献权值;在知识图谱中查找与待预测用户观看过相同主播的第一用户集合,从第一用户集合中找到与待预测用户观看相同主播数量最多的用户,作为第二用户集合;得到第二用户集合中各用户观看主播节点的第二贡献权值;提取知识图谱中具有第二贡献权值的主播节点,判断其是否具有第一贡献权值,若有,则将其具有的第一贡献权值和第二贡献权值相加,作为其最终献权值,否则直接将第二贡献权值作为其最终献权值;提取大于阈值的最终献权值对应的主播节点,作为推荐结果。

    基于膨胀系数的K分组正则表达式分组方法和系统

    公开(公告)号:CN109981398B

    公开(公告)日:2021-08-24

    申请号:CN201910134197.0

    申请日:2019-02-22

    Inventor: 高曌 孙毅 张志强

    Abstract: 本发明涉及一种基于膨胀系数的K分组正则表达式分组方法和系统,包括:获取包含多个正则表达式的正则表达式集合,创建K个分组,将正则表达式依次分配到K个分组中使各组的膨胀系数总值最小。本发明在保证正则表达式分组正确的基础上,在大规模基于DFA的正则表达式模式匹配上获得很高的压缩比,使得每组正则表达式之间的相互作用不会导致状态空间爆炸,并且有较好的匹配效率和分组通用性。

    基于知识图谱的个人直播用户观看主播预测的方法及系统

    公开(公告)号:CN109960748B

    公开(公告)日:2021-03-26

    申请号:CN201910133577.2

    申请日:2019-02-22

    Inventor: 高曌 孙毅 张志强

    Abstract: 本发明提出了一种基于知识图谱的个人直播用户观看主播预测的方法及系统,包括在知识图谱中查询与待预测用户有邻接边的主播节点,并采用待预测用户与主播节点之间的权重,作为第一贡献权值;在知识图谱中查找与待预测用户观看过相同主播的第一用户集合,从第一用户集合中找到与待预测用户观看相同主播数量最多的用户,作为第二用户集合;得到第二用户集合中各用户观看主播节点的第二贡献权值;提取知识图谱中具有第二贡献权值的主播节点,判断其是否具有第一贡献权值,若有,则将其具有的第一贡献权值和第二贡献权值相加,作为其最终献权值,否则直接将第二贡献权值作为其最终献权值;提取大于阈值的最终献权值对应的主播节点,作为推荐结果。

    基于膨胀系数的K分组正则表达式分组方法和系统

    公开(公告)号:CN109981398A

    公开(公告)日:2019-07-05

    申请号:CN201910134197.0

    申请日:2019-02-22

    Inventor: 高曌 孙毅 张志强

    Abstract: 本发明涉及一种基于膨胀系数的K分组正则表达式分组方法和系统,包括:获取包含多个正则表达式的正则表达式集合,创建K个分组,将正则表达式依次分配到K个分组中使各组的膨胀系数总值最小。本发明在保证正则表达式分组正确的基础上,在大规模基于DFA的正则表达式模式匹配上获得很高的压缩比,使得每组正则表达式之间的相互作用不会导致状态空间爆炸,并且有较好的匹配效率和分组通用性。

Patent Agency Ranking