一种基于深度学习的跨网络用户对齐方法

    公开(公告)号:CN110347932B

    公开(公告)日:2021-11-23

    申请号:CN201910479105.2

    申请日:2019-06-04

    Abstract: 本发明公开了一种基于深度学习的跨网络用户对齐方法。本方法为:1)利用已知标签的用户对集合及用户对的结构信息训练深度学习框架;其中为已对齐的用户对,即社交网络GA中第i个用户与社交网络GB中第m个用户是同一用户;2)根据社交网络的结构信息分别从社交网络GA、社交网络GB中提取待对齐用户的结构信息以及并将其以用户对为单位输入训练后的深度学习框架,确定该用户对是否属于同一个真实人进行分类预测。本发明大大提高了跨网络用户对齐的准确性。

    一种面向多模式图匹配的并行加速方法

    公开(公告)号:CN109614520B

    公开(公告)日:2021-06-04

    申请号:CN201811228936.4

    申请日:2018-10-22

    Abstract: 本发明公开了一种面向多模式图匹配的并行加速方法。本方法为:1)生成目标领域的模式图集的多模式图索引;2)对所述多模式图索引采用逐层分组策略,即对所述多模式图索引中每一层出现的模式图进行评估,得到该层中每个模式图的匹配代价,然后根据匹配代价对该层的模式图进行分组;3)对不同分组分别分配一线程同时进行匹配计算。本发明通过采用PatternTree索引构建算法挖掘模式图间存在的结构相关性,对于结构相关性较弱的模式图设计并行匹配策略进一步提升匹配性能。

    一种基于差分预解集的网络信息扩散源头推断方法

    公开(公告)号:CN110300016B

    公开(公告)日:2020-12-04

    申请号:CN201910397763.7

    申请日:2019-05-14

    Abstract: 本发明提供一种基于差分预解集的网络信息扩散源头推断方法,属于信息技术处理领域,用G=(V,E)表示网络节点之间的连接关系,其中V表示网络节点集,E表示网络边集,从中选取差分预解集S,建立扩散源特征,收集级联信息,判断指标集合的模|Ic|的大小,如果大于预设值,则提取级联C的特征向量,对每个节点v∈V的扩散源特征进行调整,对所有的节点v∈V逐一计算范数,找到范数最小的那个节点推断为源头。本方法能够主动地对数据来源进行优化选取,提高输入数据的质量,大幅提升源头推断的精度。

    一种基于卷积神经网络的面向智能专家推荐的用户画像方法

    公开(公告)号:CN111581368A

    公开(公告)日:2020-08-25

    申请号:CN201910121716.X

    申请日:2019-02-19

    Abstract: 本发明公开了一种基于卷积神经网络的面向智能专家推荐的用户画像方法。本方法为:1)利用选定的专家个人信息,获取一专家信息数据集;2)对该专家信息数据集中的每一条专家信息处理为一个由词语序列构建而成的句子;3)将使用词向量对步骤2)处理后的专家信息进行文本表示;4)将专家信息对应的词向量训练卷积神经网络;5)根据待构建画像专家的文本信息生成该待构建画像专家的词向量,利用训练后的卷积神经网络对该待构建画像专家的词向量进行分类,生成该待构建画像专家的用户画像。本发明勾画用户画像准确性高。

    一种高效的基于动态数组的网络流量处理方法及系统

    公开(公告)号:CN110943936A

    公开(公告)日:2020-03-31

    申请号:CN201911086763.1

    申请日:2019-11-08

    Abstract: 本发明涉及一种高效的基于动态数组的网络流量处理方法及系统。该方法为每个线程分配一个缓存管理器,所述缓存管理器申请以超级块为单位的内存块,每个超级块包含多个基本块;设置动态数组,通过所述动态数组将网络流的扫描结果存储在所属线程的缓存管理器申请的超级块中。在初始化阶段创建所需线程,初始化缓存管理器、线程中的网络流以及动态数组;在内存使用阶段进行申请内存、获取下一元素以及归还内存的操作。本发明能够减少内存空间的浪费,满足在线系统的高效处理性能与较低空间消耗的需求。

    一种高效的静态哈希表实现方法及系统

    公开(公告)号:CN106326475B

    公开(公告)日:2019-12-27

    申请号:CN201610793354.5

    申请日:2016-08-31

    Abstract: 本发明涉及一种高效的静态哈希表实现方法及系统。该方法包括以下步骤:1)设定哈希桶大小hash_bit,生成多个数据对,将key[i]和value[i]对应于关键字和值;2)根据key[i]值,利用rank操作构建哈希表,并计算C表和D表;3)根据C表和D表计算rank(h),并根据rank(h)的值存储相应的key[i]和value[i];4)根据所要查询的值key判断哈希表中是否存在该元素,若存在则在对应存储位置查询并返回value值,否则访问失败;5)根据步骤4)所得的结果返回结果信息。本发明利用Rank‑select算法实现新型静态哈希表的构建与访问,可用于内容过滤、信息安全等领域。

    一种基于差分预解集的网络信息扩散源头推断方法

    公开(公告)号:CN110300016A

    公开(公告)日:2019-10-01

    申请号:CN201910397763.7

    申请日:2019-05-14

    Abstract: 本发明提供一种基于差分预解集的网络信息扩散源头推断方法,属于信息技术处理领域,用G=(V,E)表示网络节点之间的连接关系,其中V表示网络节点集,E表示网络边集,从中选取差分预解集S,建立扩散源特征,收集级联信息,判断指标集合的模|Ic|的大小,如果大于预设值,则提取级联C的特征向量,对每个节点v∈V的扩散源特征进行调整,对所有的节点v∈V逐一计算范数,找到范数最小的那个节点推断为源头。本方法能够主动地对数据来源进行优化选取,提高输入数据的质量,大幅提升源头推断的精度。

    一种基于可疑性度量的团伙诈骗电话识别方法

    公开(公告)号:CN110233938A

    公开(公告)日:2019-09-13

    申请号:CN201910398052.1

    申请日:2019-05-14

    Abstract: 本发明提出一种基于可疑性度量的团伙诈骗电话识别方法,采用无监督的方式,利用电话号码之间的呼叫记录信息,为每个电话号码定义可疑性度量,采用风险等级量化的方式识别团伙诈骗电话。本方法不需引入用户的主观标记结果,不仅能避免主观判断带来的缺陷,还能在较短时间内完成模型训练与线上使用,为用户遭受团体诈骗提供了一种简单、实用的识别方法,有效地缓解了滞后性所带来的问题。

    一种从正则表达式中抽取最长精确子串的方法

    公开(公告)号:CN109977298A

    公开(公告)日:2019-07-05

    申请号:CN201910116717.5

    申请日:2019-02-15

    Abstract: 本发明提供一种从正则表达式中抽取最长精确子串的方法,步骤包括:构造正则表达式的解析树,获得可以进行解析树遍历访问的根节点;将解析树的CONCAT路径上的CONCAT节点的边都进行切分,把解析树切分成多个子树,每个子树即为一个基本单元;新建一个节点作为精确串锚点,用以存储精确串,同时记录该精确串锚点的左右邻居,该精确串为只有单个字符的基本单元或者由连续CONCAT操作符切分的字符拼接而成;通过对精确串锚点的左邻居和右邻居分别计算后缀和前缀,通过对后缀、精确串、前缀的拼接即可得到基于该精确串锚点抽取的精确子串,再通过对所有精确串锚点的计算,得到最长精确子串。

Patent Agency Ranking