基于模糊哈希算法的海量互联网相似图片检测系统及方法

    公开(公告)号:CN107423309A

    公开(公告)日:2017-12-01

    申请号:CN201610384446.8

    申请日:2016-06-01

    CPC classification number: G06F16/583 G06K9/6215

    Abstract: 本发明涉及一种基于模糊哈希算法相似图片检索方法及系统,其通过分片模块,根据设定的分片值,对图片进行分片;通过哈希算法模块,读取一部分图片内容,用哈希算法计算,得到每一个分片的哈希值;通过压缩映射算法模块,将每片的哈希值进行压缩,映射为一个更短的哈希值;通过连接哈希值算法模块,将每片压缩后的哈希值连在一起,得到该图片的模糊哈希值;最后通过比较算法模块,将待检索的两个图片的模糊哈希值采用加权的汉明距离方法计算相似程度,给出检索结果;解决了图像背景色被改变,或被裁剪、旋转或者某一个像素被修改后相似的图像的比较问题。本发明能够应用于海量互联网图片中的有害图片发现。

    一种构建用户画像的方法
    25.
    发明公开

    公开(公告)号:CN106503015A

    公开(公告)日:2017-03-15

    申请号:CN201510564860.2

    申请日:2015-09-07

    CPC classification number: G06F16/958 G06F16/337

    Abstract: 本发明公开了一种构建用户画像的方法。其中,构建用户画像的方法包括:获取用户互联网上网日志数据并进行预处理,对预处理后的互联网上网日志数据进行特征提取,得到用户的属性特征,然后基于已建立的多维特征库训练的标签分类,根据用户的属性特征在多维特征库中进行匹配,得到用户的多维度属性标签,根据多维度属性标签构建用户画像。通过上述方式,本发明能够构建出全息的多维度用户画像,从而能够满足运营商/企业/公司快速精准广告投放和用户群体的消费行为的推荐。

    数据流处理方法和系统
    28.
    发明授权

    公开(公告)号:CN102761487B

    公开(公告)日:2016-04-27

    申请号:CN201210242506.4

    申请日:2012-07-12

    Abstract: 本发明公开了一种数据流处理方法和系统,该方法用于借助众核处理器的多个处理核心对数据流进行解码处理,其中,多个处理器核心被划分为多个资源组,该方法包括:将数据流分配给多个资源组中的部分或全部;以及每个资源组对被分配到该资源组的数据流进行解码处理。本发明通过将数据流分配给多个处理核心划分得到的多个资源组中的部分或全部,并在每个资源组中对被分配到该资源组的数据流进行解码处理,从而能够对多个数据流进行并行处理,并且减少各个流的各个片段输入产生的响应延迟以及整个流的响应延迟,提高了处理效率,优化了处理器资源的使用。

    一种基于向量运算的协议比对方法

    公开(公告)号:CN105024993A

    公开(公告)日:2015-11-04

    申请号:CN201510272122.0

    申请日:2015-05-25

    CPC classification number: H04L63/20

    Abstract: 本发明提供了一种基于向量运算的协议比对方法,用于网络协议识别。本方法包括:对已知协议的数据包进行特征向量提取,构建协议特征向量库;提取待判断的未知协议数据流的特征向量;通过距离算法,计算未知协议数据流的特征向量,与协议特征向量库中各特征向量的相似度,并从中选取相似度最大的协议作为比对结果;设定阈值对比较结果进行判断,以使得比较结果更加正确,当未知协议为新协议时,将对应的特征向量加入协议特征向量库。本发明具有统一的协议对比处理流程,具有较好的扩展性,同时可以自动识别出新的协议类型,可以方便、快速、准确地进行协议识别。

Patent Agency Ranking