基于模糊哈希算法的海量互联网相似图片检测系统及方法

    公开(公告)号:CN107423309A

    公开(公告)日:2017-12-01

    申请号:CN201610384446.8

    申请日:2016-06-01

    CPC classification number: G06F16/583 G06K9/6215

    Abstract: 本发明涉及一种基于模糊哈希算法相似图片检索方法及系统,其通过分片模块,根据设定的分片值,对图片进行分片;通过哈希算法模块,读取一部分图片内容,用哈希算法计算,得到每一个分片的哈希值;通过压缩映射算法模块,将每片的哈希值进行压缩,映射为一个更短的哈希值;通过连接哈希值算法模块,将每片压缩后的哈希值连在一起,得到该图片的模糊哈希值;最后通过比较算法模块,将待检索的两个图片的模糊哈希值采用加权的汉明距离方法计算相似程度,给出检索结果;解决了图像背景色被改变,或被裁剪、旋转或者某一个像素被修改后相似的图像的比较问题。本发明能够应用于海量互联网图片中的有害图片发现。

    一种构建用户画像的方法
    24.
    发明公开

    公开(公告)号:CN106503015A

    公开(公告)日:2017-03-15

    申请号:CN201510564860.2

    申请日:2015-09-07

    CPC classification number: G06F16/958 G06F16/337

    Abstract: 本发明公开了一种构建用户画像的方法。其中,构建用户画像的方法包括:获取用户互联网上网日志数据并进行预处理,对预处理后的互联网上网日志数据进行特征提取,得到用户的属性特征,然后基于已建立的多维特征库训练的标签分类,根据用户的属性特征在多维特征库中进行匹配,得到用户的多维度属性标签,根据多维度属性标签构建用户画像。通过上述方式,本发明能够构建出全息的多维度用户画像,从而能够满足运营商/企业/公司快速精准广告投放和用户群体的消费行为的推荐。

    一种基于向量运算的协议比对方法

    公开(公告)号:CN105024993A

    公开(公告)日:2015-11-04

    申请号:CN201510272122.0

    申请日:2015-05-25

    CPC classification number: H04L63/20

    Abstract: 本发明提供了一种基于向量运算的协议比对方法,用于网络协议识别。本方法包括:对已知协议的数据包进行特征向量提取,构建协议特征向量库;提取待判断的未知协议数据流的特征向量;通过距离算法,计算未知协议数据流的特征向量,与协议特征向量库中各特征向量的相似度,并从中选取相似度最大的协议作为比对结果;设定阈值对比较结果进行判断,以使得比较结果更加正确,当未知协议为新协议时,将对应的特征向量加入协议特征向量库。本发明具有统一的协议对比处理流程,具有较好的扩展性,同时可以自动识别出新的协议类型,可以方便、快速、准确地进行协议识别。

    一种基于游戏网络流量特征的ICMP隐蔽隧道检测方法

    公开(公告)号:CN118972096A

    公开(公告)日:2024-11-15

    申请号:CN202410943587.3

    申请日:2024-07-15

    Abstract: 本发明涉及网络流量特征检测技术领域,公开了一种基于游戏网络流量特征的ICMP隐蔽隧道检测方法,首先对游戏网络流量数据进行解析,提取流量数据中ICMP协议流量,提取ICMP相关类型数据,对payload字段按字节分解生成字符串,构建特征工程并生成特征数据表;将数据集中的数据进行数值化、归一化处理,再将处理后的数据集进行数据划分,分为训练集与测试集,按正常流量:隐蔽隧道流量为1:1的比例进行随机抽取,重新构建训练集,并训练生成供隐蔽隧道检测使用的XGBoost模型;将结构化数据结果调入训练好的XGBoost模型获取模型输出的分类结果;进行模型评价。本发明检测效率更为高效,准确的ICMP隐蔽隧道流量检测方法,实现较高的识别准确率及可移植性。

Patent Agency Ranking