一种确定网络用户的上网行为类别的方法

    公开(公告)号:CN105871630B

    公开(公告)日:2019-03-05

    申请号:CN201610370749.4

    申请日:2016-05-30

    Abstract: 本发明提出了一种确定网络用户的上网行为类别的方法,该方法,包括:提取每个待测网络用户的上网行为特征,并通过文档向量空间模型的量化方法形成用户行为特征矩阵X;根据所述用户行为特征矩阵X,通过概率潜在语义分析方法PLSA和EM算法,得到行为倾向集合T以及“用户‑倾向”概率分布矩阵D;根据所述用户行为特征矩阵X,通过支持向量机SVM算法,得到“特征词‑类别”概率分布矩阵C;通过矩阵乘法运行T×C得到“倾向‑类别”映射矩阵M;通过矩阵乘法运行D×M得到“用户‑类别”概率分布矩阵Y;根据任一待测网络用户在各个类别上的概率分布情况,将所述任一待测网络用户分类到概率值最大的类别中。

    一种获取搜索引擎搜索结果的方法和装置

    公开(公告)号:CN106970962A

    公开(公告)日:2017-07-21

    申请号:CN201710170469.3

    申请日:2017-03-21

    CPC classification number: G06F16/95 G06F16/951

    Abstract: 本发明公开了一种获取搜索引擎搜索结果的方法和装置。所述方法包括:输入待测试的搜索引擎、关键词和页码;将关键词和页码输入搜索引擎对应的搜索引擎模板,获得关键词和页码对应的一级页面地址;将一级页面地址输入到预设的浏览器中,通过浏览器访问一级页面地址,并获取一级页面地址对应一级页面信息和二级页面信息。本发明采用自动化的方式获取搜索引擎的搜索结果,通过预先设置搜索引擎模板的方式,自动获得一级页面地址,并将一级页面地址输入预设的浏览器中,进而通过访问该一级页面地址,自动获得所需的一级页面信息和二级页面信息。通过本发明可以有效提升搜索验证效率和准确率,提高搜索效果以及获得搜索结果的效率。

    一种动态URL过滤方法及装置

    公开(公告)号:CN104573033A

    公开(公告)日:2015-04-29

    申请号:CN201510020876.7

    申请日:2015-01-15

    CPC classification number: G06F17/30876 G06F17/30887

    Abstract: 本发明提出了一种动态URL过滤方法及装置,该方法包括:基于URL标注集创建信息字典;针对URL标注集中的每一个URL,根据所述信息字典生成对应的特征向量,由URL标注集中所有的URL对应的特征向量组成特征矩阵;对URL特征矩阵进行分类得到特征权重向量和二分类阈值;基于所述信息字段对待预测的URL进行特征提取,并基于提取出的特征生成所述待预测的URL的特征向量;将所述待预测的URL的特征向量与所述特征权重向量对应相乘后相加得到目标数值,将目标数值与二分类阈值相比较以判断所述待预测的URL是动态URL还是静态URL。本发明可以离线处理,不需要访问网络、减少了存储,比较节省处理时间和计算资源。

Patent Agency Ranking