一种基于URL特征的网站首页识别方法及电子装置

    公开(公告)号:CN114201698A

    公开(公告)日:2022-03-18

    申请号:CN202010981078.1

    申请日:2020-09-17

    Abstract: 本发明提供一种基于URL特征的网站首页识别方法及电子装置,包括剔除待识别URL首部的http://字符或者https://字符,获取包含http://字符或https://字符的临时变量t1;按照“/”字符对临时变量t1进行拆分,并进行有效性判断;若不能拆分或仅能拆成两部分且第二部分为空,则判断临时变量t1是否包含是二级、三级或四级域名;若仅能拆成两部分、第二部分不为空且第二部分长度小于第一阈值,则判断第二部分是否包含特定字符;若临时变量t1包含是二级、三级或四级域名或第二部分包含特定字符,则判断待识别URL为首页URL。本发明无需训练分类器、人工标注大量数据集及对URL页面内容进行分析,解决了通过语义无法识别嵌套URL的情况,降低了误报率,节省人力与网络资源,提升了识别速度。

    一种基于主动探测的Tor桥节点的隐藏节点发现方法及系统

    公开(公告)号:CN118199927A

    公开(公告)日:2024-06-14

    申请号:CN202410203156.3

    申请日:2024-02-23

    Abstract: 本发明公开了一种基于主动探测的Tor桥节点的隐藏节点发现方法及系统,所述方法包括:在Tor网络中植入非出口的受控路由节点,所述受控路由节点具有记录Tor网络的链路日志的功能;受控客户端向建立成功的两跳链路发送内容为指定桥节点IP的payload包;其中,所述两跳链路中的第一跳为指定桥节点,第二跳为所述受控路由节点;受控路由节点通过识别所述内容为指定桥节点IP的payload包发现所述两跳链路后,结合链路日志判断所述指定桥节点是否与隐藏节点绑定。本发明可以准确检测Tor网络路由节点的隐藏节点。

    一种基于邮件服务资产共现图的垃圾邮件检测方法

    公开(公告)号:CN116304597A

    公开(公告)日:2023-06-23

    申请号:CN202211136889.7

    申请日:2022-09-19

    Abstract: 本发明公开了一种基于邮件服务资产共现图的垃圾邮件检测方法。本方法包括:机器学习模型离线训练阶段:获取样本集合中每一样本邮件的头部信息;所述样本集合包括若干合法邮件和若干垃圾邮件;从每封样本邮件的头部信息中提取预设字段,构建各样本邮件对应的共现子图,然后对所得各共现子图进行合并得到一邮件服务资产共现图;基于样本邮件的共现子图和所述邮件服务资产共现图,使用子图表示学习技术,学习对应样本邮件的子图表示并对其进行标签标注;利用带有标签的子图表示训练机器学习模型;在线检测阶段:将待检测邮件的子图表示输入训练后的机器学习模型,输出该待检测邮件为垃圾邮件的概率。本发明充分利用邮件资产信息进行垃圾邮件检测。

    一种基于深度学习的跨网络用户对齐方法

    公开(公告)号:CN110347932B

    公开(公告)日:2021-11-23

    申请号:CN201910479105.2

    申请日:2019-06-04

    Abstract: 本发明公开了一种基于深度学习的跨网络用户对齐方法。本方法为:1)利用已知标签的用户对集合及用户对的结构信息训练深度学习框架;其中为已对齐的用户对,即社交网络GA中第i个用户与社交网络GB中第m个用户是同一用户;2)根据社交网络的结构信息分别从社交网络GA、社交网络GB中提取待对齐用户的结构信息以及并将其以用户对为单位输入训练后的深度学习框架,确定该用户对是否属于同一个真实人进行分类预测。本发明大大提高了跨网络用户对齐的准确性。

    一种基于网络流量多字段识别的人流量检测方法及系统

    公开(公告)号:CN106878102B

    公开(公告)日:2020-05-22

    申请号:CN201611204278.6

    申请日:2016-12-23

    Abstract: 本发明提供一种基于网络流量多字段识别的人流量检测方法,步骤包括:1)获取网络流量,对所含的数据包进行预处理,包括IP碎片重组、链接还原和协议识别;2)识别预处理后的数据包所含的多字段信息,该多字段信息包括基准字段、设备指纹字段、位置信息和时间戳信息;3)将多字段信息填充于设备表中;4)通过检测设备表中的联网设备位置信息和时间戳信息来统计人流量。本发明还提供一种基于网络流量多字段识别的人流量检测系统,包括流量获取模块、数据预处理模块、多字段识别模块、设备表模块及人流量统计模块。

Patent Agency Ranking