基于深度学习的恶意加密流量检测方法及装置

    公开(公告)号:CN113794687A

    公开(公告)日:2021-12-14

    申请号:CN202110944248.3

    申请日:2021-08-17

    发明人: 张新 潘季明

    IPC分类号: H04L29/06 G06K9/62

    摘要: 本发明提出了一种基于深度学习的恶意加密流量检测方法及装置,检测方法包括骤:收集并解析待检测的TLS数据流量,获取TLS数据流量中的ClientHello数据包、ServerHello数据包及证书中的Subject字段和Issuer字段。基于ClientHello数据包和ServerHello数据包分别生成第一整数序列和第二整数序列,并输入第一特征提取模型进行特征提取,获取相应地第一特征序列和第二特征序列。基于证书中的Subject字段和Issuer字段分别生成第一处理序列和第二处理序列,并输入第二特征提取模型进行特征提取,获取相应地第三特征序列和第四特征序列。将特征序列组合后输入预先训练好的分类器,并输出TLS数据流量检测结果。本方法无须人工提取特征,并且充分考虑了TLS协议本身的特征,提高了恶意加密流量检测的准确率。

    文件传输方法、装置、系统、电子设备及存储介质

    公开(公告)号:CN110944052A

    公开(公告)日:2020-03-31

    申请号:CN201911211598.8

    申请日:2019-11-29

    IPC分类号: H04L29/08

    摘要: 本发明涉及一种文件传输方法、装置、系统、电子设备及存储介质,属于文件传输领域。客户端向服务器传输文件时,先获取到服务器的虚拟地址,然后查询网络数据库,构建用于传递待发送文件的属性信息的第一协商隧道。服务器根据属性信息针对待发送文件生成文件分块信息并查询网络数据库构建第二协商隧道,以将文件分块信息通过第二协商隧道发送给客户端。客户端根据文件分块信息确定用于发送待发送文件的数据发送隧道的数量并实时创建相应数量的数据发送隧道,然后将待发送数据通过数据发送隧道传输到服务器。在整个文件传输过程中,各个隧道运行于暗网环境,由于暗网节点具有不可追溯的特性,使得文件传输的安全性得到提升。

    一种基于网页生成PDF的方法、装置、设备及存储介质

    公开(公告)号:CN115758027A

    公开(公告)日:2023-03-07

    申请号:CN202211473789.3

    申请日:2022-11-22

    IPC分类号: G06F16/958 G06F16/957

    摘要: 本申请提供一种基于网页生成PDF的方法、装置、设备及存储介质,所述方法包括:获得网页访问路径及待访问网页的核心内容的Xpath路径;基于所述网页访问路径向网页发送访问请求,获得反馈的网页数据;确定所述网页数据的网页元素节点树;基于所述Xpath路径中的内容及网页元素节点树确定出所述网页数据中需要删除的非核心数据,所述非核心数据为所述网页数据中除核心数据及其显示相关数据以外的数据;删除所述网页中的非核心数据;基于所述网页数据中显示的核心数据生成对应的PDF文件。本申请基于网页生成PDF的方法能够直接对网页内容转换为PDF文件,且排版正常,支持文件内容不失真放大。

    一种数据的聚类方法和电子设备

    公开(公告)号:CN110765329B

    公开(公告)日:2022-09-23

    申请号:CN201911030402.5

    申请日:2019-10-28

    IPC分类号: G06F16/906 G06K9/62

    摘要: 本申请提供了一种数据的聚类方法及电子设备,该方法包括:获取目标数据,对所述目标数据进行分类处理,生成包含多类数据的数据群;基于聚类特征对所述数据群进行第一聚类操作,生成具有不同聚类特征的多个数据集;基于所述数据集的属性特征对所述数据集进行第二聚类操作,生成具有不同属性特征的多个数据子集。本申请所提供的方法能够全面深入地获取目标数据,快速地对数据群进行初步划分,然后基于细致划分数据的目的,对数据集进行进一步的细致划分,精确地划分生成了数据子集,直观地反映出数据的分布和状况。

    一种网页信息处理方法及系统

    公开(公告)号:CN110765336B

    公开(公告)日:2022-04-01

    申请号:CN201911060028.3

    申请日:2019-11-01

    发明人: 潘季明

    IPC分类号: G06F16/951 G06F16/9535

    摘要: 本申请公开了一种网页信息处理方法及系统,其中,该方法包括:获取第一网址和第一网址所指向的第一网页;基于第一网址的数据结构计算其网址性质参数,并基于第一网址的网址性质参数确定第一网页的权重值;从第一网页获取链接集合和网页内容数据;基于链接数据和网页内容数据计算第二网页的第一参数;基于第二网页的第一参数和第一网页的权重值计算第二网页的权重值,以使网络爬虫基于第二网页的权重值爬取第二网页。该方法能够提高网络爬虫的爬取效率,能够有效过滤掉垃圾网页、低质量网页及被篡改网页,保障了网络爬虫爬取的第二网页的质量。