风险网站宣传主体检测方法、装置、设备、介质

    公开(公告)号:CN111541683B

    公开(公告)日:2022-04-19

    申请号:CN202010311366.6

    申请日:2020-04-20

    Inventor: 宋建昌 范渊 杨勃

    Abstract: 本申请公开了一种风险网站宣传主体检测方法、装置、设备、介质,该方法包括:利用网络爬虫技术爬取目标风险网站的网页信息;利用去标签技术,从所述网页信息中确定出目标文本信息;利用新词识别技术,从所述目标文本信息中识别出新词,得到新词集;根据所述新词集和所述目标文本信息,确定出宣传主体清单;从所述宣传主体清单中确定出所述目标风险网站对应的目标宣传主体。这样能够检测出风险网站的实际宣传主体,且风险网站宣传主体检测效率高,有利于维护网络安全。

    网站信息聚类方法、装置、电子装置和计算机设备

    公开(公告)号:CN113468391A

    公开(公告)日:2021-10-01

    申请号:CN202110791002.7

    申请日:2021-07-13

    Inventor: 宋建昌 范渊 黄进

    Abstract: 本申请涉及一种网站信息聚类方法、装置、电子装置和计算机设备,其中,该网站信息聚类方法包括:获取目标网站的网站信息,对网站信息进行多维关联分析,得到与目标网站关联的资产数据,根据预先确定的网站信息指标,对资产数据进行向量化处理,得到资产数据的多维度向量,对多维度向量进行层次聚类处理,得到资产数据的聚类,根据资产数据的聚类,确定资产数据与目标网站的密切度。其通过层次聚类实现了对网站信息不同维度所获取的资产数据的聚类,进而实现了对目标网站与关联网站之间密切度的计算,从而提高了网站关联分析的准确度。

    风险网站宣传主体检测方法、装置、设备、介质

    公开(公告)号:CN111541683A

    公开(公告)日:2020-08-14

    申请号:CN202010311366.6

    申请日:2020-04-20

    Inventor: 宋建昌 范渊 杨勃

    Abstract: 本申请公开了一种风险网站宣传主体检测方法、装置、设备、介质,该方法包括:利用网络爬虫技术爬取目标风险网站的网页信息;利用去标签技术,从所述网页信息中确定出目标文本信息;利用新词识别技术,从所述目标文本信息中识别出新词,得到新词集;根据所述新词集和所述目标文本信息,确定出宣传主体清单;从所述宣传主体清单中确定出所述目标风险网站对应的目标宣传主体。这样能够检测出风险网站的实际宣传主体,且风险网站宣传主体检测效率高,有利于维护网络安全。

    网站信息聚类方法、装置、电子装置和计算机设备

    公开(公告)号:CN113468391B

    公开(公告)日:2024-05-28

    申请号:CN202110791002.7

    申请日:2021-07-13

    Inventor: 宋建昌 范渊 黄进

    Abstract: 本申请涉及一种网站信息聚类方法、装置、电子装置和计算机设备,其中,该网站信息聚类方法包括:获取目标网站的网站信息,对网站信息进行多维关联分析,得到与目标网站关联的资产数据,根据预先确定的网站信息指标,对资产数据进行向量化处理,得到资产数据的多维度向量,对多维度向量进行层次聚类处理,得到资产数据的聚类,根据资产数据的聚类,确定资产数据与目标网站的密切度。其通过层次聚类实现了对网站信息不同维度所获取的资产数据的聚类,进而实现了对目标网站与关联网站之间密切度的计算,从而提高了网站关联分析的准确度。

    大规模网站漏洞扫描方法、装置及电子设备

    公开(公告)号:CN108154035B

    公开(公告)日:2021-01-26

    申请号:CN201711398535.9

    申请日:2017-12-21

    Inventor: 宋建昌 范渊

    Abstract: 本发明提供一种大规模网站漏洞扫描方法、装置及电子设备,涉及信息安全技术领域,大规模网站漏洞扫描方法,应用于物理机或者虚拟机,包括:创建用于容器化漏洞扫描的镜像文件;基于用户的发布指令,将创建的镜像文件发布到本地镜像库中;当物理机或者虚拟机获取到漏洞扫描指令时,从镜像库中调取镜像文件进行容器化部署;并基于部署的镜像文件进行网站漏洞扫描。本方法将预先创建的镜像文件进行容器化部署,进而通过部署的镜像文件进行网站漏洞扫描,这种容器化部署方式,可以实现一键化扩展和收缩引擎集群,大大减少人工重复性劳动,同时对漏洞扫描过程步骤进行优化,从而提高资源使用率和提升性能。

    一种网站行业类型快速识别的方法

    公开(公告)号:CN109753619A

    公开(公告)日:2019-05-14

    申请号:CN201811586061.5

    申请日:2018-12-25

    Inventor: 宋建昌 范渊

    Abstract: 本发明涉及网站行业类型识别技术,旨在提供一种网站行业类型快速识别的方法。该种网站行业类型快速识别的方法包括下述步骤:将目标网站依次匹配基础规则,当出现统计分大于或等于100的行业类型时,则将该行业类型作为目标网站的行业类型;当无法利用基础规则判断时,则将目标网站分别匹配所有二级规则,最后将统计分最高的行业类型作为目标网站的行业类型。本发明提供了一套识别行业网站行业类型的完整技术方案,能基于规则匹配识别网站行业类型,并能自动完善规则及对规则进行自动更新,方便大家对行业网站的使用。

    基于流量识别网站指纹的方法

    公开(公告)号:CN110958225B

    公开(公告)日:2022-02-15

    申请号:CN201911089123.6

    申请日:2019-11-08

    Inventor: 宋建昌 范渊

    Abstract: 本发明提供一种基于流量识别网站指纹的方法:包括以下步骤:对镜像端口流量数据进行解析,对镜像的流量数据解析;对抓取的数据包进行识别,判断是否为tcp数据包;对tcp数据包进行解析并配对;判断redis中是否有该ack值对应的key;将步骤1.4中的key取出并与本次响应(ack值)进行组合成一个完整的请求响应包;获取网站指纹信息并储存开发语言,获取开发语言和cms框架并储存。本发明提出基于流量数据分析指纹信息有效的解决了各种防护设备造成的指纹协议识别不到或准确率低的现象。具有高可靠性和高效性的优点。

    基于流量识别网站指纹的方法

    公开(公告)号:CN110958225A

    公开(公告)日:2020-04-03

    申请号:CN201911089123.6

    申请日:2019-11-08

    Inventor: 宋建昌 范渊

    Abstract: 本发明提供一种基于流量识别网站指纹的方法:包括以下步骤:对镜像端口流量数据进行解析,对镜像的流量数据解析;对抓取的数据包进行识别,判断是否为tcp数据包;对tcp数据包进行解析并配对;判断redis中是否有该ack值对应的key;将步骤1.4中的key取出并与本次响应(ack值)进行组合成一个完整的请求响应包;获取网站指纹信息并储存开发语言,获取开发语言和cms框架并储存。本发明提出基于流量数据分析指纹信息有效的解决了各种防护设备造成的指纹协议识别不到或准确率低的现象。具有高可靠性和高效性的优点。

Patent Agency Ranking