-
公开(公告)号:CN113688346A
公开(公告)日:2021-11-23
申请号:CN202110937883.9
申请日:2021-08-16
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06F16/958 , G06F21/55 , G06F40/30 , G06K9/32
Abstract: 本申请公开了一种违法网站识别方法、装置、设备及存储介质。该方法包括:获取网站数据;通过语义识别从所述网站数据中筛选出包含违法文本内容的目标网站,并对所述目标网站的网页进行截图操作以得到待识别图片;通过图像识别确定所述待识别图片对应的目标网站的网站类型;所述网站类型包括黑产网站和被篡改的门户网站。通过语义识别粗略筛选出存在风险的目标网站,然后再通过图像识别从存在风险的目标网站中精确的判读出黑产网站,结合语义的文本粗略筛选和图像的精准筛选,可以快速准确的从海量的互联网数据中识别出黑产网站。