-
公开(公告)号:CN115277211B
公开(公告)日:2023-07-28
申请号:CN202210902478.8
申请日:2022-07-29
Applicant: 哈尔滨工业大学(威海)
IPC: H04L9/40 , H04L61/4511 , G06F16/35 , G06F16/955 , G06V20/62
Abstract: 本发明提供一种基于文本和图像多模态色情和赌博域名自动检测方法,其针对色情、赌博网页的识别,利用深度学习和统计学习相结合的方法来实现对网页数据进行特征抽取,使用长距离多头自注意力的视觉语言模型的方法对网页进行识别,其针对网页所显示的内容丰富且包含大量图片与超长文本的特点进行多模态信息融合,从网页文本和网页截图两个维度对网页进行特征抽取。本发明可广泛用于基于文本和图像多模态色情和赌博域名自动检测中。
-
公开(公告)号:CN115277211A
公开(公告)日:2022-11-01
申请号:CN202210902478.8
申请日:2022-07-29
Applicant: 哈尔滨工业大学(威海)
IPC: H04L9/40 , H04L61/4511 , G06F16/35 , G06F16/955 , G06V20/62
Abstract: 本发明提供一种基于文本和图像多模态色情和赌博域名自动检测方法,其针对色情、赌博网页的识别,利用深度学习和统计学习相结合的方法来实现对网页数据进行特征抽取,使用基于稀疏多头自注意力的文本图像多模态模型的方法对网页进行识别,其针对网页所显示的内容丰富且包含大量图片与超长文本的特点进行多模态信息融合,从网页文本和网页截图两个维度对网页进行特征抽取。本发明可广泛用于基于文本和图像多模态色情和赌博域名自动检测中。
-