一种互联网有害网址检测分析处理方法、装置和存储介质

    公开(公告)号:CN115544494A

    公开(公告)日:2022-12-30

    申请号:CN202211190151.9

    申请日:2022-09-28

    Abstract: 本申请公开了一种互联网有害网址检测分析处理方法、装置和存储介质,其中方法包括获取网址图片和视频;对所述网址图片和视频进行细化处理,所述细化处理包括数据标准化、数据清洗、数据标注、数据分化和数据规模调整;利用视觉大模型对所述网址图片和视频进行特征提取;结合所述网址图片和视频的特征数据集训练所述视觉大模型,并调整所述视觉大模型的参数;使用CSP‑Darknet骨干模型网络对待分析网址进行特征提取并回归出目标位置;对回归到的目标图像进行类别分类,输出有害网址的图像判定结果。本申请能够实现图片与视频数据的统一特征提取,并通过CNN网络构建视觉深度模型,从而大大提升互联网有害内容准确率和适用范围。

    基于深度卷积网络的有害网址分析方法、装置和介质

    公开(公告)号:CN115101089A

    公开(公告)日:2022-09-23

    申请号:CN202210484544.4

    申请日:2022-05-06

    Abstract: 本申请公开了基于深度卷积网络的有害网址分析方法、装置和介质,方法包括:对小样本语音进行预处理;使用预训练好的语音模型对所述小样本语音进行特征提取,得到隐藏层输出的特征向量;对所述特征向量进行深度特征提取,得到深层语义特征;将所述深层语义特征经过所述语音模型的全连接层并分类,进行语音模型的训练和测试。本申请的模型训练基于网址训练,训练所需要的时间和计算资源较少,且面对新的网址检测任务提高了系统的实用价值和处理效率。

    互联网有害事件的检测方法、装置和存储介质

    公开(公告)号:CN116304071A

    公开(公告)日:2023-06-23

    申请号:CN202211323446.9

    申请日:2022-10-27

    Abstract: 本申请公开了互联网有害事件的检测方法、装置和存储介质,本申请构造或更新关键词知识图谱,并将知识图谱划分为若干子图;利用聚类算法将文档聚类到有害事件中;通过更新每个有害事件,将每个有害事件插入到有害故事树中,或者根据有害事件创建一个新的有害故事树,实现了移动互联网和互联网中的有害内容检测和分类,目的是从海量的网页及文档数据中发现有害事件,以在线方式以合理的有害故事树组织有害事件;提出了一种基于知识图谱的两层网页文档聚类算法,从大量的网页文本或网页相关新闻中提取有害事件,在新的网页及文档数据到达后,使用在线算法将事件组织成故事树,在有害事件提取方面比传统基于关键词的恶算法更有效。

    目标风险网站检测方法、装置及存储介质

    公开(公告)号:CN115470488A

    公开(公告)日:2022-12-13

    申请号:CN202211045603.4

    申请日:2022-08-30

    Abstract: 本发明公开了一种目标风险网站检测方法、装置及存储介质,其中该方法包括:爬取待检测网站的第一信息,其中,第一信息包括网页快照、网站源码和网站文本;通过预先训练的BERT模型对网站源码和网站文本进行特征提取,得到网站源码特征信息和网站文本特征信息;通过预先训练的ResNet模型对网页快照进行特征提取,得到网页快照特征信息;基于网站源码特征信息、网站文本特征信息、网页快照特征信息,通过预先训练的目标风险网站检测模型判断待检测网站是否为目标风险网站。以实现以数据为主导的对目标风险网站的检测功能。本发明可广泛应用于风险网站检测领域。

    有害短信分析方法、装置和存储介质

    公开(公告)号:CN115455977A

    公开(公告)日:2022-12-09

    申请号:CN202210926234.3

    申请日:2022-08-03

    Abstract: 本申请公开了有害短信分析方法、装置和存储介质,包括对中文语料进行预处理,获得不同的所述中文语料对应的不同序列;使用盘古模型提取每个序列的词嵌入向量;采用LSTM对所述词嵌入向量进行深层特征提取,获得每一个序列对应的文本深层语义特征;将所述文本深层语义特征经过全连接层和Softmax分类器,进行模型的训练和测试。本申请通过盘古大模型和迁移学习技术,减少所需的有标签的有害短信数据量,训练所需要的时间和计算资源也大大减少,具有更好的适应性,能在短时间内生成可靠的有害短信检测分析模型,提高了通信网有害短信的分析效率。

Patent Agency Ranking