-
公开(公告)号:CN114090775A
公开(公告)日:2022-02-25
申请号:CN202111376161.7
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 李高翔 , 黄福鸿 , 卓采标 , 廖淑敏 , 杨慧强 , 宋宜昌 , 黄正国 , 周毅 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: G06F16/35 , G06F16/33 , G06F16/951 , G06F16/957
Abstract: 本发明属于网页文本处理领域,具体涉及一种基于BERT算法的网页有害文本识别方法及系统,所述识别方法包括:步骤1:使用网络爬虫爬取网页原始内容,得到初始文本;步骤2:基于HTML协议对初始文本进行文本整理,得到待识别文本集合;步骤3:将待识别文本集合输入到基于BERT中文预训练模型训练得到的有害信息识别模型中进行有害文本识别,得到识别结果;步骤4:对识别结果进行人工验证,并基于得到的异常识别样本更新有害信息识别模型。上述方法不仅准确提取有效的网页文本,利用已有的有害文本判断模型实现网页文本内容识别,同时还通过人工校正对有害文本判断模型进行训练更新,进一步提升有害文本判断模型的准确性。
-
公开(公告)号:CN114143290B
公开(公告)日:2024-01-30
申请号:CN202111407941.3
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 黄福鸿 , 李高翔 , 卓采标 , 杨慧强 , 廖淑敏 , 宋宜昌 , 周毅 , 黄正国 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: H04L61/5061 , H04L61/5007 , H04L61/5053 , H04L67/56 , G06F16/951
Abstract: 本发明属于IP代理技术领域,具体涉及一种多网站并行爬取的IP代理池的构建系统和方法,所述构建系统包括:IP验证模块,用于对初始IP集合内的代理IP进行代理可用性验证,并将可用的代理IP置入有效队列中,得到有效IP集合;IP标记模块,用于对有效IP集合内的代理IP进行逐一标记,得到具有标记信息的标记IP集合;IP组合模块,用于获取若干待爬取网站信息并为每个待爬取网站构建对应的网站代理IP队列,还用于基于待爬取网站信息在标记IP集合中挑取标记信息与其匹配的代理IP,并将挑取的代理IP置入与其匹配的网站代理IP队列中。上述构建系统构建了多网站并行爬取代理池,实现了多网站并行爬取,进而提高代理IP的利用率以及爬取成功率。
-
公开(公告)号:CN114143290A
公开(公告)日:2022-03-04
申请号:CN202111407941.3
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 黄福鸿 , 李高翔 , 卓采标 , 杨慧强 , 廖淑敏 , 宋宜昌 , 周毅 , 黄正国 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: H04L61/5061 , H04L61/5007 , H04L61/5053 , H04L67/56 , G06F16/951
Abstract: 本发明属于IP代理技术领域,具体涉及一种多网站并行爬取的IP代理池的构建系统和方法,所述构建系统包括:IP验证模块,用于对初始IP集合内的代理IP进行代理可用性验证,并将可用的代理IP置入有效队列中,得到有效IP集合;IP标记模块,用于对有效IP集合内的代理IP进行逐一标记,得到具有标记信息的标记IP集合;IP组合模块,用于获取若干待爬取网站信息并为每个待爬取网站构建对应的网站代理IP队列,还用于基于待爬取网站信息在标记IP集合中挑取标记信息与其匹配的代理IP,并将挑取的代理IP置入与其匹配的网站代理IP队列中。上述构建系统构建了多网站并行爬取代理池,实现了多网站并行爬取,进而提高代理IP的利用率以及爬取成功率。
-
公开(公告)号:CN117273007A
公开(公告)日:2023-12-22
申请号:CN202311058080.1
申请日:2023-08-21
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: G06F40/30 , G06F40/284 , G06N3/08
Abstract: 本发明提供一种人工智能内容合成安全方法和系统,通过在内容生成之前和内容生成之后两次安全性检查,确保人工智能生成的内容不包含恶意信息,同时还会对生成的内容通过语义分析的方式预测其可能的走向是否会包含恶意信息,只有在这些安全性检查都符合安全要求的情况下,才会将内容输出,克服现有技术只进行了简单的安全检查,存在较大安全隐患的问题。
-
公开(公告)号:CN116110407A
公开(公告)日:2023-05-12
申请号:CN202211590817.X
申请日:2022-12-12
Applicant: 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及娇喘音频检测领域,尤其涉及一种基于融合技术的娇喘音频检测方法,包括:利用待检测音频进行初始化处理得到待检测初始化音频;利用所述待检测初始化音频获取待检测初始化音频语谱特征;利用所述待检测初始化音频语谱特征得到娇喘音频检测结果,在娇喘音频中加入对音频种类的判断,通过分类器一过滤掉一部分不属于人声的音频,并把语音种类信息特征融入娇喘音频分类特征中,提高娇喘音频识别的准确率。
-
公开(公告)号:CN115019234A
公开(公告)日:2022-09-06
申请号:CN202210685000.4
申请日:2022-06-15
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: G06V20/40 , G06V20/70 , G06N3/04 , G06V10/82 , G06V10/764 , G06V10/762 , G06V10/74 , G06V10/46 , G06F17/18 , G06F17/16
Abstract: 本发明提供一种改进的场景内容检测的方法和系统,通过提取多媒体数据中的多种特征,将多种特征按不同维度输入神经网络模型,得到经过机器学习后的高维度向量矩阵,再经由状态链模型,得到显性特征分布区域,进而确定出需要的语义特征集合,最后确定出不同场景划分的分界线,实现精确地分段内容检测,并且减少了运算量。
-
公开(公告)号:CN116596689A
公开(公告)日:2023-08-15
申请号:CN202211008575.9
申请日:2022-08-22
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: G06Q50/00 , G06F40/126 , G06F40/205 , G06F16/35 , G06F18/25 , G06F18/241 , H04L45/00
Abstract: 本发明提供一种基于传播网络与内容融合的检测方法和系统,通过传播网络确定监测路由器,由该监测路由器对用户属性特征、结构特征和源内容特征三种特征进行不同的编码后,再融合检测和分类,最后由控制中心依据分类信息和转发状态来分析是否受到攻击,解决现有技术无法适应网络社交媒体丰富多变的内容形式以及特点不断演化的问题。
-
公开(公告)号:CN116310704A
公开(公告)日:2023-06-23
申请号:CN202211614696.8
申请日:2022-12-15
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: G06V10/82 , G06V10/40 , G06V10/74 , G06V10/764 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明涉及图片内容安全检测领域,尤其涉及一种基于目标检测技术的图片内容安全检测方法,包括:获取历史检测目标图片建立历史图片内容数据库;利用所述历史图片内容数据库建立图片内容推理模型;利用所述图片内容推理模型得到图片内容安全检测结果,针对图片中存在的大小目标进行检测,对发生形变的目标亦具有较好的检测能力。相比于传统的提取图片特征点进行比对的方式,具有准确率和效率的优势。
-
公开(公告)号:CN115604462A
公开(公告)日:2023-01-13
申请号:CN202211091544.4
申请日:2022-09-07
Applicant: 天津市国瑞数码安全系统股份有限公司(CN)
IPC: H04N19/105 , H04N19/136 , H04N19/146 , H04N19/503 , H04N19/70 , G06V20/40 , G06V10/77
Abstract: 本发明提供一种应用成分分析的视频压缩方法和系统,通过采用主成分分析算法对视频关键帧筛选,并结合帧差值运算,形成两重视频关键帧的筛选机制,使视频子空间的相关性最小化,从而最大限度的实现视频压缩,克服现有技术压缩率低、丢失信息严重的问题。
-
公开(公告)号:CN114024912A
公开(公告)日:2022-02-08
申请号:CN202111301648.9
申请日:2021-11-04
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: H04L47/2441 , H04L47/2483 , H04L67/1001
Abstract: 本发明涉及一种基于改造CHAMELEON算法的网络流量应用识别分析方法及系统,所述一种基于改造CHAMELEON算法的网络流量应用识别分析方法包括:采集原始网络流量数据进行解析得到网络流量解析数据;利用所述网络流量解析数据识别分析网络流量应用,提升了识别的准确度,论证了流量特征属性特征值之间的联系,保证了实时性以及选取数据的代表性,权衡各个指标的要求以达到系统的总体性能最优化。
-
-
-
-
-
-
-
-
-