-
公开(公告)号:CN106055633A
公开(公告)日:2016-10-26
申请号:CN201610367978.0
申请日:2016-05-30
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F16/35 , G06K9/6256 , G06K9/6269
Abstract: 本发明提出了一种中文微博主客观句分类方法,所述方法包括:根据预设的主观句训练语料集和客观句训练语料集形成如下的六个特征集:3‑POS主观模式特征集、句法依存关系特征集、情感词特征集、情感影响因子特征集、语气词及标点符号特征集、字数及链接特征集;根据所述六个特征集,利用支持向量机SVM算法,形成中文微博主客观句分类模型,以利用所述中文微博主客观句分类模型对待测试语句进行主客观句分类。所述方法不但考虑了中文文本的语言学特点,同时也充分利用微博的个性化特征,使得本文所选取的特征更加接近微博本身的语义描述。
-
公开(公告)号:CN105069169A
公开(公告)日:2015-11-18
申请号:CN201510547203.7
申请日:2015-08-31
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明提出了一种网站镜像的检测方法及装置。所述检测方法包括:计算待检测网站的标题信息与原始网站的标题信息的相似度,若所述相似度超过设定阈值,则所述待检测网站为疑似网站;比对所述疑似网站的网页结构中的可视化元素和所述原始网站的网页结构中的可视化元素,若满足预设条件,则判定所述疑似网站为镜像网站,在保证检测准确性的同时,提高网站镜像检测的效率。
-
公开(公告)号:CN116304051A
公开(公告)日:2023-06-23
申请号:CN202310286372.4
申请日:2023-03-22
Applicant: 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司 , 北京网御星云信息技术有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/289 , G06F40/205
Abstract: 本申请提供一种融合局部关键信息和预训练的文本分类方法,包括:选择与任务数据匹配程度最高的预训练模型作为第一预训练模型;使用任务数据对第一预训练模型进行进一步预训练,获得第二预训练模型,利用第二预训练模型从文本中抽取关键词序列,设置文本的局部属性共有n种,文本分类共有m种,将每种局部属性下的每种文本分类都作为一种局部关键类别,则能够得到n*m种局部关键类别;将通过第二预训练模型得到的全文表示向量和所有局部属性下的局部表示向量进行向量合并,得到文本的最终表示向量,对文本的最终表示向量进行关于任务数据的标注质量的评估,对评估通过后的文本的最终表示向量进行分类。本申请提高了分类效率和准确性。
-
公开(公告)号:CN111740946B
公开(公告)日:2023-04-25
申请号:CN202010387880.8
申请日:2020-05-09
Applicant: 郑州启明星辰信息安全技术有限公司 , 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司
IPC: H04L69/22 , H04L9/40 , H04L67/02 , G06F18/214 , G06F18/2431
Abstract: 本发明实施例公开了一种Webshell报文的检测方法及装置,其中该方法包括:根据待测HTTP报文的类型从所述待测HTTP报文中提取所述类型对应的预设报文头字段;对提取的所述类型对应的报文头字段进行特征构造,生成所述类型对应的报文头特征;根据生成的所述类型对应的报文头特征,以及所述类型对应的预先训练好的决策树模型,确定所述待测HTTP报文的Webshell检测结果。如此,基于HTTP报文的报文头特征来检测Webshell,使得Webshell检测不受代码混淆与报文加密等的影响。
-
公开(公告)号:CN115085992A
公开(公告)日:2022-09-20
申请号:CN202210649186.8
申请日:2022-06-09
Applicant: 北京启明星辰信息安全技术有限公司 , 北京网御星云信息技术有限公司
Abstract: 本申请提供一种恶意HTTPS隐秘通道的检测系统及其检测方法,包括流量模块、HTTPS模块和安全检测模块;所述流量模块存储有流量信息,所述流量信息包括会话信息和历史流量信息;所述HTTPS模块能够根据获得的流量信息得到HTTPS隐蔽通道信息;所述HTTPS隐蔽通道信息包括HTTPS元数据、SSL元数据和SNI元数据;所述安全检测模块包括心跳检测模块、证书检测模块、指纹检测模块和SNI检测模块,根据安全检测模块获得的心跳异常五元组、证书异常五元组、指纹异常五元组和SNI异常五元组的信息,综合判断是否为恶意HTTPS隐秘通道。本申请提高了网络安全性,能够对恶意HTTPS隐秘通道进行及时报警。
-
公开(公告)号:CN117931841A
公开(公告)日:2024-04-26
申请号:CN202410065536.5
申请日:2024-01-17
Applicant: 北京启明星辰信息安全技术有限公司 , 北京网御星云信息技术有限公司
IPC: G06F16/242 , G06F16/2455 , G06F40/295 , G06F40/30
Abstract: 一种基于数据增强和大语言模型的语言转化装置和方法,该方法利用数据增强技术提高训练数据的数量、多样性和质量;为了提升模型预测的效果,将Text‑To‑SQL任务进行步骤的拆分,并使用大模型对每个步骤逐个加以解决,从而得到自然语言对应的SQL查询语句。该方法具有针对不同阶段进行针对性的优化、模型泛化能力强等优点,特别适合Text‑To‑SQL的应用落地。
-
公开(公告)号:CN116578804A
公开(公告)日:2023-08-11
申请号:CN202310631403.5
申请日:2023-05-30
Applicant: 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司 , 北京网御星云信息技术有限公司
IPC: G06F16/958 , G06F16/955 , G06F18/214 , G06N3/048 , G06N3/08
Abstract: 本申请提供了一种网站安全检测方法、装置和存储介质。该方法包括:采用统一资源定位符URL数据的预训练模型对待分类的网站的URL数据进行语义表示信息的提取;其中,所述URL数据的预训练模型是基于所述目标网站的URL数据预训练生成的;采用全连接层与softmax层基于所述语义表示信息确定所述待分类的网站是恶意网站的分类概率。上述方案可以检测网站的安全性,降低用户登录仿冒正常网站的恶意网站的概率。
-
公开(公告)号:CN111881289A
公开(公告)日:2020-11-03
申请号:CN202010523818.7
申请日:2020-06-10
Applicant: 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司
IPC: G06F16/35
Abstract: 本发明实施例公开了一种分类模型的训练方法、数据风险类别的检测方法及装置,其中该训练方法,包括:对原始训练数据进行数据增强得到新的数据类型的训练数据,所述原始训练数据包括数据类型为恶意数据的训练数据以及数据类型为正常数据的训练数据;根据全部训练数据对分类模型进行训练。如此,通过引入新的数据类型的训练数据解决了数据类别不均衡的问题,从而提升了机器学习的效果。
-
公开(公告)号:CN111753290B
公开(公告)日:2024-05-28
申请号:CN202010454339.4
申请日:2020-05-26
Applicant: 郑州启明星辰信息安全技术有限公司 , 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司
IPC: G06F21/53 , G06F21/56 , G06F18/214 , G06F18/241 , G06F18/25
Abstract: 本发明实施例公开了一种软件类型的检测方法及相关设备,其中方法之一包括:确定待检测软件的灰度图特征和动态API序列特征;将所述待检测软件的灰度图特征和动态API序列特征进行拼接得到所述待检测软件的融合特征;将所述待检测软件的融合特征输入预先训练好的第一软件识别模型,输出所述待检测软件的第一类型。如此,通过训练和识别软件的融合特征来进行检测,能够大大提高软件类型识别的准确率。
-
公开(公告)号:CN118051594A
公开(公告)日:2024-05-17
申请号:CN202410215357.5
申请日:2024-02-27
Applicant: 北京启明星辰信息安全技术有限公司 , 北京网御星云信息技术有限公司 , 启明星辰信息技术集团股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/205
Abstract: 一种SQL语句处理模型构造、SQL语句生成方法及装置,包括:获取多条样本问答语句,并对每条样本问答语句,都利用预先建立的提示问答语句集合构造其对应的训练样本;其中,提示问答语句集合包括:多种难度类型的提示问答语句,每条样本问答语句、每条提示问答语句均包括:基于自然语言形式的问题语句以及SQL语句形式的答案语句,每条所述样本问答语句、每条所述提示问答语句均包括:基于自然语言形式的问题语句以及SQL语句形式的答案语句;利用构造的训练样本训练语言大模型,得到SQL语句处理模型。本申请实施例利用不同难度的提示问答语句丰富了提示信息,因此提升了据此构造的模型的学习效果,提高了模型SQL语句生成的准确率。
-
-
-
-
-
-
-
-
-