-
公开(公告)号:CN116304051A
公开(公告)日:2023-06-23
申请号:CN202310286372.4
申请日:2023-03-22
Applicant: 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司 , 北京网御星云信息技术有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/289 , G06F40/205
Abstract: 本申请提供一种融合局部关键信息和预训练的文本分类方法,包括:选择与任务数据匹配程度最高的预训练模型作为第一预训练模型;使用任务数据对第一预训练模型进行进一步预训练,获得第二预训练模型,利用第二预训练模型从文本中抽取关键词序列,设置文本的局部属性共有n种,文本分类共有m种,将每种局部属性下的每种文本分类都作为一种局部关键类别,则能够得到n*m种局部关键类别;将通过第二预训练模型得到的全文表示向量和所有局部属性下的局部表示向量进行向量合并,得到文本的最终表示向量,对文本的最终表示向量进行关于任务数据的标注质量的评估,对评估通过后的文本的最终表示向量进行分类。本申请提高了分类效率和准确性。
-
公开(公告)号:CN111740946B
公开(公告)日:2023-04-25
申请号:CN202010387880.8
申请日:2020-05-09
Applicant: 郑州启明星辰信息安全技术有限公司 , 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司
IPC: H04L69/22 , H04L9/40 , H04L67/02 , G06F18/214 , G06F18/2431
Abstract: 本发明实施例公开了一种Webshell报文的检测方法及装置,其中该方法包括:根据待测HTTP报文的类型从所述待测HTTP报文中提取所述类型对应的预设报文头字段;对提取的所述类型对应的报文头字段进行特征构造,生成所述类型对应的报文头特征;根据生成的所述类型对应的报文头特征,以及所述类型对应的预先训练好的决策树模型,确定所述待测HTTP报文的Webshell检测结果。如此,基于HTTP报文的报文头特征来检测Webshell,使得Webshell检测不受代码混淆与报文加密等的影响。
-
公开(公告)号:CN116578804A
公开(公告)日:2023-08-11
申请号:CN202310631403.5
申请日:2023-05-30
Applicant: 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司 , 北京网御星云信息技术有限公司
IPC: G06F16/958 , G06F16/955 , G06F18/214 , G06N3/048 , G06N3/08
Abstract: 本申请提供了一种网站安全检测方法、装置和存储介质。该方法包括:采用统一资源定位符URL数据的预训练模型对待分类的网站的URL数据进行语义表示信息的提取;其中,所述URL数据的预训练模型是基于所述目标网站的URL数据预训练生成的;采用全连接层与softmax层基于所述语义表示信息确定所述待分类的网站是恶意网站的分类概率。上述方案可以检测网站的安全性,降低用户登录仿冒正常网站的恶意网站的概率。
-
公开(公告)号:CN111881289A
公开(公告)日:2020-11-03
申请号:CN202010523818.7
申请日:2020-06-10
Applicant: 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司
IPC: G06F16/35
Abstract: 本发明实施例公开了一种分类模型的训练方法、数据风险类别的检测方法及装置,其中该训练方法,包括:对原始训练数据进行数据增强得到新的数据类型的训练数据,所述原始训练数据包括数据类型为恶意数据的训练数据以及数据类型为正常数据的训练数据;根据全部训练数据对分类模型进行训练。如此,通过引入新的数据类型的训练数据解决了数据类别不均衡的问题,从而提升了机器学习的效果。
-
公开(公告)号:CN111753290B
公开(公告)日:2024-05-28
申请号:CN202010454339.4
申请日:2020-05-26
Applicant: 郑州启明星辰信息安全技术有限公司 , 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司
IPC: G06F21/53 , G06F21/56 , G06F18/214 , G06F18/241 , G06F18/25
Abstract: 本发明实施例公开了一种软件类型的检测方法及相关设备,其中方法之一包括:确定待检测软件的灰度图特征和动态API序列特征;将所述待检测软件的灰度图特征和动态API序列特征进行拼接得到所述待检测软件的融合特征;将所述待检测软件的融合特征输入预先训练好的第一软件识别模型,输出所述待检测软件的第一类型。如此,通过训练和识别软件的融合特征来进行检测,能够大大提高软件类型识别的准确率。
-
公开(公告)号:CN118051594A
公开(公告)日:2024-05-17
申请号:CN202410215357.5
申请日:2024-02-27
Applicant: 北京启明星辰信息安全技术有限公司 , 北京网御星云信息技术有限公司 , 启明星辰信息技术集团股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/205
Abstract: 一种SQL语句处理模型构造、SQL语句生成方法及装置,包括:获取多条样本问答语句,并对每条样本问答语句,都利用预先建立的提示问答语句集合构造其对应的训练样本;其中,提示问答语句集合包括:多种难度类型的提示问答语句,每条样本问答语句、每条提示问答语句均包括:基于自然语言形式的问题语句以及SQL语句形式的答案语句,每条所述样本问答语句、每条所述提示问答语句均包括:基于自然语言形式的问题语句以及SQL语句形式的答案语句;利用构造的训练样本训练语言大模型,得到SQL语句处理模型。本申请实施例利用不同难度的提示问答语句丰富了提示信息,因此提升了据此构造的模型的学习效果,提高了模型SQL语句生成的准确率。
-
公开(公告)号:CN111881289B
公开(公告)日:2023-09-08
申请号:CN202010523818.7
申请日:2020-06-10
Applicant: 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司
IPC: G06F16/35
Abstract: 本发明实施例公开了一种分类模型的训练方法、数据风险类别的检测方法及装置,其中该训练方法,包括:对原始训练数据进行数据增强得到新的数据类型的训练数据,所述原始训练数据包括数据类型为恶意数据的训练数据以及数据类型为正常数据的训练数据;根据全部训练数据对分类模型进行训练。如此,通过引入新的数据类型的训练数据解决了数据类别不均衡的问题,从而提升了机器学习的效果。
-
公开(公告)号:CN111753290A
公开(公告)日:2020-10-09
申请号:CN202010454339.4
申请日:2020-05-26
Applicant: 郑州启明星辰信息安全技术有限公司 , 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司
Abstract: 本发明实施例公开了一种软件类型的检测方法及相关设备,其中方法之一包括:确定待检测软件的灰度图特征和动态API序列特征;将所述待检测软件的灰度图特征和动态API序列特征进行拼接得到所述待检测软件的融合特征;将所述待检测软件的融合特征输入预先训练好的第一软件识别模型,输出所述待检测软件的第一类型。如此,通过训练和识别软件的融合特征来进行检测,能够大大提高软件类型识别的准确率。
-
公开(公告)号:CN113139187A
公开(公告)日:2021-07-20
申请号:CN202110436623.3
申请日:2021-04-22
Applicant: 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司
Inventor: 刘洋
Abstract: 本发明实施例公开了一种预训练语言模型的生成、检测方法及装置,包括:获取多个训练用的动态API指令序列;分别对所获取的每个API指令序列按照预定的编码规则进行编码,得到多个API指令编码序列;根据所述多个API指令编码序列对预设的语言模型进行训练,得到预训练语言模型。
-
公开(公告)号:CN106650453A
公开(公告)日:2017-05-10
申请号:CN201611263964.0
申请日:2016-12-30
Applicant: 北京启明星辰信息安全技术有限公司 , 启明星辰信息技术集团股份有限公司
IPC: G06F21/56
Abstract: 本申请提供了一种检测方法和装置,本发明中没有像现有技术中一样,直接查找是否具有恶意的字节,即没有直接对二进制形式的代码进行分析,而是将具有二进制形式的代码的格式转换成具有字符串形式的代码,进而对具有字符串形式的代码进行特征分析,由于现有技术中形式改变后的恶意的字节对应的具有字符串形式的代码是不变的,采用本发明中的方案就能够避免恶意的字节的形式改变后,采用特征码和人工规则的识别方法来检测flash文件中是否携带有恶意代码时,不能判断flash文件是否是恶意文件的问题。
-
-
-
-
-
-
-
-
-