-
公开(公告)号:CN117421573A
公开(公告)日:2024-01-19
申请号:CN202311457081.3
申请日:2023-11-03
Applicant: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
IPC: G06F18/21 , G06F18/214
Abstract: 本申请实施例提供一种用于问答检索模型的训练方法、装置及存储介质。方法包括:确定训练数据集,训练数据集包括多个长问答文本;将每个长问答文本依次输入至编码器,并基于编码器的输出和第一损失函数确定训练数据集的第一损失值;对每个长问答文本进行拆分处理,以得到多个短问答文本;基于第二损失函数和全部的短问答文本确定训练数据集的第二损失值;将多个答句输入至编码器和对抗网络,以通过编码器的输出、对抗网络的输出和第三损失函数确定训练数据集的第三损失值;根据第一损失值、第二损失值和第三损失值确定训练数据集的总损失值;根据总损失值调整权重系数,直至问答检索模型训练完成,提高模型性能和后续问答检索的准确度。
-
公开(公告)号:CN117114009A
公开(公告)日:2023-11-24
申请号:CN202311130569.5
申请日:2023-09-01
Applicant: 郭丽 , 北京天融信网络安全技术有限公司
IPC: G06F40/30 , G06F40/242 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例提供一种用于获取威胁情报数据模型的方法、介质及电子设备,所述方法包括:获取与威胁情报数据对应的关键词词典;通过对BERT模型进行基于知识增强预训练和常规预训练的交替训练,得到用于威胁情报处理BERT模型,其中,所述知识增强预训练的样本数据是采用目标字符掩码令牌替换预训练数据集和验证集中的目标词语,所述目标词语是所述预训练数据集和验证集中包括的所述关键词词典中的词语,所述常规预训练的样本数据是利用目标字符掩码令牌替换所述预训练数据集和所述验证集中的相关字词得到的。本申请的实施例可以有效缓解BERT在训练的过程中由于过度关注专业词汇而导致的模型对文本语义理解能力下降的问题。
-
公开(公告)号:CN116701651A
公开(公告)日:2023-09-05
申请号:CN202310672312.6
申请日:2023-06-07
Applicant: 李明远 , 北京天融信网络安全技术有限公司
Abstract: 本申请实施例提供一种安全实体知识图谱关系推理方法及装置,涉及威胁检测技术领域。该方法包括基于威胁情报日志构建安全实体三元组;基于所述安全实体三元组获取事实数据和反事实数据;根据所述事实数据和反事实数据获取正样本数据和负样本数据;将所述正样本数据和负样本数据分别输入预先训练的预测模型,获得正负样本存在的概率。该方法使用反事实数据增强了知识图谱领域的表达能力,进而提高了在安全知识图谱上的关系预测能力,能够挖掘出安全知识图谱的隐含关系,解决了现有方法缺乏对反事实数据的预测能力的问题。
-
公开(公告)号:CN116545736A
公开(公告)日:2023-08-04
申请号:CN202310622962.X
申请日:2023-05-26
Applicant: 李明远 , 北京天融信网络安全技术有限公司
IPC: H04L9/40 , G06F16/28 , G06F16/901 , G06N5/02 , G06N5/04
Abstract: 本申请提供一种攻击预测方法、装置、电子设备及存储介质,涉及安全技术领域。该方法通过利用Query2Box模型在预先构建的知识图谱中进行推理预测,获得包含当前攻击行为以及后继攻击行为的多条候选攻击路径,从而实现对当前攻击行为的后继攻击行为的预测,由于Query2Box模型可以在大规模和不完整的知识图谱中使用交集、并集等运算符对任意查询进行推理预测,所以能够处理复杂关系的攻击行为,进而可有效提高多步攻击预测的准确性。
-
公开(公告)号:CN117436525A
公开(公告)日:2024-01-23
申请号:CN202311443383.5
申请日:2023-10-31
Applicant: 孙海丽 , 北京天融信网络安全技术有限公司
IPC: G06N5/04 , G06F40/30 , G06F40/284 , G06F40/289 , G06F16/36 , H04L9/40 , G06N3/0464 , G06N3/042 , G06N3/045 , G06N3/0442 , G06N5/022
Abstract: 本申请提供一种网络安全事件推理方法、装置、存储介质及设备,该方法中,获取用于描述目标网络安全事件的语义信息的目标文本语料,并从该目标文本语料中提取出候选事件提及,结合情报库数据构建事件知识图谱后,将目标文本语料的向量和事件知识图谱的向量进行联合嵌入,得到联合嵌入的向量表示,并以此生成目标网络安全事件的评估结果。如此,利用事件知识图谱中的已知事件类型和知识推理,分析出目标网络安全事件对应的事件属性,降低对标注数据的依赖,进而能够实现对少样本甚至零样本安全事件类型的检测和识别。
-
公开(公告)号:CN117319020A
公开(公告)日:2023-12-29
申请号:CN202311230430.8
申请日:2023-09-21
Applicant: 杨潇 , 北京天融信网络安全技术有限公司
IPC: H04L9/40 , G06N3/048 , G06N3/08 , H04L41/147 , H04L41/142 , H04L41/14 , H04L41/16 , H04L41/12
Abstract: 本申请实施例提供一种获取APT多关系预测模型的方法、关系预测方法及装置,所述方法包括:收集APT攻击报告或者相关日志组成原始报告信息集合;将所述原始报告信息集合转换为图结构;重复以下过程,直至对图神经网络的训练过程结束,得到APT多关系预测模型:基于所述图结构和所述图神经网络进行多边关系预测,得到以各实体为起点的多条路径以及每条路径的关系类型;计算与所述多条路径和所述关系类型对应的损失值,并根据所述损失值调整所述图神经网络的参数。采用本申请实施例能推测出实体间的多关系(即多个实体间存在的连接关系),这种新型APT实体多关系预测方案可根据APT实体的特征预测出所有潜在的关联实体,可以有效解决以上不足。
-
公开(公告)号:CN117014207A
公开(公告)日:2023-11-07
申请号:CN202310998264.X
申请日:2023-08-08
Applicant: 王一琁 , 北京天融信网络安全技术有限公司
IPC: H04L9/40 , G06N5/022 , G06F18/231 , G06F40/30
Abstract: 本申请实施例提供一种网络安全本体的构建方法、装置、电子设备及存储介质,该方法包括:获取与网络安全本体的构建需求对应的网络安全数据,其中,网络安全数据至少包括结构化网络安全数据和非结构化网络安全数据;根据结构化网络安全数据,构建与结构化网络安全数据对应的初始多叉树;根据非结构化网络安全数据对初始多叉树进行更新,得到更新后的目标多叉树;根据目标多叉树,生成与网络安全本体的构建需求对应的网络安全本体文件,克服现有技术需要人工进行构建,以及处理数据来源单一,处理数据格式适配性差的问题,提高了生成本体文件的效率。
-
公开(公告)号:CN116881910A
公开(公告)日:2023-10-13
申请号:CN202310904153.8
申请日:2023-07-21
Applicant: 龚开奇 , 北京天融信网络安全技术有限公司
Abstract: 本申请提供一种基于知识图谱关系推理模型的威胁情报推理方法、装置、电子设备和存储介质,其中,基于知识图谱关系推理模型的威胁情报推理方法包括:获取针对恶意软件的查询信息并基于所述查询信息确定目标实体和目标关系;将所述目标实体和所述目标关系作为知识图谱关系推理模型的输入等步骤。本申请实施例能够推理恶意软件的威胁情报,同时,本申请能够提高推理准确率和提高推理效率。
-
公开(公告)号:CN116737850A
公开(公告)日:2023-09-12
申请号:CN202310890911.5
申请日:2023-07-19
Applicant: 杨潇 , 北京天融信网络安全技术有限公司
IPC: G06F16/28 , G06F17/16 , G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本申请提供一种APT实体关系预测的图神经网络模型训练方法,用于输入图神经网络模型的图结构数据,包括:APT实体的原有特征、NER分类以及不同APT实体间的已知实体关系;通过NER(命名实体识别)来检测和分类APT攻击消息中的实体,并用于辅助APT实体的特征表达;通过不同APT实体间的已知实体关系,考虑到了APT实体之间节点信息的交互,使得图神经网络模型推断出的实体关系更能反映出实际情况的复杂性和多样性,提高预测结果准确率。
-
公开(公告)号:CN117421423A
公开(公告)日:2024-01-19
申请号:CN202310884491.X
申请日:2023-07-18
Applicant: 郭丽 , 北京天融信网络安全技术有限公司
IPC: G06F16/36 , G06F16/33 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 本申请实施例提供一种获取实体识别模型的方法、识别实体的方法及装置,该方法包括:获取针对至少一条训练语句的实体标注数据,其中,所述至少一条训练语句为中文威胁情报数据;根据所述至少一条训练语句和所述标注数据对实体识别模型进行训练,以完成对所述实体识别模型的训练得到目标实体识别模型,其中,所述实体识别模型被配置为至少通过挖掘实体内部规律从任一条训练语句中找到各实体并得到各实体类别,所述实体内部规律是通过分析相应实体内的各字符获取的。本申请的一些实施例将实体内部规律挖掘模块融合到中文威胁情报的实体识别模型中,该模块用于捕获每个实体内部的潜在的命名规律,从而更好的进行实体类型的预测。
-
-
-
-
-
-
-
-
-