发明公开
- 专利标题: 一种面向多源威胁情报的实体识别及关系抽取方法
-
申请号: CN202310126446.8申请日: 2023-02-16
-
公开(公告)号: CN116362246A公开(公告)日: 2023-06-30
- 发明人: 程克非 , 李宗良 , 陈京浩 , 张亮 , 李琳
- 申请人: 重庆邮电大学
- 申请人地址: 重庆市南岸区南山街道崇文路2号
- 专利权人: 重庆邮电大学
- 当前专利权人: 重庆邮电大学
- 当前专利权人地址: 重庆市南岸区南山街道崇文路2号
- 代理机构: 重庆辉腾律师事务所
- 代理商 卢胜斌
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/30 ; G06F18/214 ; G06F18/2415 ; G06N7/01 ; G06N3/045 ; G06N3/0442 ; G06N3/0464 ; G06N3/048 ; G06N3/084
摘要:
本发明涉及一种面向多源威胁情报的实体识别及关系抽取方法,包括:获取与APT攻击相关的原始情报文本数据,并采用YEEDA对原始文本数据中的实体进行标注得到标注语料文本数据;构建实体识别模型和实体关系抽取模型,将标注语料文本数据做为训练样本对实体识别模型和实体关系抽取模型进行训练;获取目标情报文本数据,将目标情报文本数据输入训练好的实体识别模型和实体关系抽取模型,通过实体识别模型识别出目标情报文本中的实体;通过实体关系抽取模型抽取目标情报文本中实体之间的关系,本发明通过实体识别模型和实体关系抽取模型能够自动且准确的识别出文本中的实体与实体之间的关系,及时的发现网络攻击,提高网络的安全。