- 专利标题: 一种基于LLM模型的相似资产指纹提取方法
-
申请号: CN202410498809.5申请日: 2024-04-24
-
公开(公告)号: CN118069778A公开(公告)日: 2024-05-24
- 发明人: 刘洋 , 俞祥基 , 代先勇 , 邓金祥 , 毛浩任 , 杨明东 , 曾小军 , 叶子豪 , 李靖
- 申请人: 成都锋卫科技有限公司
- 申请人地址: 四川省成都市高新区天府大道北段1700号7栋1单元21楼2119号
- 专利权人: 成都锋卫科技有限公司
- 当前专利权人: 成都锋卫科技有限公司
- 当前专利权人地址: 四川省成都市高新区天府大道北段1700号7栋1单元21楼2119号
- 代理机构: 成都贞元会专知识产权代理有限公司
- 代理商 韦海英
- 主分类号: G06F16/31
- IPC分类号: G06F16/31 ; G06F16/33 ; G06F16/35 ; G06F40/284 ; G06F18/231 ; G06F18/2413 ; G06N3/0455 ; G06N3/0895 ; H04L9/40 ; H04L43/026 ; H04L43/0876 ; H04L43/10
摘要:
本发明公开了一种基于LLM模型的相似资产指纹提取方法,包括以下步骤:S1:构建网络资产banner信息数据库;S2:构建分词器消除banner文本信息的歧义;S3:训练语言模型;S4:对每个向量表示的banner文本信息进行聚类;S5:构建资产指纹信息的矢量数据库;S6:从每个聚类中抽取n个样本,将样本的向量与矢量数据库中的向量进行相似匹配;S7:将相似匹配完成的样本的向量与矢量数据库中数据集的向量作为提示输入LLM模型中,LLM模型输出正则匹配式;S8:将LL模型的输出数据存储至资产指纹库中,完成提取,本申请首次将融合RAG技术的LLM模型应用在相似资产指纹提取领域中,更好的提升了LLM模型提取资产指纹规则的能力。
公开/授权文献
- CN118069778B 一种基于LLM模型的相似资产指纹提取方法 公开/授权日:2024-07-23