-
公开(公告)号:CN116186211A
公开(公告)日:2023-05-30
申请号:CN202211631371.0
申请日:2022-12-19
Applicant: 北京航空航天大学 , 中关村融智企业管理创新推广中心
IPC: G06F16/332 , G06F16/36 , G06F16/953 , G06F40/279
Abstract: 本发明公开了一种文本攻击性检测和转换的方法,包括:获取待处理文本数据,将所述待处理文本输入预训练BERT模型,获取序列词向量;构建双塔攻击性检测模型,将所述序列词向量输入所述双塔攻击性检测模型进行攻击性检测,获取攻击性词汇的位置;基于所述攻击性词汇的位置,确定攻击性语句的位置;构建攻击性文本转换模型,基于所述攻击性文本转换模型对所述攻击性语句进行去攻击性处理,生成无攻击性文本。本发明综合利用了文本向量化表示、召回模型、文本转换等技术,可以检测攻击性文本并识别出攻击性词汇,进而去攻击性转化得到目标文本,对进一步研究文本攻击性检测和转化提供了关键基础。
-
公开(公告)号:CN116186211B
公开(公告)日:2023-07-25
申请号:CN202211631371.0
申请日:2022-12-19
Applicant: 北京航空航天大学 , 中关村融智企业管理创新推广中心
IPC: G06F16/332 , G06F16/36 , G06F16/953 , G06F40/279
Abstract: 本发明公开了一种文本攻击性检测和转换的方法,包括:获取待处理文本数据,将所述待处理文本输入预训练BERT模型,获取序列词向量;构建双塔攻击性检测模型,将所述序列词向量输入所述双塔攻击性检测模型进行攻击性检测,获取攻击性词汇的位置;基于所述攻击性词汇的位置,确定攻击性语句的位置;构建攻击性文本转换模型,基于所述攻击性文本转换模型对所述攻击性语句进行去攻击性处理,生成无攻击性文本。本发明综合利用了文本向量化表示、召回模型、文本转换等技术,可以检测攻击性文本并识别出攻击性词汇,进而去攻击性转化得到目标文本,对进一步研究文本攻击性检测和转化提供了关键基础。
-
公开(公告)号:CN116187329A
公开(公告)日:2023-05-30
申请号:CN202211631598.5
申请日:2022-12-19
Applicant: 北京航空航天大学 , 中关村融智企业管理创新推广中心
IPC: G06F40/295 , G06F40/216 , G06N3/049 , G06N3/08 , G06N3/0442
Abstract: 本发明涉及一种基于图卷积网络的联合抽取模型的分类方法,包括:初始化输入的语句,获取嵌入结果,将嵌入结果输入到神经网络中进行编码,获得语句的编码结果;通过编码结果计算注意力评分,基于注意力机制对注意力评分进行处理,使用门控机制获得语句整体表示结果;将整体表示结果针对特定关系进行解码,选择出最优标签,完成分类任务。本发明综合了图神经网络、注意力机制、命名实体识别、关系抽取等技术,提升了RSAN模型中句子特征的质量与整体模型效果,对联合抽取的研究有着重要意义。
-
公开(公告)号:CN119646130A
公开(公告)日:2025-03-18
申请号:CN202411524678.X
申请日:2024-10-30
Applicant: 中关村融智企业管理创新推广中心 , 北京大船科技有限公司
IPC: G06F16/3329 , G06F16/334 , G06N5/04 , G06F16/36 , G06N5/025
Abstract: 本发明属于机器学习技术领域,具体涉及一种基于知识增强大模型的问答系统设计方法,包括以下步骤:S1:领域内文本数据采集;S2:数据预处理;S3:构建知识图谱;S4:知识图谱增强大语言模型框架设计;S5:问答系统构建;采用该设计方法,我们得到一种基于知识增强大模型的问答系统,包括:数据采集模块,数据预处理模块、知识图谱构建模块、数据库、大语言模型层、展示层和前端UI,对于使用者,不需要了解复杂的架构,只需要输入想问的问题,系统便输出经知识图谱增强的大语言模型的回答。本发明通过知识图谱对大语言模型的知识增强,借助该大语言模型问答链可减少幻觉问题,提高回答领域内问题时的规范性与准确性。
-
公开(公告)号:CN119514678A
公开(公告)日:2025-02-25
申请号:CN202411524822.X
申请日:2024-10-30
Applicant: 中关村融智企业管理创新推广中心 , 北京大船科技有限公司
IPC: G06N5/04 , G06N5/022 , G06F18/214 , G06N3/045 , G06N3/08 , G06F40/205 , G06F40/289
Abstract: 本发明属于计算机科学技术领域,具体涉及一种基于思维链的网络安全知识推理方法,所述方法包括以下步骤:S1:筛选网络安全学术资料,将筛选得到的资料进行统一格式化处理,得到用于大模型预训练的网络安全数据语料;S2:进行网络安全语料训练;利用PEFT技术与FlashAttention2技术对基础大模型进行网络安全语料训练;S3:利用当前的思维链提示理论知识进行思维链提示样例设计;S4:思维链提示方法的设计。本发明能够在结合了现有大模型的基础上,将思维链的零样本推理与少样本推理方法相结合,训练精调一个性能较为优秀的网络安全大模型。
-
公开(公告)号:CN116187329B
公开(公告)日:2024-09-27
申请号:CN202211631598.5
申请日:2022-12-19
Applicant: 北京航空航天大学 , 中关村融智企业管理创新推广中心
IPC: G06F40/295 , G06F40/216 , G06N3/049 , G06N3/08 , G06N3/0442
Abstract: 本发明涉及一种基于图卷积网络的联合抽取模型的分类方法,包括:初始化输入的语句,获取嵌入结果,将嵌入结果输入到神经网络中进行编码,获得语句的编码结果;通过编码结果计算注意力评分,基于注意力机制对注意力评分进行处理,使用门控机制获得语句整体表示结果;将整体表示结果针对特定关系进行解码,选择出最优标签,完成分类任务。本发明综合了图神经网络、注意力机制、命名实体识别、关系抽取等技术,提升了RSAN模型中句子特征的质量与整体模型效果,对联合抽取的研究有着重要意义。
-
-
-
-
-