-
公开(公告)号:CN113918952B
公开(公告)日:2024-08-13
申请号:CN202111009625.0
申请日:2021-08-31
Applicant: 暨南大学
Abstract: 本发明公开了C或C++代码漏洞检测方法、系统、计算机及存储介质,方法包括:S1、将包括训练集和待检集的C或C++代码集合进行预处理,使得该C或C++代码集合转化为符号表示;S2、训练集的每一部分代码的符号表示根据代码自身属性打上标签,若代码存在漏洞,则标签置为1,否则置为0;S3、通过打上标签的训练集训练漏洞检测模型;S4、将已转化为符号表示的C或C++代码集合中的待检集作为输入,通过已完成训练的漏洞检测模型进行检测,并输出漏洞检测结果。本发明采用深度学习和自然语言处理结合的方式进行源代码漏洞检测,相比传统的静态分析方法,不需要人工专家手工定义匹配规则,显著降低漏洞误报率和漏报率。
-
公开(公告)号:CN115392259B
公开(公告)日:2023-04-07
申请号:CN202211321734.0
申请日:2022-10-27
Applicant: 暨南大学
IPC: G06F40/30 , G06N3/044 , G06N3/0464 , G06F18/214 , G06F16/35 , G06F40/289
Abstract: 本发明涉及自然语言处理的情感分析技术领域,公开了一种基于对抗训练融合BERT的微博文本情感分析方法及系统,包括:S1文本预处理步骤:读取原始微博文本数据集,进行数据扩充,得到预处理文本数据;S2预训练步骤:将预处理文本数据输入增量BERT模型中进行训练,得到增量预训练模型;S3下游微调步骤:将增量预训练模型结合预处理文本数据集进行微调,并结合对抗训练的方法,对Embeddings的权重矩阵进行扰动,输出保存为情感分类预测模型;通过所述情感分类预测模型执行目标任务,输出目标微博文本数据情感分析结果。本发明融合对抗训练和增加外部数据,提升了模型预测的精确性与鲁棒性,可以使BERT在微博情感分类领域的发挥更好的作用。
-
公开(公告)号:CN120011533A
公开(公告)日:2025-05-16
申请号:CN202411932410.X
申请日:2024-12-26
Applicant: 暨南大学
IPC: G06F16/334 , G06F16/335 , G06F16/36 , G06F40/295 , G06N5/022 , G06N5/04
Abstract: 本发明公开了一种基于知识蒸馏与思维链的轻量化信息抽取方法及系统,涉及自然语言处理中的信息抽取技术领域,包括:首先,对领域文本进行预处理,利用少样本学习进行数据增强,生成伪数据以提高模型在特定领域的表现;随后,通过大语言模型进行微调,提取文本中的实体、关系和事件和推理中间结果等关键信息;接着,应用知识蒸馏技术,将微调后的大模型知识压缩至轻量化模型中。同时采用检索增强生成技术和思维链机制,结合实时查询外部知识库,精确地从文本中提取结构化信息,逐步完成复杂信息提取任务。本发明提升了信息抽取的准确性和模型的轻量化部署效果,适用于命名实体识别、关系抽取、事件检测和情感分析等多种任务。
-
公开(公告)号:CN119788430A
公开(公告)日:2025-04-08
申请号:CN202510274275.2
申请日:2025-03-10
Applicant: 暨南大学
Abstract: 本发明公开一种车联网数据分类分级管理和自适应加解密方法及其系统,包括:对获取的车联网数据进行标记;根据车联网的实际需求为标记后的车联网数据预设不同的数据类型和安全等级、以及加解密策略;采用自然语言处理模型和随机森林模型自动识别车联网数据的安全等级,并通过加解密策略对不同安全等级车联网数据进行加解密。采用本发明的技术方案,能够有效地对车联网中的数据安全等级进行区分,实现不同安全等级数据的高效差异化加解密,可以帮助车联网系统对数据进行有效的管理和保护。
-
公开(公告)号:CN110097727A
公开(公告)日:2019-08-06
申请号:CN201910358732.0
申请日:2019-04-30
Applicant: 暨南大学
Abstract: 本发明为基于模糊贝叶斯网络的森林火灾预警方法及系统,属于消防安全领域,方法如下:无人机搭载多个传感器沿设定路线对森林进行巡检,实时感测行驶区域的数据并发送到地面站;地面站结合当地晴天数和易燃植物数进行易燃等级分级处理,根据温度、湿度、烟尘、气体信息进行火灾预警初判断;地面站接收各传感器数据后,采用模糊贝叶斯网络处理传感器数据,计算获得火灾发生概率;火灾概率较高时,地面站将火灾预警信号、是否有火灾、火灾实时情况以及位置信息发送给森林管理中心;火灾概率较低时,无人机沿设定路线等高飞行。本发明通过模糊贝叶斯网络算法对传感器数据进行处理,能够精确计算火灾概率,便于相关人员第一时间准确获知火灾情况。
-
公开(公告)号:CN120012771A
公开(公告)日:2025-05-16
申请号:CN202411932124.3
申请日:2024-12-26
Applicant: 暨南大学
IPC: G06F40/279 , G06F40/211 , G06F40/253 , G06F16/334
Abstract: 本发明公开了一种基于大语言模型的多语言通用词性识别方法及系统,涉及自然语言处理与词性识别的技术领域,包括:采用大语言模型作为核心基座模型,通过低秩适配技术进行高效微调,设计语言和多领域的词汇与句法分析,使用模型蒸馏将大模型的知识迁移到一个小模型,以减少模型大小和计算成本,通过设计规范化的提示词引导模型生成标准化的输出,并从中自动完成词性识别任务,最后用代码解析模型输出生成JSON格式数据,以供后续的业务系统的集成使用,确保高效支持前端展示和后端业务逻辑处理。本发明输出的词性信息可用于多种下游任务,如智能搜索、文本分类、代码解析和语法校验,为多种业务系统提供数据支持。
-
公开(公告)号:CN120011534A
公开(公告)日:2025-05-16
申请号:CN202411932523.X
申请日:2024-12-26
Applicant: 暨南大学
IPC: G06F16/334 , G06F40/194 , G06F40/279 , G06F18/214 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于大语言模型的实体消歧和遗忘方法及系统,涉及自然语言处理的实体消歧技术领域,包括;确定实体消歧数据集和遗忘数据集,构建对比学习样本并进行数据预处理;利用LLaMA3模型提取特征,添加投影层和对比学习模块;通过构建损失函数,对于每个样本,使用余弦相似度计算其特征表示与正负样本的相似度,使用对比损失来度量模型在区分正负样本的效果;基于损失值,通过反向传播更新模型参数,直到模型收敛。本发明以LLaMA3模型基础架构,基于对比学习的方法增强了模型的判别能力,同时提供了实现遗忘机制的途径。本发明为模型在自然语言处理领域的研究和应用提供新的思路。
-
公开(公告)号:CN113742482B
公开(公告)日:2024-05-31
申请号:CN202110813433.9
申请日:2021-07-19
Applicant: 暨南大学
IPC: G06F16/35 , G06F18/25 , G06F18/24 , G06F18/214
Abstract: 本发明公开了基于多重词特征融合的情感分类方法、介质,包括:对训练样本集中各文本数据进行文本预处理,得到文本数据转换到的字向量、文本向量、位置向量和词性向量;建立基于Transformer模型的Encoder网络,在Encoder网络的编码层加入词性向量层;将训练样本集中各文本数据对应字向量、文本向量、位置向量和词性向量输入到Transformer模型的Encoder网络中;进行预训练任务,得到情感分类模型;基于情感分类模型对需要进行分类的文本数据进行分类。本发明利用Transformer健壮的网络结构使得信息能够得到充分的利用,在模型编码层创新性的加入词性层,在情感分析领域,得到了很好的效果。
-
公开(公告)号:CN115759119B
公开(公告)日:2023-04-21
申请号:CN202310030728.8
申请日:2023-01-10
Applicant: 暨南大学
IPC: G06F40/30 , G06F40/242 , G06F40/284 , G06F16/35 , G06N3/0455 , G06N3/047 , G06N3/048 , G06N3/091
Abstract: 本发明公开了一种金融文本情感分析方法、系统、介质和设备,该方法包括下述步骤:分析每个金融文本表达的情感并进行标注;对待测金融文本进行数据预处理,得到金融文本序列;根据金融词典进行分词、编码,编码后输入BERT模型训练;多头注意力层以编码后的词向量作为输入,为每个词向量提供不同语义的词向量,前馈层将含有序列信息的词向量进行线性处理,得到整合信息后的词向量;多头注意力层和前馈层后各执行残差连接和归一化处理,完成各词向量对序列信息的整合;整合信息后的各个词向量经过全连接层、softmax计算,选择概率最大的情感作为文本情感分类的结果。本发明能更好地利用到完整语义信息,极大提高了文本情感分析的准确度。
-
公开(公告)号:CN115392259A
公开(公告)日:2022-11-25
申请号:CN202211321734.0
申请日:2022-10-27
Applicant: 暨南大学
IPC: G06F40/30 , G06N3/04 , G06F16/35 , G06F40/289
Abstract: 本发明涉及自然语言处理的情感分析技术领域,公开了一种基于对抗训练融合BERT的微博文本情感分析方法及系统,包括:S1文本预处理步骤:读取原始微博文本数据集,进行数据扩充,得到预处理文本数据;S2预训练步骤:将预处理文本数据输入增量BERT模型中进行训练,得到增量预训练模型;S3下游微调步骤:将增量预训练模型结合预处理文本数据集进行微调,并结合对抗训练的方法,对Embeddings的权重矩阵进行扰动,输出保存为情感分类预测模型;通过所述情感分类预测模型执行目标任务,输出目标微博文本数据情感分析结果。本发明融合对抗训练和增加外部数据,提升了模型预测的精确性与鲁棒性,可以使BERT在微博情感分类领域的发挥更好的作用。
-
-
-
-
-
-
-
-
-