-
公开(公告)号:CN119167936B
公开(公告)日:2025-04-29
申请号:CN202411190960.9
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06F16/35 , G06N3/0455 , G06N3/045 , G06N3/08
Abstract: 基于BERT预训练模型的网络安全NER数据增广方法、电子设备及存储介质,属于网络安全数据处理技术领域。为提高网络安全数据的效率和准确度,本发明采集网络空间安全报告,得到网络空间安全数据;使用BIO方法标注采集的网络空间安全报告,得到的文本序列和标签序列,作为原始数据集;构建BERT预训练模型;将网络空间安全数据进行掩码处理,然后输入到BERT预训练模型中进行训练,得到用于网络安全NER数据的BERT训练模型;将原始数据集进行掩码处理,输入到用于网络安全NER数据的BERT训练模型,将得到的用于网络安全NER数据的BERT训练结果和步骤S2得到的原始数据集进行合并后得到增广数据集。
-
公开(公告)号:CN118733767B
公开(公告)日:2025-02-25
申请号:CN202410745742.0
申请日:2024-06-11
Applicant: 哈尔滨工业大学
IPC: G06F16/353 , G06F16/3332 , G06F16/334 , G06F16/335 , G06F40/216 , G06F40/284 , G06F18/214 , G06N5/045
Abstract: 本发明提出一种基于可解释扰动策略的中文法律对抗文本生成方法,属于对抗文本生成技术领域。包括:对法律文本进行法律知识提取;基于法律知识为文本中每个词语的重要性进行打分并排序;为待添加扰动的文本选择需要执行的扰动策略;执行扰动策略生成法律对抗文本。本发明解决了现有技术中存在缺少面向法律罪名分类任务的对抗文本生成方法的技术问题。本发明首先提取每类罪名的主要特征作为先验知识,然后将先验知识与强化相似标签和弱化原标签两种扰动策略结合,通过强化与原标签相似的标签的独有特征或弱化原标签自身的独有特征来生成对抗文本,这使得对抗文本的生成过程具有可解释性。
-
公开(公告)号:CN118607514B
公开(公告)日:2025-01-21
申请号:CN202410688599.6
申请日:2024-05-30
Applicant: 哈尔滨工业大学 , 安天科技集团股份有限公司
IPC: G06F40/226 , G06F40/284 , G06F40/242 , G06F40/247 , G06F18/2431 , G06N3/045 , G06N3/096 , G06N3/094
Abstract: 本发明提出一种基于OFS对抗文本流畅性评估方法,属于对抗文本流畅性评估技术领域。生成对抗文本,并使用对抗文本攻击目标模型,基于OFS计算对抗文本流畅性分数,评估对抗文本流畅性。对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。排序阶段为文本中每个词语的重要性打分,并将词语按照重要性分数由高到低进行排序,扰动阶段为词语依次添加扰动。利用文本对应的真值标签上的置信度计算重要性分数,若重要性分数大于0,则说明文本中的词语对真值标签有正向影响,即词语为文本中重要词语,反之词语为文本中非重要词语;解决现有技术中存在的对抗文本流畅性评估需耗费大量人力成本的问题,并量化了流畅性评估标准。
-
公开(公告)号:CN118585779B
公开(公告)日:2024-12-27
申请号:CN202410688597.7
申请日:2024-05-30
Applicant: 哈尔滨工业大学 , 安天科技集团股份有限公司
IPC: G06F18/21 , G06F18/214 , G06F40/284 , G06F40/242 , G06F40/247
Abstract: 本发明提出基于ORS面向软标签输出深度学习模型鲁棒性评估方法,属于鲁棒性评估技术领域。包括生成对抗文本,并使用对抗文本攻击目标模型,基于ORS计算目标模型的鲁棒性分数,评估鲁棒性。对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。利用文本对应的真值标签上的置信度计算重要性分数,若重要性分数大于0,则说明文本中的词语对真值标签有正向影响,即词语为文本中重要词语,反之词语为文本中非重要词语;为输出为软标签的目标模型的鲁棒性评估提供了一种可行的解决方案,解决了当前鲁棒性评估方法中评价指标不全面的问题,并量化了输出为软标签的深度学习模型的鲁棒性评估标准。
-
公开(公告)号:CN118485181B
公开(公告)日:2024-12-20
申请号:CN202410663873.4
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06Q10/04 , G06F16/2458 , G06F16/29 , G06N3/0455 , G06N3/0499 , G06N3/047 , G06N3/0464 , G06N3/049 , G06Q50/26
Abstract: 一种基于时空轨迹表征挖掘的轨迹序列预测方法、电子设备及存储介质,属于城市智能计算和数据挖掘技术领域。为提高处理时序轨迹序列数据的效率和准确性,本发明包括采集时空轨迹数据,对时空轨迹数据进行预处理后,采用填充技术将所有预处理后的时空轨迹数据的长度补齐至采集的轨迹数据最长长度,然后进行掩码操作,得到掩码处理的时空轨迹数据;进行位置编码,得到位置编码的时空轨迹序列输送到Transformer模型中的基于结合多头注意力的全连接网络层进行训练,输出自注意力层的输出结果输送到前馈神经网络层中进行处理,得到包含输入轨迹数据的时空特征表示结果输送到解码器中,输出轨迹预测结果。本发明预测准确。
-
公开(公告)号:CN118607515A
公开(公告)日:2024-09-06
申请号:CN202410688627.4
申请日:2024-05-30
Applicant: 哈尔滨工业大学 , 安天科技集团股份有限公司
IPC: G06F40/226 , G06F40/284 , G06F40/242 , G06F40/247 , G06F18/2431 , G06N3/045 , G06N3/096 , G06N3/094
Abstract: 本发明提出基于ORS面向硬标签输出深度学习模型鲁棒性评估方法,属于鲁棒性评估技术领域。包括生成对抗文本,并使用对抗文本攻击目标模型,基于ORS计算目标模型的鲁棒性分数,评估鲁棒性。对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。排序阶段为文本中每个词语的重要性打分,并将词语按照重要性分数由高到低进行排序,扰动阶段为词语依次添加扰动。利用文本对应的真值标签上的置信度计算重要性分数,若重要性分数大于0,则说明文本中的词语对真值标签有正向影响,即词语为文本中重要词语,反之词语为文本中非重要词语;解决缺少对LLM在对抗攻击条件下的鲁棒性评估的问题,并量化了其鲁棒性评估标准。
-
公开(公告)号:CN118607514A
公开(公告)日:2024-09-06
申请号:CN202410688599.6
申请日:2024-05-30
Applicant: 哈尔滨工业大学 , 安天科技集团股份有限公司
IPC: G06F40/226 , G06F40/284 , G06F40/242 , G06F40/247 , G06F18/2431 , G06N3/045 , G06N3/096 , G06N3/094
Abstract: 本发明提出一种基于OFS对抗文本流畅性评估方法,属于对抗文本流畅性评估技术领域。生成对抗文本,并使用对抗文本攻击目标模型,基于OFS计算对抗文本流畅性分数,评估对抗文本流畅性。对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。排序阶段为文本中每个词语的重要性打分,并将词语按照重要性分数由高到低进行排序,扰动阶段为词语依次添加扰动。利用文本对应的真值标签上的置信度计算重要性分数,若重要性分数大于0,则说明文本中的词语对真值标签有正向影响,即词语为文本中重要词语,反之词语为文本中非重要词语;解决现有技术中存在的对抗文本流畅性评估需耗费大量人力成本的问题,并量化了流畅性评估标准。
-
公开(公告)号:CN118485181A
公开(公告)日:2024-08-13
申请号:CN202410663873.4
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06Q10/04 , G06F16/2458 , G06F16/29 , G06N3/0455 , G06N3/0499 , G06N3/047 , G06N3/0464 , G06N3/049 , G06Q50/26
Abstract: 一种基于时空轨迹表征挖掘的轨迹序列预测方法、电子设备及存储介质,属于城市智能计算和数据挖掘技术领域。为提高处理时序轨迹序列数据的效率和准确性,本发明包括采集时空轨迹数据,对时空轨迹数据进行预处理后,采用填充技术将所有预处理后的时空轨迹数据的长度补齐至采集的轨迹数据最长长度,然后进行掩码操作,得到掩码处理的时空轨迹数据;进行位置编码,得到位置编码的时空轨迹序列输送到Transformer模型中的基于结合多头注意力的全连接网络层进行训练,输出自注意力层的输出结果输送到前馈神经网络层中进行处理,得到包含输入轨迹数据的时空特征表示结果输送到解码器中,输出轨迹预测结果。本发明预测准确。
-
-
-
-
-
-
-