一种基于语义感知的补丁正确性评估方法

    公开(公告)号:CN117931676A

    公开(公告)日:2024-04-26

    申请号:CN202410170177.X

    申请日:2024-02-06

    Abstract: 本发明提供了一种基于语义感知的补丁正确性评估方法,涉及计算机软件技术领域,包括如下步骤:S1、建立缺陷数据集,在缺陷数据集上收集并生成补丁,同时对缺陷数据集内的缺陷和补丁进行词嵌入,得到预处理后的数据集;S2、对预处理后的数据集中的缺陷和补丁进行特征提取;多头注意力层来转化为向量或矩阵形式的分布式表示,残差和归一化层调整注意力层输出信息以提取缺陷和补丁描述信息;S3、对S2向量或矩阵化后的缺陷和补丁进行余弦相似度计算,得到缺陷和补丁之间的相似度得分;S4、根据相似度得分判断补丁是正确还是错误。本发明提供的技术方案利用自注意力机制可以捕获长距离依赖关系,大大缓解了传统注意力机制的长距离依赖问题。

    一种训练适用于视频监控设备的视频摘要方法

    公开(公告)号:CN116708952A

    公开(公告)日:2023-09-05

    申请号:CN202310705274.X

    申请日:2023-06-14

    Abstract: 本发明公开了一种训练适用于视频监控设备的视频摘要方法:包括如下步骤:使用监控设备收集原始视频;采用帧采样策略对原始视频进行下采样处理,获取每个视频帧的特征向量,将特征向量输入至时序卷积网络建立帧之间的长期依赖关系;将获取的一系列视频帧的特征向量输入到深度摘要网络中,采用双向时序卷积和自注意力机制将视频两个方向的上下文信息进行整合,从而捕获视频帧之间的长期依赖关系;将原始视频输入特征提取模块获取视频帧的特征,通过深度摘要网络获取视频帧特征之间的长期依赖关系,分别计算视频帧级重要性分数,通过背包算法选取分数高的部分组合成视频摘要。

    一种基于图神经网络检测带有权重偏差的软件漏洞识别方法

    公开(公告)号:CN113378176B

    公开(公告)日:2023-06-23

    申请号:CN202110652749.4

    申请日:2021-06-11

    Abstract: 本发明公开了一种基于图神经网络检测带有权重偏差的软件漏洞识别方法,包括:将源代码中的单词和符号视为一个节点,将源代码采用构成图表示,获得每个节点的初始特征值和每个图的连接的边的初始特征;将产生的构成图作为输入,最终将获得重置门输出的信息和更新门输出的信息、以及自身节点的信息三者进行合并,再通过Sigmoid激活函数输出节点激活值,作为最终时刻的节点状态;当单词节点被充分更新后所述单词被聚合到函数代码的图形级表示、并基于该表示生成最终漏洞识别结果;使用–Dice系数将有缺陷的软件漏洞损失值最小化,从而识别软件漏洞。

    一种提高JIT缺陷预测性能的方法
    4.
    发明公开

    公开(公告)号:CN116226752A

    公开(公告)日:2023-06-06

    申请号:CN202310112490.3

    申请日:2023-02-14

    Abstract: 本发明公开了一种提高JIT缺陷预测性能的方法,包括:获取CLI模型的输入信息,其中输入信息包含由SZZ注释的有噪声标签实例的数据集;采用不平衡数据概率预测组件获得数据集的预测概率矩阵;根据预测概率矩阵使用自信学习组件估计噪声标签和真实标签的联合分布,重新训练自信学习组件中的分类器;基于分类器判断数据集中的缺陷修改是否正确;根据分类器的预测结果,判断未被标签的缺陷修改是否正确。本方法可以使用CLI作为我们的去噪方法,通过将CLI应用于JIT预测,可以获得高质量的训练集,从而使JIT预测模型能够学习到更准确的类别信息,从而提高预测性能。

    一种基于时序卷积网络的视频摘要方法

    公开(公告)号:CN116168323A

    公开(公告)日:2023-05-26

    申请号:CN202310067028.6

    申请日:2023-02-01

    Abstract: 本发明提供一种基于时序卷积网络的视频摘要方法,包括:获取视频数据集;基于获取的视频数据集,提取视频特征;将提取的视频特征输入深度摘要网络,捕获视频帧的重要性;通过判别器指导深度摘要网络的训练;对深度摘要网络进行训练;基于训练后的深度摘要网络,进行视频摘要。本发明通过使用时序卷积网络和自注意力的方法来训练视频摘要模型,不仅考虑了视频帧之间的长期依赖关系,还考虑了视频固有的时间顺序属性,并且能够利用GPU并行计算的优势加快训练速度,最后还使用基于GAN的无监督的方法解决了对于人工注释的依赖,可以在一定程度上提高视频摘要传达原始视频含义的能力,并且能够提高摘要效率。

    一种高影响力缺陷报告识别方法

    公开(公告)号:CN110413792B

    公开(公告)日:2022-10-21

    申请号:CN201910728451.X

    申请日:2019-08-08

    Abstract: 本发明公开了一种高影响力缺陷报告识别方法,本方法将不平衡学习技术与多类分类方法相结合,解决了错误报告组件分类问题。使用四种不平衡处理策略RUS、ROS、SMOTE和Adacost算法来处理数据并获得平衡的数据集。然后使用基于NBM,KNN和SVM分类器的OVO和OVA多类别分类方法对平衡之后的数据集进行错误报告组件分类。通过探究不平衡学习策略和分类别分类算法的不同组合,找到具有错误报告组件分类最佳性能的变体。通过使用错误组件分类来确定为错误报告分配合适的开发人员,从而更好地解决了错误报告的分类问题。该方法不仅可以减少原始训练集的单词维度,提高训练集的质量,也提高错误报告的分类性能。

    一种基于可控断言突变的Simulink软件测试方法

    公开(公告)号:CN114791878A

    公开(公告)日:2022-07-26

    申请号:CN202210348499.X

    申请日:2022-04-01

    Abstract: 本发明公开了一种基于可控断言突变的Simulink软件测试方法,包括:生成测试用例组成稳定的测试用例集并对该稳定的测试用例集进行维护,将该测试用例集放入测试用例池中进行规范化检查;分别打开测试用例集的模型并检查其可用性,采用执行路径覆盖法收集模型的覆盖信息,收集模型中每个模块的输入和输出值并保存,根据变量信息合成判断条件,并依据判断条件加入选择模块,根据马尔可夫链蒙特卡罗算法采样合成多样性区域并加入选择模块不执行分支,最终获得新待测用例;将得到的新待测用例存为变体模型,采用差分测试方法比较变体模型与原始模型从而获得软件中存在的缺陷;该方法也可以有效的发现以往方法发现不了的深层次的软件缺陷。

    一种基于图神经网络检测带有权重偏差的软件漏洞识别方法

    公开(公告)号:CN113378176A

    公开(公告)日:2021-09-10

    申请号:CN202110652749.4

    申请日:2021-06-11

    Abstract: 本发明公开了一种基于图神经网络检测带有权重偏差的软件漏洞识别方法,包括:将源代码中的单词和符号视为一个节点,将源代码采用构成图表示,获得每个节点的初始特征值和每个图的连接的边的初始特征;将产生的构成图作为输入,最终将获得重置门输出的信息和更新门输出的信息、以及自身节点的信息三者进行合并,再通过Sigmoid激活函数输出节点激活值,作为最终时刻的节点状态;当单词节点被充分更新后所述单词被聚合到函数代码的图形级表示、并基于该表示生成最终漏洞识别结果;使用–Dice系数将有缺陷的软件漏洞损失值最小化,从而识别软件漏洞。

    基于文本特征提取和不平衡处理策略的Bug报告严重程度识别方法

    公开(公告)号:CN109934286A

    公开(公告)日:2019-06-25

    申请号:CN201910183106.2

    申请日:2019-03-12

    Abstract: 本发明公开了一种基于文本特征提取和不平衡策略的识别Bug报告严重程度的方法,该方法通过对bug报告数据集进行不平衡及基于遗传算法的文本特征提取操作,生成的分类模型对新提交的bug报告进行分类时没有偏向,拟合趋于平衡,避免了分类时的局限性;经过提取操作,可以实现特征与实例的同时提取,得到规模更小且质量更高的数据集,提高了bug报告严重程度识别的准确率,节省了bug严重程度识别的时间成本和人力成本,提升了工作效率,方便开发者优先处理严重程度更高的bug报告。

    一种基于卷积和循环神经网络的软件Bug分派方法

    公开(公告)号:CN109615241A

    公开(公告)日:2019-04-12

    申请号:CN201811528908.4

    申请日:2018-12-13

    Abstract: 本发明公开了一种基于卷积和循环神经网络的软件Bug分派方法,包括以下步骤:S1:从选定的开源项目中获取原始bug报告数据集,并对其进行预处理成训练集和测试集;S2:将训练集中的样本依次输入CLBT模型中,训练CLBT模型中所有的参数直至收敛完成该模型的训练;S3:将测试集中的样本依次输入完成训练的CLBT模型中,每个样本都返回一个针对全部开发者的推荐概率,将该样本分派给概率最大的开发者。该方法首选对整个句子的层次关系和单词之间的长短依赖关系做了量化的特征提取,在考虑了已有技术中词序信息,同时进一步提取了单词的语义和上下文特征来参与bug报告的分派工作,对文本信息进行了更加充分有效的挖掘利用。

Patent Agency Ranking