软件源代码缺陷检测方法、系统、电子设备及储存介质

    公开(公告)号:CN113641586A

    公开(公告)日:2021-11-12

    申请号:CN202110958006.X

    申请日:2021-08-20

    Abstract: 发明实施例涉及软件测试领域,公开了一种软件源代码缺陷检测方法、系统、电子设备及计算机可读存储介质,其中方法包括步骤:构建源代码缺陷数据集,基于开源项目缺陷信息构建用于训练的大规模数据集,包括对开源项目存在的缺陷条目进行自动对齐与抽取以及对所述开源项目源代码缺陷进行上下文增广;构建基于代码切片的深度学习源代码缺陷检测模型,包括使用多模态的语义表示对代码片段进行表示与分类;对基于人工智能的源代码缺陷检测结果集成显示;开发者可以使用本发明所述的方法自动构建来源于真实项目的缺陷数据集并借助模型进行自动判断,而不必花费大量的时间与精力人工遍历代码。

    一种缺陷检测方法、装置以及存储介质

    公开(公告)号:CN112579477A

    公开(公告)日:2021-03-30

    申请号:CN202110213108.9

    申请日:2021-02-26

    Abstract: 本发明实施例涉及软件测试领域,公开了一种缺陷检测方法,包括:S101,构建源代码缺陷数据集,基于开源项目缺陷信息和源代码缺陷报告构建用于训练的大规模数据集,包括对开源项目存在的缺陷条目的抽取以及对所述开源项目源代码缺陷使用静态分析工具进行检测;S102,构建基于缺陷报告的深度学习源代码缺陷检测模型,包括使用多模态的语义表示对代码片段进行表示与分类;S103,对基于人工智能的源代码缺陷检测结果集成显示;开发者可以使用本发明所述的方法对传统源代码分析工具的检测结果进行自动判断,而不必花费大量的时间与经历人工遍历代码。

    一种基于文件依赖关系的高效程序解析方法和系统

    公开(公告)号:CN108549535B

    公开(公告)日:2021-02-05

    申请号:CN201810218332.5

    申请日:2018-03-16

    Abstract: 本发明提供了一种基于文件依赖关系的高效程序解析方法和系统,该方法包括:S1,对源文件进行分割处理,获取对应的预处理单元集合;S2,对预处理单元集合中的每个预处理单元执行以下处理:若确认预处理单元的类型为预处理指令中的文件包含指令,则提取预处理单元中的头文件;若确认存在通过预先解析头文件获取到的抽象语法树,则将头文件的抽象语法树链接至源文件的抽象语法树;若确认不存在通过预先解析头文件获取到的抽象语法树,则将头文件作为源文件执行步骤S1和S2以对头文件进行解析。本发明判断头文件是否被预先解析,将预先解析得到的抽象语法树链接至源文件的抽象语法树,避免相同头文件的重复解析,减少了程序解析时间。

    一种中文词义表示学习方法及装置

    公开(公告)号:CN111783418A

    公开(公告)日:2020-10-16

    申请号:CN202010517766.2

    申请日:2020-06-09

    Abstract: 本发明涉及一种中文词义表示学习方法及装置,包括获取训练语料,生成全局上下文矩阵;对HowNet知识库进行解析,生成词义-词相似度矩阵;根据所述全局上下文矩阵和词义-词相似度矩阵,计算生成全局词义上下文向量;对所述全局词义上下文向量进行词义软消歧;采用基于注意力拓展的跳字模型对词义软消歧后的词义向量进行训练,输出词义向量。本发明通过提出的上下文软消歧机制,能够捕捉词的真正词义,提高深度学习模型在下游任务的效果。

    一种基于文件依赖关系的高效程序解析方法和系统

    公开(公告)号:CN108549535A

    公开(公告)日:2018-09-18

    申请号:CN201810218332.5

    申请日:2018-03-16

    Abstract: 本发明提供了一种基于文件依赖关系的高效程序解析方法和系统,该方法包括:S1,对源文件进行分割处理,获取对应的预处理单元集合;S2,对预处理单元集合中的每个预处理单元执行以下处理:若确认预处理单元的类型为预处理指令中的文件包含指令,则提取预处理单元中的头文件;若确认存在通过预先解析头文件获取到的抽象语法树,则将头文件的抽象语法树链接至源文件的抽象语法树;若确认不存在通过预先解析头文件获取到的抽象语法树,则将头文件作为源文件执行步骤S1和S2以对头文件进行解析。本发明判断头文件是否被预先解析,将预先解析得到的抽象语法树链接至源文件的抽象语法树,避免相同头文件的重复解析,减少了程序解析时间。

    一种篇章级关系抽取方法
    20.
    发明公开

    公开(公告)号:CN111831783A

    公开(公告)日:2020-10-27

    申请号:CN202010644404.X

    申请日:2020-07-07

    Abstract: 本发明提供了一种篇章级关系抽取方法,涉及自然语言处理技术领域,主要解决了针对篇章级文档,计算资源耗费问题和目标实体与非目标实体之间的逻辑推理的技术问题。该发明包括:输入待处理文档,所述文档为篇章级文档;基于双向注意力约束对所述文档进行处理,得到实体与句子的抽象语义表示,所述抽象语义表示具有全局信息和逻辑推理信息;基于所述抽象语义表示判断所述文档中的目标实体对的关系类型。开发者可以使用本发明所述的方法高效准确地进行篇章级的关系抽取,同时解决篇章级关系抽取的两个主要问题,即遍历所有实体对生成备选样本造成的计算成本问题,以及目标实体与非目标实体之间的逻辑推理问题。

Patent Agency Ranking