-
公开(公告)号:CN112597063B
公开(公告)日:2021-06-08
申请号:CN202110213091.7
申请日:2021-02-26
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明实施例涉及软件维护领域,公开了一种缺陷代码定位的方法、装置以及存储介质,包括:S101:缺陷报告及对应源文件抽取;S102:计算代码源文件的表示;S103:计算缺陷报告的描述文本的表示,S104:计算缺陷报告和代码文件的相似度,得到缺陷报告可能对应的代码源文件;软件维护人员可以使用本发明所描述的方法辅助定位缺陷报告所描述的缺陷对应的代码源文件,提高效率。
-
公开(公告)号:CN111797234A
公开(公告)日:2020-10-20
申请号:CN202010550434.4
申请日:2020-06-16
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/35 , G06F40/211 , G06F40/284 , G06F40/30 , G06K9/62
Abstract: 本发明公开了一种自然语言处理分类模型中多标签分布学习的方法和系统,属于自然语言处理领域。在获取训练样本后,分别计算得到每个标签的标签向量和每个样本的样本向量;然后根据标签向量和样本向量计算得到每个样本与每个标签之间的相关性;再通过每个样本与每个标签之间的相关性计算得到每个样本的标签分布;最后根据标签分布更新自然处理分类模型。通过这种方式,能够使经过更新后的自然处理分类模型的样本得到更准确的标签,大大提高了自然处理分类模型的泛化能力。
-
公开(公告)号:CN111797225A
公开(公告)日:2020-10-20
申请号:CN202010550450.3
申请日:2020-06-16
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/34 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种文本摘要生成方法和装置,涉及自然语言文本的自动摘要技术;在获取输入文本之后,通过采用编码器对文本进行处理得到编码器的环境向量;然后再根据根据编码器的环境向量采用解码器解码生成摘要。在编码器对整个文本信息编码过程中加入具有感知关键词注意力机制网络的合并层,调整最终得到的编码器的环境向量。使编码器的环境向量既考虑文本的整体性,又关注文本中的关键词。最终通过解码器解码后得到的摘要更加精确,更加符合输入文本。
-
公开(公告)号:CN111797234B
公开(公告)日:2024-04-30
申请号:CN202010550434.4
申请日:2020-06-16
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/35 , G06F40/211 , G06F40/284 , G06F40/30 , G06F18/214
Abstract: 本发明公开了一种自然语言处理分类模型中多标签分布学习的方法和系统,属于自然语言处理领域。在获取训练样本后,分别计算得到每个标签的标签向量和每个样本的样本向量;然后根据标签向量和样本向量计算得到每个样本与每个标签之间的相关性;再通过每个样本与每个标签之间的相关性计算得到每个样本的标签分布;最后根据标签分布更新自然处理分类模型。通过这种方式,能够使经过更新后的自然处理分类模型的样本得到更准确的标签,大大提高了自然处理分类模型的泛化能力。
-
公开(公告)号:CN112597063A
公开(公告)日:2021-04-02
申请号:CN202110213091.7
申请日:2021-02-26
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明实施例涉及软件维护领域,公开了一种缺陷代码定位的方法、装置以及存储介质,包括:S101:缺陷报告及对应源文件抽取;S102:计算代码源文件的表示;S103:计算缺陷报告的描述文本的表示,S104:计算缺陷报告和代码文件的相似度,得到缺陷报告可能对应的代码源文件;软件维护人员可以使用本发明所描述的方法辅助定位缺陷报告所描述的缺陷对应的代码源文件,提高效率。
-
公开(公告)号:CN111831783A
公开(公告)日:2020-10-27
申请号:CN202010644404.X
申请日:2020-07-07
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明提供了一种篇章级关系抽取方法,涉及自然语言处理技术领域,主要解决了针对篇章级文档,计算资源耗费问题和目标实体与非目标实体之间的逻辑推理的技术问题。该发明包括:输入待处理文档,所述文档为篇章级文档;基于双向注意力约束对所述文档进行处理,得到实体与句子的抽象语义表示,所述抽象语义表示具有全局信息和逻辑推理信息;基于所述抽象语义表示判断所述文档中的目标实体对的关系类型。开发者可以使用本发明所述的方法高效准确地进行篇章级的关系抽取,同时解决篇章级关系抽取的两个主要问题,即遍历所有实体对生成备选样本造成的计算成本问题,以及目标实体与非目标实体之间的逻辑推理问题。
-
公开(公告)号:CN111797241A
公开(公告)日:2020-10-20
申请号:CN202010552821.1
申请日:2020-06-17
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明涉及一种基于强化学习的事件论元抽取方法及装置,包括构建事件检测模型,构建论元检测模型,构建实体选择模型,将实体选择模型选择的待检测实体输入到论元检测模型进行检测,采集预测结果的损失,根据预测结果的损失更新论元检测模型的参数;根据待检测实体更新实体选择模型;通过更新后的论元检测模型和更新后的实体选择模型对句子中的实体进行检测,并将检测结果引入更新后的论元检测模型和更新后的实体选择模型进行更新,循环直至遍历所有实体。本发明能够在检测当前论元的时候,引入已知论元的信息,通过引入已知论元信息和强化学习技术,能够有效利用论元间交互关系,提高论元检测效果。
-
-
-
-
-
-