-
公开(公告)号:CN115017059B
公开(公告)日:2022-11-11
申请号:CN202210941028.X
申请日:2022-08-08
Applicant: 北京北大软件工程股份有限公司
IPC: G06F11/36
Abstract: 本发明涉及软件自动化测试领域,公开了一种图形用户界面程序的模糊测试方法及系统,包括:根据被测试程序的类型和运行系统平台选择图形用户界面测试工具,录制使用所述图形用户界面测试工具打开所述被测试程序的过程,生成图形用户界面程序的自动化操作脚本,通过使用动态插桩工具获得拦截函数的调用过程,从而获得调用序列和调用时的上下文环境,筛选所述调用序列,得到候选目标函数集合,监控所述候选目标函数集合的运行状态,获得代码覆盖率,选择所述候选目标函数集合内所述代码覆盖率最大的为目标函数,选择模糊测试器,生成种子文件,配置所述模糊测试器参数,插桩拦截所述被测试程序,执行模糊测试,监控运行结果。
-
公开(公告)号:CN115017059A
公开(公告)日:2022-09-06
申请号:CN202210941028.X
申请日:2022-08-08
Applicant: 北京北大软件工程股份有限公司
IPC: G06F11/36
Abstract: 本发明涉及软件自动化测试领域,公开了一种图形用户界面程序的模糊测试方法及系统,包括:根据被测试程序的类型和运行系统平台选择图形用户界面测试工具,录制使用所述图形用户界面测试工具打开所述被测试程序的过程,生成图形用户界面程序的自动化操作脚本,通过使用动态插桩工具获得拦截函数的调用过程,从而获得调用序列和调用时的上下文环境,筛选所述调用序列,得到候选目标函数集合,监控所述候选目标函数集合的运行状态,获得代码覆盖率,选择所述候选目标函数集合内所述代码覆盖率最大的为目标函数,选择模糊测试器,生成种子文件,配置所述模糊测试器参数,插桩拦截所述被测试程序,执行模糊测试,监控运行结果。
-
公开(公告)号:CN114897504A
公开(公告)日:2022-08-12
申请号:CN202210546548.0
申请日:2022-05-20
Applicant: 北京北大软件工程股份有限公司
IPC: G06Q10/10 , G06F16/35 , G06F40/279 , G06N3/04 , G06N3/08
Abstract: 本申请实施例提供一种处理重复信件的方法、装置、存储介质和电子设备,该方法包括:获取待处理重复信件;对待处理重复信件进行实体抽取,得到实体抽取结果;将实体抽取结果输入到预先训练好的分类模型中,得到待处理重复信件的分类结果;基于待处理重复信件的分类结果,对待处理重复信件执行相应的处理。借助于上述技术方案,本申请实施例至少能够实现降低人工审核压力,以及还能够提高审核效率的技术效果。
-
公开(公告)号:CN114756657A
公开(公告)日:2022-07-15
申请号:CN202210472515.6
申请日:2022-04-29
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/31 , G06F40/126 , G06F40/194 , G06F40/279 , G06F40/30 , G06N3/04 , G06N3/08 , G06N5/04
Abstract: 本申请实施例提供了一种获取法律条文的方法和模型,该方法包括:将法律条文数据库中的N条法律条文进行编码,得到N个法律条文语义向量,并且存储所述N条法律条文语义向量;获取问题所对应的问题语义向量;将所述N条法律条文语义向量和所述问题语义向量输入到目标推理器中,通过所述目标推理器获得与所述问题对应的候选法律条文集合,其中,所述候选法律条文集合包括N1个候选法律条文,N为大于1的整数,N1为大于或等于1并且小于N的整数。通过本申请的一些实施例能够实现从多个法律条文中抽取出与问题相关的候选法律条文集合。
-
公开(公告)号:CN113641586B
公开(公告)日:2022-04-15
申请号:CN202110958006.X
申请日:2021-08-20
Applicant: 北京北大软件工程股份有限公司
IPC: G06F11/36 , G06N3/04 , G06N3/08 , G06K9/62 , G06V10/764
Abstract: 发明实施例涉及软件测试领域,公开了一种软件源代码缺陷检测方法、系统、电子设备及计算机可读存储介质,其中方法包括步骤:构建源代码缺陷数据集,基于开源项目缺陷信息构建用于训练的大规模数据集,包括对开源项目存在的缺陷条目进行自动对齐与抽取以及对所述开源项目源代码缺陷进行上下文增广;构建基于代码切片的深度学习源代码缺陷检测模型,包括使用多模态的语义表示对代码片段进行表示与分类;对基于人工智能的源代码缺陷检测结果集成显示;开发者可以使用本发明所述的方法自动构建来源于真实项目的缺陷数据集并借助模型进行自动判断,而不必花费大量的时间与精力人工遍历代码。
-
公开(公告)号:CN113553435B
公开(公告)日:2021-12-24
申请号:CN202111103712.2
申请日:2021-09-22
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/08
Abstract: 本申请公开了一种智能标签的确定方法、装置、设备及存储介质,通过对待处理文本进行拆分,得到多个短句;根据预置Bert模型分别对所述短句进行预测,得到各个短句的基准句;将各个所述基准句与预置基准语句库进行匹配,确定各个所述短句的智能标签,实现对文本中的短句进行分类标签,以使用户更加方便、快速阅读或分析文本,提高阅读效率。
-
公开(公告)号:CN112597063B
公开(公告)日:2021-06-08
申请号:CN202110213091.7
申请日:2021-02-26
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明实施例涉及软件维护领域,公开了一种缺陷代码定位的方法、装置以及存储介质,包括:S101:缺陷报告及对应源文件抽取;S102:计算代码源文件的表示;S103:计算缺陷报告的描述文本的表示,S104:计算缺陷报告和代码文件的相似度,得到缺陷报告可能对应的代码源文件;软件维护人员可以使用本发明所描述的方法辅助定位缺陷报告所描述的缺陷对应的代码源文件,提高效率。
-
公开(公告)号:CN108958739B
公开(公告)日:2020-11-10
申请号:CN201810573717.3
申请日:2018-06-06
Applicant: 北京大学 , 北京北大软件工程股份有限公司
IPC: G06F8/53
Abstract: 本发明提供一种二进制反编译中数组数据结构恢复方法及系统,所述方法包括:S11,对于目标反编译结果中任一非指针变量,若该非指针变量的实际占位大小与该非指针变量的类型对应的占位大小之间的差值大于第一预设阈值,则将该非指针变量作为目标变量;S12,获取目标变量在目标反编译结果中各使用位置对应的第一使用模式,若根据第一使用模式对应的第一权重确定目标变量为数组变量,则对数组变量的数据结构进行恢复。本发明实现了对反编译结果中数组数据结构的自动恢复,且提高了数组数据结构恢复的正确率。
-
公开(公告)号:CN111858732A
公开(公告)日:2020-10-30
申请号:CN202010672743.9
申请日:2020-07-14
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/25 , G06F16/28 , G06F16/215 , G06F40/295 , G06N20/00 , G06F16/2458 , G06F16/248
Abstract: 本申请涉及数据融合方法及终端,属于数据融合技术领域。本申请包括:接收输入的数据,基于数据的元数据进行数据理解处理,包括:根据数据的数据值进行属性分类,以及为各属性建立对应的有效性判断和数据转换解析器;确定数据的数据值分布情况,并利用有效性判断和数据转换解析器进行有效性判断;对判断为有效的数据,利用对应的有效性判断和数据转换解析器,进行数据转换,输出融合数据进行存储。通过本申请,有助于实现形成元数据规范,数据标准统一,数据格式整齐的数据融合。
-
公开(公告)号:CN111797234A
公开(公告)日:2020-10-20
申请号:CN202010550434.4
申请日:2020-06-16
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/35 , G06F40/211 , G06F40/284 , G06F40/30 , G06K9/62
Abstract: 本发明公开了一种自然语言处理分类模型中多标签分布学习的方法和系统,属于自然语言处理领域。在获取训练样本后,分别计算得到每个标签的标签向量和每个样本的样本向量;然后根据标签向量和样本向量计算得到每个样本与每个标签之间的相关性;再通过每个样本与每个标签之间的相关性计算得到每个样本的标签分布;最后根据标签分布更新自然处理分类模型。通过这种方式,能够使经过更新后的自然处理分类模型的样本得到更准确的标签,大大提高了自然处理分类模型的泛化能力。
-
-
-
-
-
-
-
-
-