-
公开(公告)号:CN119960825A
公开(公告)日:2025-05-09
申请号:CN202510449628.8
申请日:2025-04-11
Applicant: 北京北大软件工程股份有限公司
Abstract: 本申请公开了一种代码克隆检测方法、系统、设备、介质及产品,涉及软件工程领域,该方法包括从待检测代码仓库获取待检测代码段,并将所有待检测代码段输入训练好的克隆代码检测模型中,输出与待检测代码段相对应的第一代码表示向量;任意选择两个第一代码表示向量作为代码对,将语义距离小于预设阈值的代码对标记为克隆代码。本申请可提升代码克隆检测的准确度。
-
公开(公告)号:CN118839350B
公开(公告)日:2024-12-27
申请号:CN202411328832.6
申请日:2024-09-24
Applicant: 北京北大软件工程股份有限公司
Abstract: 本申请公开了一种代码的修复方法、装置、设备及介质,涉及计算机软件领域,该方法包括:获取源代码文件和对应的代码描述文件;对源代码文件进行漏洞分析,得到源代码文件的代码缺陷结果,并对代码描述文件进行信息提取,得到摘要信息;根据摘要信息和代码缺陷结果,构建初始提示词信息;将初始提示词信息输入多个预先构建的代码修复模型中,得到每个代码修复模型对应的代码修复结果;代码修复模型是根据历史代码缺陷结果和对应的标注修复结果进行训练得到的;对各个代码修复结果进行相似度分析,确定目标代码修复结果,以通过目标代码修复结果进行代码修复。本申请的方案能够快速且精准地确定目标代码修复结果,提高了代码修复效率。
-
公开(公告)号:CN118627506A
公开(公告)日:2024-09-10
申请号:CN202411110723.7
申请日:2024-08-14
Applicant: 北京北大软件工程股份有限公司
IPC: G06F40/284 , G06F18/22 , G06N3/0499 , G06N3/0464
Abstract: 本申请公开了一种答案文段提取方法、装置、设备、介质及产品,涉及自然语言处理技术领域,该方法包括:接收用户问题和对应答案所在的文档;分别获取用户问题中词元的词向量、文档中词元的词向量和全局词元的词向量;获取文档中词元的词向量对应的所有候选答案文段的表示向量;获取用户问题中词元的词向量对应的问题表示向量和全局词元的词向量对应的全局阈值表示向量;获取各个候选答案文段的表示向量与问题表示向量之间的第一相似度,以及全局阈值表示向量与问题表示向量之间的第二相似度;获取第一相似度中大于第二相似度的目标相似度;输出目标相似度对应的目标候选答案文段。本申请可以处理文档中的答案文段是由多个文段组成的任务。
-
公开(公告)号:CN117806624A
公开(公告)日:2024-04-02
申请号:CN202311691375.2
申请日:2023-12-11
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明涉及成分分析领域,公开了一种可复用组件的提取方法,包括:对软件的源代码进行分级处理,按照层级构建代码库,使用成分分析法确定待分析项目的潜在可复用模块,对潜在可复用模块进行模块提取,获取可复用组件。本方法可以自动化地提取可复用代码及组件,减少了人工寻找可复用代码的时间和精力,提高了代码的重用性和质量,从而提高了开发效率和代码可维护性。本方法可以在软件开发中得到广泛的应用。
-
公开(公告)号:CN117556431A
公开(公告)日:2024-02-13
申请号:CN202410047057.0
申请日:2024-01-12
Applicant: 北京北大软件工程股份有限公司
IPC: G06F21/57
Abstract: 本发明涉及静态代码分析技术,具体涉及一种混合软件漏洞分析方法。本发明提供的方法包括:基于混合软件确定统一中间表示IR;基于统一中间表示IR构造数据流表示模型VFG;基于数据流表示模型VFG定位潜在漏洞的植入点和触发点;通过流追踪的方式对漏洞进行分析;混合软件至少包含两种以上的编程语言或者两种以上的代码形式。本发明通过建立统一的中间表示模型,实现对多种编程语言、多种形式代码混合的复杂软件的检测,尤其对于多模块交互的场景,能够弥补传统检测方式的不足,提升漏洞检测的能力,发现软件系统中的深层次问题。
-
公开(公告)号:CN111553160B
公开(公告)日:2024-02-02
申请号:CN202010332120.7
申请日:2020-04-24
Applicant: 北京北大软件工程股份有限公司
IPC: G06F40/295 , G06F40/35 , G06F16/332 , G06F16/33 , G06F16/35 , G06Q50/18
Abstract: 本发明公开了一种获取法律领域问句答案的方法和系统,属于语义理解领域,在获取用户的自然语言问句后生成词语的实体,识别实体并将实体分为命名实体和一般实体,根据命名实体和一般实体的关系生成语法依存树,根据语法依存树生成实体间的谓词路径,在根据谓词路径生成查询语句,执行查询语句从数据库中获取用户问句的答案。通过上述方案能够理解用户的语义,帮助用户快速准确的获取问句的答案,同时获取的答案更全面。
-
公开(公告)号:CN117421609A
公开(公告)日:2024-01-19
申请号:CN202311722719.1
申请日:2023-12-15
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明公开了一种应用于社交媒体的图像与文本语义相似度计算方法及系统,涉及语义相似度计算技术领域,该方法包括:通过图像场景图生成模型和文本场景图生成模型分别将图像和文本转化为图像场景图和文本场景图;根据图像场景图和文本场景图中物体‑关系‑物体三元组分别构建图像高层语义子图和文本高层语义子图;基于图像场景图和文本场景图中的物体节点和关系节点,利用向量点积计算局部细节匹配分数;基于高层语义子图和文本高层语义子图计算高层语义匹配分数;基于局部细节匹配分数和高层语义匹配分数计算图像与文本的语义相似度。本发明从底层局部细节到高层语义信息来衡量两个模态语义的相关程度,得到更加准确的图像与文本的语义相似度。
-
公开(公告)号:CN117349187A
公开(公告)日:2024-01-05
申请号:CN202311648734.6
申请日:2023-12-05
Applicant: 北京北大软件工程股份有限公司
IPC: G06F11/36 , G06F16/901 , G06F16/28 , G06F16/245
Abstract: 本发明涉及软件代码分析领域,公开了一种基于模型持久化的交互式漏洞分析方法和系统,包括:基于待分析软件的代码变更进行增量更新以确定值依赖图,基于值依赖图的变更确定更新增量,更新增量包括点和边,其中点的属性包括标识符、语句内容和语句类型,边为有向边,边的属性包括起点和终点的标识符,基于更新增量在漏洞数据库内进行检索,获得匹配的漏洞,漏洞数据库基于持久化的程序模型构建。本发明基于模型持久化技术,实现增量分析,提升了对于迭代中的项目进行多次分析的检测效率;再通过对静态分析能力的封装,将漏洞检测问题转化为持久化模型中的查询问题,从而实现可通过SQL语句检测漏洞,降低静态代码分析系统的使用难度。
-
公开(公告)号:CN111797221B
公开(公告)日:2023-12-08
申请号:CN202010549298.7
申请日:2020-06-16
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/335 , G06F16/35 , G06F40/284 , G06F18/2411 , G06N3/04 , G06Q50/18
Abstract: 本发明涉及一种类似案件推荐方法及装置,包括提取目标案例的案例特征并对案例特征进行预处理;预处理后的案例特征转换为非结构化信息和结构化信息,并分别对非结构化信息和结构化信息进行处理,利用处理后的非结构化信息构建第一特征向量,利用处理后的结构化信息构建第二特征向量,联合第一特征向量和第二特征向量获取案例的最终特征向量;将目标案件输入案由预测模型中,获取目标案件的案由,根据案由获取相同案由的同案由案件集合;采用最终特征向量获取同案由案件集合中的最相似案件并输出。本发明将词语通过神经网络向量化再计算相似度的方法比传统的文本相似度算法效果更好。
-
公开(公告)号:CN111695797B
公开(公告)日:2023-08-04
申请号:CN202010490261.1
申请日:2020-06-02
Applicant: 北京北大软件工程股份有限公司
IPC: G06Q10/063 , G06Q50/18 , G06F16/245
Abstract: 本申请涉及一种许可职权履责效果评估模型的构建方法、装置及系统,属于评估技术领域,本申请许可职权履责效果评估模型的构建方法包括:基于对案件情况的相关性分析,确定评估模型的评价指标;确定所述评价指标的指标权重;基于所述评价指标和指标权重构建许可职权履责效果评估模型。本发明基于案件情况采取上述方法构建的许可职权履责效果评估模型,有利于客观地对许可职权履责的效果进行有效评估,进而在行政主体在做行政许可前可以提供参考建议,以对于具体行政许可申请部署更多人员或其他方式以加快审批时间,提升行政许可效率。
-
-
-
-
-
-
-
-
-