-
公开(公告)号:CN120010853A
公开(公告)日:2025-05-16
申请号:CN202510077737.1
申请日:2025-01-17
Applicant: 大连理工大学 , 信华信技术股份有限公司
Abstract: 本发明属于智能软件工程的数据增强方法领域,涉及一种基于单向翻译与有效性自验证的等价代码数据增强方法。首先获取待数据增强项目内容,提取出所含各个函数,依次利用大语言模型进行功能需求单向翻译,获取自然语言描述;进而填充提示模板,输入大语言模型生成候选代码。为了确保被增强数据的语法有效性,使用静态语法分析工具检验候选代码;为了确保语义等价性,从断言知识增强与焦点方法‑测试用例关系学习角度依次预训练Func2Test模型并进行微调,为每个候选代码生成m个测试用例用于测试,最终仅保留通过率最高的候选代码作为新生成代码。最后对原始代码和新生成代码进行mixup处理,获得最终增强结果,即混合数据集Dmix。
-
公开(公告)号:CN113268429B
公开(公告)日:2025-03-25
申请号:CN202110670451.6
申请日:2021-06-17
Applicant: 大连理工大学
IPC: G06F11/3668
Abstract: 本发明属于软件测试技术领域,尤其涉及一种基于多样性导向变异的高级综合工具缺陷检测方法。本发明通过对随机生成的测试用例进行多样性导向变异,得到一系列语句差异性较大的测试用例,以解决在测试高级综合工具过程中高效测试用例产生问题,提高了测试用例多样性,扩大了测试空间,避免了冗余的测试,从而提高高级综合工具缺陷检测效率。
-
公开(公告)号:CN119226172A
公开(公告)日:2024-12-31
申请号:CN202411430040.X
申请日:2024-10-14
Applicant: 大连理工大学
Abstract: 本发明属于软件测试领域,涉及一种基于变异和差分测试的TypeScript编译器缺陷检测方法。本发明首先借助Github开源社区和大语言模型构建一个包含通用语法特征和特有语法特征的语法程序数据集,并设计一组包含通用突变算法和类型特定突变算法的算法集对语法程序数据集中的程序进行随机突变。将得到的突变程序数据集输入不同版本的TypeScript编译器进行差分测试,并结合Node.js的执行结果进行分析,根据定义的6种情况判别编译器是否存在缺陷。提出代码复杂度的表示方法,用6个不同的指标衡量突变程序的代码复杂度,并将代码复杂度提高的突变程序加入到语法程序数据集中以不断丰富其多样性。
-
公开(公告)号:CN119166162A
公开(公告)日:2024-12-20
申请号:CN202411315168.1
申请日:2024-09-20
Applicant: 大连理工大学
Abstract: 本发明属于软件工程领域,具体为一种基于中间表示的C到Rust代码翻译大模型构建方法,可用于构建高效的代码翻译大模型,从而提高将C代码翻译为Rust代码的效率。该方法主要分为两个阶段。首先通过Github等软件项目托管平台收集大量的Rust代码,并将其转换为对应的中间表示,用于训练大模型实现从中间表示到Rust代码的翻译。然后本发明通过收集功能语义相同的C代码和Rust代码,并将C代码转换为对应的中间表示,从而微调大模型,对齐C到Rust代码翻译过程中的中间表示差异。本发明可用于将软件项目中用C语言编写的代码,自动翻译为功能语义相同的Rust代码。
-
公开(公告)号:CN117873888A
公开(公告)日:2024-04-12
申请号:CN202410025515.0
申请日:2024-01-08
Applicant: 大连理工大学
IPC: G06F11/36 , G06F18/214 , G06F18/241 , G06N3/0464
Abstract: 本发明属于软件自动化测试领域,涉及一种用于构造模糊测试用例的技术,具体为一种基于深度学习的高效PDF应用程序模糊测试用例生成方法。本发明利用CNN、Seq2Seq、Transformer等深度学习模型,通过数据筛选、对象生成、对象附加、高效变异等步骤,从而实现了更加高效、高质量、有针对性的PDF测试用例的生成。本发明可用于以PDF文件格式作为输入的应用程序的漏洞查找,如XPDF、MUPDF、POPPLER等被广泛使用的开源PDF应用程序;亦可根据应用程序输入文件格式的不同,对本发明的相关步骤进行适配,从而实现对以其他高度结构化文件格式作为输入的应用程序的漏洞查找。
-
公开(公告)号:CN117743803A
公开(公告)日:2024-03-22
申请号:CN202410011643.X
申请日:2024-01-04
Applicant: 大连理工大学
IPC: G06F18/20 , G06F18/213 , G06F18/241 , G06F8/30
Abstract: 本发明属于软件缺陷预测技术领域,提出了一种基于进化特征构建的工作量感知即时缺陷预测方法。该方法主要通过多目标遗传优化算法,以模型预测的准确率与所需的工作量作为目标函数,进行机器学习模型的特征构建,并将构建好的特征应用在机器学习模型上。本发明将工作量感知与特征工程相结合,从而更加灵活地应用在不同的模型上。
-
公开(公告)号:CN116954615A
公开(公告)日:2023-10-27
申请号:CN202310863162.7
申请日:2023-07-14
Applicant: 大连理工大学
IPC: G06F8/41 , G06N3/0464
Abstract: 本发明属于人工智能加速器的编译优化技术领域,提出一种基于TensorIR的TPU自动张量化方法,能够自动优化生成TPU张量加速器的运算kernel代码。该方法通过对调度后的TensorIR遍历分析其抽象语法树,以自动地进行各硬件行为的指令替换。本发明摒弃了现有TensorIR中繁琐的手写IR匹配片段的张量化过程,更加灵活地实现TPU上各神经网络算子的张量化,并可提升2~3倍的kernel运算性能。
-
公开(公告)号:CN113010427A
公开(公告)日:2021-06-22
申请号:CN202110301741.3
申请日:2021-03-22
Applicant: 大连理工大学
IPC: G06F11/36
Abstract: 本发明属于检测技术以及软件测试技术领域,尤其涉及一种基于等价取模测试的高级综合工具缺陷检测方法。本发明采用了等价取模测试思路,但针对于高级综合工具特点,在等价取模测试在种子代码中删除未执行代码或插入代码的变异操作基础上,增加了对种子代码进行转换的变异操作,并使用仿真器模拟仿真种子代码和变异后代码被待测试高级综合工具综合所得到的两个HDL代码,比较两个HDL代码是否有相同的仿真输出结果来判断待测试高级综合工具是否存在缺陷。本发明方法能够产生有效的高级综合工具测试的测试用例,能够有效检测高级综合工具中存在的缺陷,并能够自动化生成Bug报告,以供开发人员快速修复缺陷。
-
公开(公告)号:CN120010854A
公开(公告)日:2025-05-16
申请号:CN202510078021.3
申请日:2025-01-17
Applicant: 大连理工大学 , 信华信技术股份有限公司
IPC: G06F8/41 , G06F18/22 , G06N3/0455
Abstract: 本发明属于软件工程领域,尤其涉及一种基于树指令大语言模型的代码翻译方法,可用于将源编程语言转换为目标编程语言。本发明通过从线性化AST中提取关键的树结构信息,并训练了一个相似度模型使树结构与代码结构对齐,从而构造更精确的指令数据集,增加了大语言模型对AST结构的理解能力;通过与大语言模型相结合,大大减少了人力干预,极大降低了代码翻译的成本;通过增加额外的功能评估方案,提升了了翻译结果对用户结果的友好度;此外,本发明方法还具有高度可扩展性,可以很容易地切换使用不同的大语言模型,有利于改善用户体验,降低使用所需的专业技能门槛。
-
公开(公告)号:CN113051161B
公开(公告)日:2024-12-06
申请号:CN202110301729.2
申请日:2021-03-22
Applicant: 大连理工大学
Abstract: 本发明提供一种基于历史代码变更信息的API误用检测方法,属于软件工程技术领域。该方法首先从代码托管工具上拉取开源项目的历史代码变更信息,提取出API误用相关的修复信息。利用程序修复前后AUG来逆向提取程序变异算子,而不是通过人工设计变异算子,有效且高效地生成大量包含API误用的程序集。API误用集作为测试用例通过测试套件后,分析终止跟踪堆栈中的信息,如果终止堆栈跟踪信息不是目标API误用引起的,或者还包含由其他API误用引起的信息,则说明原始程序中包含API误用。避免了从大量程序中学习正确的API使用模式,提高了API误用检测的效率。
-
-
-
-
-
-
-
-
-