-
公开(公告)号:CN118503125A
公开(公告)日:2024-08-16
申请号:CN202410689201.0
申请日:2024-05-30
Applicant: 浙江大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于思维链提示的单元测试自动生成方法及装置,包括:(1)对待测项目进行解析,构建抽象语法树;(2)根据抽象语法树节点之间的关联,构建系统依赖图;(3)利用系统依赖图,定位出待测方法最为相关的上下文信息;(4)利用待测方法最为相关的上下文信息,构建精简上下文代码;(5)建立对象构建图,自底向上地结合思维链提示技术,引导大语言模型为待测方法生成对象创建代码;(6)结合对象创建代码和精简上下文代码,指导大语言模型生成正确的测试用例,并进行验证修复。本发明能有效改进大模型生成测试用例的正确性,利用大模型的交互能力来改进生成的测试用例,最终在正确率、覆盖率、断言质量等方面优于现有方法。
-
公开(公告)号:CN117496118B
公开(公告)日:2024-06-04
申请号:CN202311374926.2
申请日:2023-10-23
Applicant: 浙江大学
IPC: G06V10/25 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种目标检测模型的窃取脆弱性分析方法和系统,属于模型窃取和人工智能知识产权保护分析领域。包括:获取相应任务场景和预测类别的无标注样本集;基于不确定度的主动学习方法,从无标注样本集中筛选查询数据集并迭代训练替代模型;基于互联网样本的数据集增强,更新查询数据集;基于目标检测的多尺度一致性,优化更新后的查询数据集中的标注;基于优化标注后的查询数据集训练替代模型;根据替代模型和目标模型的性能分析结果判断目标模型的窃取脆弱性。本发明填补了现有研究中针对目标检测深度学习模型的模型窃取威胁分析的空缺。
-
公开(公告)号:CN117608651A
公开(公告)日:2024-02-27
申请号:CN202311418645.2
申请日:2023-10-30
Applicant: 浙江大学
Abstract: 本发明提出了一种面向代码相似性检测的跨编程语言迁移方法和系统,属于软件工程和深度学习领域。利用高资源有标注源语言代码库对多语言预训练代码编码器进行有监督对比学习;将低资源无标注目标语言代码库分为两部分,基于两部分代码库轮流对微调的多语言预训练代码编码器进行自适应对比学习,自适应对比学习中的对比样本获取方式包括挖掘和生成两种模式,训练过程中基于偏好参数从挖掘和生成的对比样本中抽样;将经过自适应对比学习之后得到的多语言预训练代码编码器作为跨编程语言迁移之后的结果,用于在低资源目标语言上实现代码相似性检测。本发明可以将一个在高资源语言上训练的相似性检测模型,迁移到在低资源语言上实现代码相似性检测。
-
公开(公告)号:CN117608648A
公开(公告)日:2024-02-27
申请号:CN202311418650.3
申请日:2023-10-30
Applicant: 浙江大学
IPC: G06F8/72 , G06F8/41 , G06F40/216
Abstract: 本发明提出了一种零样本大模型生成代码检测方法和系统,属于软件工程和深度学习领域。包括:基于思维链提示方法,由生成模型重写原始代码片段;所述的思维链提示方法为:以原始代码片段为输入,由生成模型翻译得到该原始代码片段对应的自然语言分析文本,再以自然语言分析文本为输入,生成对应所述自然语言分析文本的代码,作为重新代码片段;利用代码相似性模型计算原始代码片段和重新代码片段的相似性得分,若相似性得分高于阈值,判断所述原始代码片段是由大语言模型生成的代码。本发明使得检测方法能够不依赖于似然估计,解决了根源在于对代码内容的不准确似然估计问题。
-
公开(公告)号:CN117592506A
公开(公告)日:2024-02-23
申请号:CN202311436314.1
申请日:2023-11-01
Applicant: 浙江大学
Abstract: 本发明公开了一种面向部分可观测多机器人竞争环境的对抗策略生成方法,属于多智能体强化学习安全领域。在多机器人竞赛机制的部分可观测竞争环境下,将各方可控制的多机器人视为多智能体系统,竞争者构建针对对手方多智能体系统的子博弈集合;竞争者控制的每个智能体为每一个子博弈维护一个重放缓冲区,用于存储竞争者与目标多智能体系统在环境中的交互数据并用于训练过程,采用轨迹共享策略均衡用于训练所有子策略的交互数据量;竞争者控制的每个智能体在训练阶段生成针对每个子博弈的最佳子策略,所有子策略的集合即为对抗策略;部署阶段,竞争者控制的智能体根据各时刻的观测确定对应子博弈,再根据最佳子策略输出机器人决策动作。
-
公开(公告)号:CN116383814A
公开(公告)日:2023-07-04
申请号:CN202310644147.3
申请日:2023-06-02
Applicant: 浙江大学
Abstract: 本发明公开了一种神经网络模型后门检测方法和系统,属于神经网络模型安全保护技术领域。将目标神经网络模型划分为特征提取器部分和分类器部分,定义特征提取器部分的输出为中间层表示;通过最大化源类别的分类置信度的方式,逆向生成每一个源类别的中间层表示;由分类器部分获取每一个源类别的中间层表示的分类置信度向量,预处理每一个源类别的分类置信度向量,拼接得到分类置信度矩阵;根据分类置信度矩阵计算异常指标值,若异常指标值大于阈值,则判断目标神经网络模型存在后门,并定位后门的目标类别。本发明能够自动生成中间层表示而非依赖现成的辅助数据,且对于后门攻击的触发器形式不敏感,后门检测精度高,适用范围广。
-
公开(公告)号:CN115437528A
公开(公告)日:2022-12-06
申请号:CN202210975257.3
申请日:2022-08-11
Applicant: 浙江大学 , 杭州优稳自动化系统有限公司
IPC: G06F3/0481 , G06T11/20 , G06Q10/06 , G06Q10/10
Abstract: 本发明公开了一种基于数字孪生的化工流程模拟器及其构建方法。在化工领域构建数字孪生模型,是实现数字化转型的重要组成部分。化工流程模拟器通过提供交互平台,便于用户参照实际生产流程规范,连接代表单元设备和物料流的图形标识,形成流程图,解决面向化工装置的数字孪生模型的模拟与计算问题。采用化工流程模拟器执行运算的结果,为预测生产中最佳操作参数和运行条件提供数据。化工流程模拟器由图形用户界面模块、组件接口模块、流程计算模块、数据处理模块和错误提示模块组成。组件接口模块通过导入基于统一软件接口的外部模块降低了软件开发工作量,数据处理模块采用数据切片,采集生产运行周期的仿真数据,作为智能数据分析的基础。
-
公开(公告)号:CN114861645A
公开(公告)日:2022-08-05
申请号:CN202210469592.6
申请日:2022-04-28
Applicant: 浙江大学
IPC: G06F40/279 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于长尾数据分布的文档级关系抽取方法,属于信息抽取和机器学习领域。包括文档预处理、文档编码、关系编码、数据增广和关系预测。在数据增广方面,本发明针对带标签的三元向量组集合,随机选取或者预设需要进行增广的关系类型,设计掩码向量,对待进行数据增广的原始三元向量组中的池化上下文表示进行扰动,生成新的三元向量组;可以有效提升文档级关系抽取模型预测尾部关系类型的准确率。同时,相比于传统的基于文本的数据增广方法,本发明不需要进行额外的文本编码过程,提高了模型训练的计算效率。此外,本发明提出的基于数据增广的对比学习预训练框架,能够在长尾数据分布场景下有效提升文档级关系抽取的准确率。
-
公开(公告)号:CN114611618A
公开(公告)日:2022-06-10
申请号:CN202210260897.6
申请日:2022-03-16
Applicant: 浙江大学
Abstract: 本发明公开了一种面向跨模态检索的数据采集处理方法和系统,包括:对目标开源数据网络进行分布式并行采集多模态数据;对文本模态数据进行特殊字符和不可见字符的清洗后,对清洗后的文本模态数据与图像模态数据进行不同消息队列存储;利用特征提取模型分别对消息队列中的每条文本和每个图像进行特征提取得到文本特征和图像特征,根据文本特征和图像特征的相似度匹配筛选得到图‑文组合,并以图‑文组合的图像特征和文本特征作为索引进行数据库存储;检索时,依据上传数据与数据库中的图‑文组合的相似度筛选匹配的图‑文组合作为上传数据的检索结果并返回,该方法和系统能够实现图片‑文本数据进行高质量的跨模态检索。
-
公开(公告)号:CN114063606A
公开(公告)日:2022-02-18
申请号:CN202210038505.1
申请日:2022-01-13
Applicant: 浙江大学 , 杭州优稳自动化系统有限公司
IPC: G05B23/02
Abstract: 本发明公开了一种PLC协议模糊测试方法及装置、电子设备、存储介质,包括:构建种子库;从所述种子库中选取还未进行过确定性变异的种子进行确定性变异,生成确定性变异用例;将所述确定性变异用例作为请求报文发送给被测PLC;如果所述种子库中的所有种子均已进行过确定性变异,则从所述种子库中随机选取种子进行随机变异,生成随机变异用例;将所述随机变异用例作为请求报文发送给被测PLC;接收被测PLC返回的响应报文,将所述响应报文以树的数据结构进行保存;如果某一条响应报文在所述树的数据结构中添加了新的节点,则认为该响应报文是有价值的;将有价值的响应报文对应的请求报文储存至种子库中,以更新所述种子库。模糊测试效率得到显著提升。
-
-
-
-
-
-
-
-
-