一种面向预训练语言模型隐私泄露风险的评估方法及系统

    公开(公告)号:CN114676458A

    公开(公告)日:2022-06-28

    申请号:CN202210302577.2

    申请日:2022-03-24

    Applicant: 浙江大学

    Abstract: 本发明涉及隐私安全领域,旨在提供一种面向预训练语言模型隐私泄露风险的评估方法及系统。包括:在预训练数据集中加入伪造数据;将预训练数据集输入初始化的神经网络模型,根据设定的预训练任务和损失函数计算损失;在训练过程中持续更新模型的参数,增加其隐私的泄露风险;利用微调数据集输入经过预训练的神经网络模型,对模型的特征提取能力进行微调;向模型输入隐私前缀内容,输出作为预测结果的文本信息;计算、统计和排序输出信息的困惑度,通过对比生成的隐私信息的比例来评估隐私数据泄露的风险。本发明可以有效提高评估隐私数据泄露风险的准确性,暴露预训练语言模型存在的隐私数据泄露风险,为后续发展相关防御方法提供思路。

    一种基于图像补全的唇形同步人脸伪造生成方法及系统

    公开(公告)号:CN114663962A

    公开(公告)日:2022-06-24

    申请号:CN202210543484.9

    申请日:2022-05-19

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于图像补全的唇形同步人脸伪造生成方法及系统,属于人工智能人脸生成领域。包括:获取人脸视频及对应的音频,将视频帧和音频帧对齐,提取多帧的人脸图像、头部姿态参数和梅尔频谱作为训练样本;对人脸图像进行预处理,生成擦除嘴部后的面部图像;对人脸伪造生成模型进行训练,利用训练好的人脸伪造生成模型,生成针对特定音频下嘴部动作的伪造人脸图像。本发明在面部生成时采用了图像补全的技术,在只修改嘴部的前提下生成因人物表达内容不一致造成的嘴部差异。相较于传统的人脸伪造生成方法,本发明提供了唇形同步功能,在视频和音频结合上进行伪造生成,且不修改面部或背景的其余位置,能够达到更逼真的伪造效果。

    PLC协议模糊测试方法及装置、电子设备、存储介质

    公开(公告)号:CN114063606B

    公开(公告)日:2022-06-21

    申请号:CN202210038505.1

    申请日:2022-01-13

    Abstract: 本发明公开了一种PLC协议模糊测试方法及装置、电子设备、存储介质,包括:构建种子库;从所述种子库中选取还未进行过确定性变异的种子进行确定性变异,生成确定性变异用例;将所述确定性变异用例作为请求报文发送给被测PLC;如果所述种子库中的所有种子均已进行过确定性变异,则从所述种子库中随机选取种子进行随机变异,生成随机变异用例;将所述随机变异用例作为请求报文发送给被测PLC;接收被测PLC返回的响应报文,将所述响应报文以树的数据结构进行保存;如果某一条响应报文在所述树的数据结构中添加了新的节点,则认为该响应报文是有价值的;将有价值的响应报文对应的请求报文储存至种子库中,以更新所述种子库。模糊测试效率得到显著提升。

    一种覆盖率驱动的并行模糊测试任务动态调度方法和系统

    公开(公告)号:CN119376882A

    公开(公告)日:2025-01-28

    申请号:CN202411443822.7

    申请日:2024-10-16

    Applicant: 浙江大学

    Abstract: 本发明公开了一种覆盖率驱动的并行模糊测试任务动态调度方法和系统。方法包括:根据实时监控到的覆盖率增量自适应地调整任务分配的频率。通过预设的最小和最大周期限制,系统在覆盖率增长低于阈值时延长周期,减少资源消耗;在覆盖率增长超过阈值时缩短周期,加速新代码区域探索。阈值本身也支持动态调整,通过反馈回路持续监控覆盖率变化与任务分配周期的效果,实现阈值的实时微调,以适应不同阶段的覆盖难度。这种动态调整策略能有效应对模糊测试过程中的非均匀覆盖难度,确保测试过程既高效又持续推进。此设计不仅优化资源利用效率和测试进度以适应不同阶段的覆盖难度变化,也显著提升了并行模糊测试的效率和效果。

    一种基于思维链提示的单元测试自动生成方法及装置

    公开(公告)号:CN118503125A

    公开(公告)日:2024-08-16

    申请号:CN202410689201.0

    申请日:2024-05-30

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于思维链提示的单元测试自动生成方法及装置,包括:(1)对待测项目进行解析,构建抽象语法树;(2)根据抽象语法树节点之间的关联,构建系统依赖图;(3)利用系统依赖图,定位出待测方法最为相关的上下文信息;(4)利用待测方法最为相关的上下文信息,构建精简上下文代码;(5)建立对象构建图,自底向上地结合思维链提示技术,引导大语言模型为待测方法生成对象创建代码;(6)结合对象创建代码和精简上下文代码,指导大语言模型生成正确的测试用例,并进行验证修复。本发明能有效改进大模型生成测试用例的正确性,利用大模型的交互能力来改进生成的测试用例,最终在正确率、覆盖率、断言质量等方面优于现有方法。

    一种目标检测模型的窃取脆弱性分析方法和系统

    公开(公告)号:CN117496118B

    公开(公告)日:2024-06-04

    申请号:CN202311374926.2

    申请日:2023-10-23

    Applicant: 浙江大学

    Abstract: 本发明公开了一种目标检测模型的窃取脆弱性分析方法和系统,属于模型窃取和人工智能知识产权保护分析领域。包括:获取相应任务场景和预测类别的无标注样本集;基于不确定度的主动学习方法,从无标注样本集中筛选查询数据集并迭代训练替代模型;基于互联网样本的数据集增强,更新查询数据集;基于目标检测的多尺度一致性,优化更新后的查询数据集中的标注;基于优化标注后的查询数据集训练替代模型;根据替代模型和目标模型的性能分析结果判断目标模型的窃取脆弱性。本发明填补了现有研究中针对目标检测深度学习模型的模型窃取威胁分析的空缺。

    一种面向代码相似性检测的跨编程语言迁移方法和系统

    公开(公告)号:CN117608651A

    公开(公告)日:2024-02-27

    申请号:CN202311418645.2

    申请日:2023-10-30

    Applicant: 浙江大学

    Abstract: 本发明提出了一种面向代码相似性检测的跨编程语言迁移方法和系统,属于软件工程和深度学习领域。利用高资源有标注源语言代码库对多语言预训练代码编码器进行有监督对比学习;将低资源无标注目标语言代码库分为两部分,基于两部分代码库轮流对微调的多语言预训练代码编码器进行自适应对比学习,自适应对比学习中的对比样本获取方式包括挖掘和生成两种模式,训练过程中基于偏好参数从挖掘和生成的对比样本中抽样;将经过自适应对比学习之后得到的多语言预训练代码编码器作为跨编程语言迁移之后的结果,用于在低资源目标语言上实现代码相似性检测。本发明可以将一个在高资源语言上训练的相似性检测模型,迁移到在低资源语言上实现代码相似性检测。

    一种零样本大模型生成代码检测方法和系统

    公开(公告)号:CN117608648A

    公开(公告)日:2024-02-27

    申请号:CN202311418650.3

    申请日:2023-10-30

    Applicant: 浙江大学

    Abstract: 本发明提出了一种零样本大模型生成代码检测方法和系统,属于软件工程和深度学习领域。包括:基于思维链提示方法,由生成模型重写原始代码片段;所述的思维链提示方法为:以原始代码片段为输入,由生成模型翻译得到该原始代码片段对应的自然语言分析文本,再以自然语言分析文本为输入,生成对应所述自然语言分析文本的代码,作为重新代码片段;利用代码相似性模型计算原始代码片段和重新代码片段的相似性得分,若相似性得分高于阈值,判断所述原始代码片段是由大语言模型生成的代码。本发明使得检测方法能够不依赖于似然估计,解决了根源在于对代码内容的不准确似然估计问题。

Patent Agency Ranking