-
公开(公告)号:CN116627487A
公开(公告)日:2023-08-22
申请号:CN202310550101.5
申请日:2023-05-16
Applicant: 浙江大学
IPC: G06F8/73 , G06F8/41 , G06N3/0499 , G06N3/0455 , G06F40/216
Abstract: 本发明公开了一种基于词级别检索的源代码注释自动化生成方法和系统,属于自然语言处理文本生成领域。利用由代码函数文本、代码抽象语法树、代码注释文本构成的训练集训练编码‑解码网络;获取代码注释文本中每一个注释词的总体表征向量,构建近邻词数据库;针对待注释的代码函数文本及其抽象语法树,自回归地生成当前时间步的基于模型的目标词概率分布和目标词总体表征向量;在近邻词数据库中检索与目标词总体表征向量的相似度最高的K个近邻词,生成基于近邻词的目标词概率分布;融合两个目标词概率分布,取概率最大的目标词作为当前时间步生成的注释词。本发明可大幅度提高原模型的注释生成质量,同时还能够提高代码注释中低频词的生成概率。
-
公开(公告)号:CN116346692A
公开(公告)日:2023-06-27
申请号:CN202310128622.1
申请日:2023-02-17
Applicant: 浙江大学 , 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室))
Abstract: 本发明公开了一种基于状态变量推断的物联网可信执行环境内核模糊测试方法和系统,属于物联网可信执行环境内核测试领域。方法包括:基于文档分析构建测试样例模板文件辅助模糊测试进行;基于硬件仿真器的模糊测试执行反馈信息收集;采用主动测试方法的物联网可信执行环境内核状态变量结构体成员推断;综合测试样例代码覆盖信息与系统状态信息对模糊测试种子进行评分,优选高分数种子进行模糊测试。本发明设计的基于状态变量推断的物联网可信执行环境内核模糊测试方法和系统能够对物联网可信执行环境内核进行高效率的测试。
-
公开(公告)号:CN114826959A
公开(公告)日:2022-07-29
申请号:CN202210410624.5
申请日:2022-04-19
Applicant: 浙江大学
IPC: H04L43/06 , H04L43/08 , H04L9/40 , H04L67/566 , H04L69/22
Abstract: 本发明公开了一种音频数据反爬虫技术脆弱性分析方法及系统,该方法包括以下步骤:(1)针对不同的网络层反爬虫策略,在请求报文层面进行对应的数据包字段修改,达成带有隐蔽性的数据采集请求;(2)将该数据采集请求发送到目标服务器,获取请求的返回结果,并从结果中解析待采集的目标地址,形成待采集目标地址队列;(3)针对基于采集目标推断的反爬虫技术,在待采集目标地址队列中通过随机算法添加无关的采集目标,从而进行应用层面的反爬虫技术脆弱性分析。本发明的方法可以对音频数据反爬虫技术进行有效的脆弱性分析。
-
公开(公告)号:CN113887208A
公开(公告)日:2022-01-04
申请号:CN202111078755.X
申请日:2021-09-15
Applicant: 浙江大学滨江研究院
IPC: G06F40/279 , G06F40/216 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于注意力机制的对抗文本防御方法及系统,包括:将待识别文本输入到以编码器‑解码器为基本结构的自然语言处理模型中,利用单词评分函数计算文本中的每个单词的重要性得分,取重要性得分的倒数,构成重构评分向量;根据注意力公式计算每个隐藏层向量的权重,得到注意力权重向量;使用超参数与重构评分向量相乘的方式来平衡重构评分向量和注意力权重向量,将重构评分向量和注意力权重向量中的对应元素逐个相乘,得到最终的重构注意力向量;利用重构注意力向量与隐藏层特征向量相乘得到重构语义编码,解码后得到输出。本发明泛化性能好,应对新的对抗攻击时不用重新训练模型;对字符级对抗攻击及单词级对抗攻击都有一定的效果。
-
-
-