基于词级别检索的源代码注释自动化生成方法和系统

    公开(公告)号:CN116627487A

    公开(公告)日:2023-08-22

    申请号:CN202310550101.5

    申请日:2023-05-16

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于词级别检索的源代码注释自动化生成方法和系统,属于自然语言处理文本生成领域。利用由代码函数文本、代码抽象语法树、代码注释文本构成的训练集训练编码‑解码网络;获取代码注释文本中每一个注释词的总体表征向量,构建近邻词数据库;针对待注释的代码函数文本及其抽象语法树,自回归地生成当前时间步的基于模型的目标词概率分布和目标词总体表征向量;在近邻词数据库中检索与目标词总体表征向量的相似度最高的K个近邻词,生成基于近邻词的目标词概率分布;融合两个目标词概率分布,取概率最大的目标词作为当前时间步生成的注释词。本发明可大幅度提高原模型的注释生成质量,同时还能够提高代码注释中低频词的生成概率。

    一种针对音频数据反爬虫技术脆弱性分析方法及系统

    公开(公告)号:CN114826959A

    公开(公告)日:2022-07-29

    申请号:CN202210410624.5

    申请日:2022-04-19

    Applicant: 浙江大学

    Abstract: 本发明公开了一种音频数据反爬虫技术脆弱性分析方法及系统,该方法包括以下步骤:(1)针对不同的网络层反爬虫策略,在请求报文层面进行对应的数据包字段修改,达成带有隐蔽性的数据采集请求;(2)将该数据采集请求发送到目标服务器,获取请求的返回结果,并从结果中解析待采集的目标地址,形成待采集目标地址队列;(3)针对基于采集目标推断的反爬虫技术,在待采集目标地址队列中通过随机算法添加无关的采集目标,从而进行应用层面的反爬虫技术脆弱性分析。本发明的方法可以对音频数据反爬虫技术进行有效的脆弱性分析。

    一种基于注意力机制的对抗文本防御方法及系统

    公开(公告)号:CN113887208A

    公开(公告)日:2022-01-04

    申请号:CN202111078755.X

    申请日:2021-09-15

    Abstract: 本发明公开了一种基于注意力机制的对抗文本防御方法及系统,包括:将待识别文本输入到以编码器‑解码器为基本结构的自然语言处理模型中,利用单词评分函数计算文本中的每个单词的重要性得分,取重要性得分的倒数,构成重构评分向量;根据注意力公式计算每个隐藏层向量的权重,得到注意力权重向量;使用超参数与重构评分向量相乘的方式来平衡重构评分向量和注意力权重向量,将重构评分向量和注意力权重向量中的对应元素逐个相乘,得到最终的重构注意力向量;利用重构注意力向量与隐藏层特征向量相乘得到重构语义编码,解码后得到输出。本发明泛化性能好,应对新的对抗攻击时不用重新训练模型;对字符级对抗攻击及单词级对抗攻击都有一定的效果。

Patent Agency Ranking