奖励引导的自动越狱提示生成方法
摘要:
本发明提出奖励引导的自动越狱提示生成方法。该方法包括步骤1:初始化种子池,采集互联网上流传的越狱提示作为初始种子;步骤2:演化得到新提示,所述步骤2包含种子提示选择和演化两个环节;选择分数最高的种子,通过演化方法基于选中种子得到新的越狱提示;步骤3:评估新提示攻击效果。所述方法采用搜索的方式进行攻击充分利用了已有的越狱提示,具备攻击成功率高、效率高的优点,此外本发明引入奖励模型作为指导信号、提示融合作为演化方法进一步提高了算法的性能。
0/0