攻击防御方法、装置、终端设备以及存储介质
摘要:
本发明公开了一种攻击防御方法、装置、终端设备以及存储介质,接收用户输入的用户提示文本;根据所述用户提示文本,生成用户提示请求并发送至模型端,由所述模型端将所述用户提示请求输入到预设的生成式大模型中进行提示应答,获取模型提示响应;接收所述模型端发送的模型提示响应;基于预设的提取信息攻击识别规则,根据所述模型提示响应进行攻击识别,获取提取信息攻击识别结果,并根据所述提取信息攻击识别结果采取对应的防御措施,所述提取信息攻击识别规则基于所述生成式大模型进行规则生成得到。实现了对生成式大模型注入攻击防御场景中提取信息注入攻击的防御,提高了对攻击识别的准确性以及生成式大模型应答的安全性。
公开/授权文献
0/0