-
公开(公告)号:CN119167114A
公开(公告)日:2024-12-20
申请号:CN202411674976.7
申请日:2024-11-21
Applicant: 中国科学技术大学
IPC: G06F18/22 , G06F18/241 , G06F40/30 , G06F40/284 , G06N3/045 , G06N3/0499 , G06N3/048
Abstract: 本发明公开了一种基于语义解耦的大语言模型生成文本检测方法,首先给定一个候选文本,利用辅助大语言模型根据候选文本重构提示,利用重构的提示使所述辅助大语言模型获得再生成文本;比较候选文本与再生成文本之间的相似性;根据比较结果判断所述候选文本是否为机器生成,实现对大语言模型生成文本的检测。该方法通过解耦提示和文本再生成,有效抵抗了语义变换攻击和回译攻击,保证了在现实世界复杂应用场景下的检测稳定性和可靠性。