-
公开(公告)号:CN119862872A
公开(公告)日:2025-04-22
申请号:CN202411921547.5
申请日:2024-12-25
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F40/186 , G06N5/04 , G06F40/284 , G06F21/62
Abstract: 本申请涉及一种基于思维链的大模型敏感内容审查方法和装置,其中,该基于思维链的大模型敏感内容审查方法包括:构建用于指示目标模型审查逻辑的思维链模板;思维链模板包括针对目标模型的角色设定、行为描述和输出规范;基于思维链模板和预设的内容标签体系,生成对应的提示词;基于提示词,通过目标模型对待检测文本进行审查,得到待检测文本对应的第一输出结果。通过本申请,解决了已有的基于训练的检测方法无法及时应对不断变化的敏感内容风险,导致泛化性差的问题,实现了对敏感内容的灵活检测,有效提高泛化性。