-
公开(公告)号:CN117972092A
公开(公告)日:2024-05-03
申请号:CN202410160432.2
申请日:2024-02-04
Applicant: 中国科学院计算技术研究所
IPC: G06F16/35 , G06F40/216 , G06F40/30 , G06F40/289 , G06N3/0464 , G06N3/045 , G06N5/04
Abstract: 本发明提出一种人工智能生成文本检测方法,包括:使用代理语言模型从待检测文本中选取多个字为代表性字;使用预选语言模型依次对每个该代表性字进行多次生成操作,以每次生成结果的第一个字生成该代表性字的生成字集合,以该生成字集合获取所有该代表性字的估计概率矩阵;从该估计概率矩阵中抽取概率特征,并使用所有该代表性字的上下文语义表示形成上下文特征矩阵,基于该上下文特征矩阵和该概率特征得到增强特征;通过对该增强特征进行分类检测,获得该待检测文本的检测结果。本发明还提出一种人工智能生成文本检测系统,以及一种用于检测人工智能生成文本的数据处理装置。
-
公开(公告)号:CN117271768A
公开(公告)日:2023-12-22
申请号:CN202311208664.2
申请日:2023-09-19
Applicant: 中国科学院计算技术研究所
IPC: G06F16/35 , G06F40/126 , G06F40/279 , G06N3/0499
Abstract: 本发明提出一种基于大语言模型分析引导的虚假新闻检测方法,通过将大语言模型的分析中蕴含的知识选择性地注入到小语言模型中,实现大语言模型和小语言模型的协同检测。为进一步降低检测成本,通过知识迁移的方式,基于训练完成的上述网络中得到基于大语言模型分析知识迁移的虚假新闻检测网络,该网络的特点是无需大语言模型分析作为输入,仅使用检测网络中凝结的大模型分析知识用于检测。
-