-
公开(公告)号:CN117577119A
公开(公告)日:2024-02-20
申请号:CN202410063988.X
申请日:2024-01-17
Applicant: 清华大学
Abstract: 本发明提供了一种融合大语言模型的伪造语音检测方法、系统、设备及介质,涉及语音检测技术领域,通过获取待检测语音;通过预先训练的声学编码模块从待检测语音中提取声学特征序列,并对所述声学特征序列进行处理,得到声学编码序列和音素序列;通过预先训练的大语言模型模块对所述音素序列进行编码,得到音素编码序列;将声学编码序列和音素编码序列输入至预先训练的多模态融合分类模块中,得到语音检测结果。上述方法不仅将声学信息和音素信息进行融合,同时结合大语言模型强大的泛化性与模式识别能力,以使检测方法同时具有强鲁棒性和对于伪造语音类型的强泛化性。
-
公开(公告)号:CN117575026A
公开(公告)日:2024-02-20
申请号:CN202410063981.8
申请日:2024-01-17
Applicant: 清华大学
IPC: G06N5/04 , G06N5/025 , G06N5/02 , G06N3/042 , G06F40/284 , G06F40/216 , G06F16/36 , G06F16/31
Abstract: 本发明实施例提供了一种基于外部知识增强的大模型推理分析方法、系统及产品,涉及数据处理技术领域。该方法包括:通过大模型对待分析语句中蕴含的知识进行提取,得到内部知识图谱三元组;将所述待分析语句输入知识检索模块,得到外部知识图谱三元组;根据所述内部知识图谱三元组和所述外部知识图谱三元组,得到上下文子图,将所述上下文子图输入预先训练好的图神经网络推理分析模块,得到语句分析结果。通过本发明实施例的方法,可以通过外部知识的引入和基于图神经网络引导的推理过程设计,实现高度可靠、可解释的大模型推理分析系统。
-
公开(公告)号:CN117573813B
公开(公告)日:2024-03-19
申请号:CN202410063985.6
申请日:2024-01-17
Applicant: 清华大学
Abstract: 本发明提供了一种大语言模型内部知识定位探测方法、系统、设备及介质,具体涉及知识定位技术领域,通过获取待定位文本;将待定位文本输入至预先训练的知识探测模型中,预测待定位文本在大语言模型中每层对应的激活值,输出多个预测激活值;将最大预测激活值在大语言模型中的层数作为待定位文本的定位结果。上述方法在进行知识定位探测时仅通过预先训练好的知识探测模型生成待定位文本的预测激活值,根据该预测激活值可直接获取待定位文本在大语言模型中的层数,以低成本计算的方式快速实现大语言模型内部知识的定位探测。
-
公开(公告)号:CN117573850A
公开(公告)日:2024-02-20
申请号:CN202410063983.7
申请日:2024-01-17
Applicant: 清华大学
IPC: G06F16/332 , G06F16/36 , G06F16/33 , G06N5/02
Abstract: 本发明提供了一种基于知识图谱与内生知识融合的大模型问答方法及系统,涉及数据处理技术领域。本发明中,基于知识图谱获取待回答问题中的实体的相关知识,作为大模型外部知识,并获取大模型内与待回答问题相关的内部知识,将二者相融合后,得到关于待回答问题的答案,一方面利用实时更新的大模型外在知识,一方面通过让大模型回想出模型内部的内生文本信息,从而可以从多个维度增强大模型知识问答的准确性;并且,针对不同领域的大模型知识问答任务,只需调整相对应的外部知识图谱,即可快速、高效地完成不同领域之间的大模型问答系统,具有比较高的可扩展性。
-
公开(公告)号:CN117575026B
公开(公告)日:2024-04-05
申请号:CN202410063981.8
申请日:2024-01-17
Applicant: 清华大学
IPC: G06F16/36 , G06N5/025 , G06N5/02 , G06N3/042 , G06F40/284 , G06F40/216 , G06F16/31
Abstract: 本发明实施例提供了一种基于外部知识增强的大模型推理分析方法、系统及产品,涉及数据处理技术领域。该方法包括:通过大模型对待分析语句中蕴含的知识进行提取,得到内部知识图谱三元组;将所述待分析语句输入知识检索模块,得到外部知识图谱三元组;根据所述内部知识图谱三元组和所述外部知识图谱三元组,得到上下文子图,将所述上下文子图输入预先训练好的图神经网络推理分析模块,得到语句分析结果。通过本发明实施例的方法,可以通过外部知识的引入和基于图神经网络引导的推理过程设计,实现高度可靠、可解释的大模型推理分析系统。
-
公开(公告)号:CN117575007B
公开(公告)日:2024-04-05
申请号:CN202410063977.1
申请日:2024-01-17
Applicant: 清华大学
IPC: G06F16/36 , G06N5/02 , G06N5/04 , G06N3/0499 , G06N3/08
Abstract: 本发明提供了一种基于后解码可信增强的大模型知识补全方法及系统,涉及知识补全技术领域。本发明实施例中,针对目标知识领域,在大模型输出答案之前,使用后解码模块来对大模型的输出的隐层状态进行后解码处理,基于目标知识领域相对应的后解码模块,对大模型输出的隐层状态进行适当调整,可对错误内容进行修正,再基于融合模块对大模型输出的Sn和后解码模块输出的解码后的状态Rn进行融合,计算得到最终结果,进行知识补全,可以缓解大模型的“幻觉”输出问题,增强知识补全过程的准确性;并且可在不同知识领域的知识补全任务中高效扩展,能够准确地补全知识的缺失部分。
-
公开(公告)号:CN117573850B
公开(公告)日:2024-04-05
申请号:CN202410063983.7
申请日:2024-01-17
Applicant: 清华大学
IPC: G06F16/332 , G06F16/36 , G06F16/33 , G06N5/02
Abstract: 本发明提供了一种基于知识图谱与内生知识融合的大模型问答方法及系统,涉及数据处理技术领域。本发明中,基于知识图谱获取待回答问题中的实体的相关知识,作为大模型外部知识,并获取大模型内与待回答问题相关的内部知识,将二者相融合后,得到关于待回答问题的答案,一方面利用实时更新的大模型外在知识,一方面通过让大模型回想出模型内部的内生文本信息,从而可以从多个维度增强大模型知识问答的准确性;并且,针对不同领域的大模型知识问答任务,只需调整相对应的外部知识图谱,即可快速、高效地完成不同领域之间的大模型问答系统,具有比较高的可扩展性。
-
公开(公告)号:CN117575007A
公开(公告)日:2024-02-20
申请号:CN202410063977.1
申请日:2024-01-17
Applicant: 清华大学
IPC: G06N5/02 , G06N5/04 , G06N3/0499 , G06N3/08
Abstract: 本发明提供了一种基于后解码可信增强的大模型知识补全方法及系统,涉及知识补全技术领域。本发明实施例中,针对目标知识领域,在大模型输出答案之前,使用后解码模块来对大模型的输出的隐层状态进行后解码处理,基于目标知识领域相对应的后解码模块,对大模型输出的隐层状态进行适当调整,可对错误内容进行修正,再基于融合模块对大模型输出的Sn和后解码模块输出的解码后的状态Rn进行融合,计算得到最终结果,进行知识补全,可以缓解大模型的“幻觉”输出问题,增强知识补全过程的准确性;并且可在不同知识领域的知识补全任务中高效扩展,能够准确地补全知识的缺失部分。
-
公开(公告)号:CN117573813A
公开(公告)日:2024-02-20
申请号:CN202410063985.6
申请日:2024-01-17
Applicant: 清华大学
Abstract: 本发明提供了一种大语言模型内部知识定位探测方法、系统、设备及介质,具体涉及知识定位技术领域,通过获取待定位文本;将待定位文本输入至预先训练的知识探测模型中,预测待定位文本在大语言模型中每层对应的激活值,输出多个预测激活值;将最大预测激活值在大语言模型中的层数作为待定位文本的定位结果。上述方法在进行知识定位探测时仅通过预先训练好的知识探测模型生成待定位文本的预测激活值,根据该预测激活值可直接获取待定位文本在大语言模型中的层数,以低成本计算的方式快速实现大语言模型内部知识的定位探测。
-
公开(公告)号:CN117577119B
公开(公告)日:2024-04-05
申请号:CN202410063988.X
申请日:2024-01-17
Applicant: 清华大学
Abstract: 本发明提供了一种融合大语言模型的伪造语音检测方法、系统、设备及介质,涉及语音检测技术领域,通过获取待检测语音;通过预先训练的声学编码模块从待检测语音中提取声学特征序列,并对所述声学特征序列进行处理,得到声学编码序列和音素序列;通过预先训练的大语言模型模块对所述音素序列进行编码,得到音素编码序列;将声学编码序列和音素编码序列输入至预先训练的多模态融合分类模块中,得到语音检测结果。上述方法不仅将声学信息和音素信息进行融合,同时结合大语言模型强大的泛化性与模式识别能力,以使检测方法同时具有强鲁棒性和对于伪造语音类型的强泛化性。
-
-
-
-
-
-
-
-
-