-
公开(公告)号:CN116822633A
公开(公告)日:2023-09-29
申请号:CN202311111582.6
申请日:2023-08-31
Applicant: 清华大学
IPC: G06N5/04 , G06F16/332
Abstract: 本发明涉及人工智技术领域,提供一种基于自我认知的模型推理方法、装置及电子设备,其中的方法包括:接收用户端的待解答问题;基于待解答问题,获取语言大模型的自我认知结果;根据自我认知结果,推理得到待解答问题的答案。该方法通过引入语言大模型的自我认知,根据语言大模型的自我认知情况,采用不同的推理模式对用户端的待解答问题进行推理,避免了单独通过语言大模型或检索增强进行推理而带来的模型推理准确度不高的情况,能够根据语言大模型的实际推理情况,适用最合适的推理模式,得到更准确的推理结果,有效提升了模型推理的准确度,也进一步提升了用户端的体验感。
-
公开(公告)号:CN116822633B
公开(公告)日:2023-12-26
申请号:CN202311111582.6
申请日:2023-08-31
Applicant: 清华大学
IPC: G06N5/04 , G06F16/332
Abstract: 本发明涉及人工智技术领域,提供一种基于自我认知的模型推理方法、装置及电子设备,其中的方法包括:接收用户端的待解答问题;基于待解答问题,获取语言大模型的自我认知结果;根据自我认知结果,推理得到待解答问题的答案。该方法通过引入语言大模型的自我认知,根据语言大模型的自我认知情况,采用不同的推理模式对用户端的待解答问题进行推理,避免了单独通过语言大模型或检索增强进行推理而带来的模型推理准确度不高的情况,能够根据语言大模型的实际推理情况,适用最合适的推理模式,得到更准确的推理结果,有效提升了模型推理的准确度,也进一步提升了用户端的体验感。
-
公开(公告)号:CN116501835A
公开(公告)日:2023-07-28
申请号:CN202310382374.3
申请日:2023-04-11
Applicant: 清华大学
IPC: G06F16/33 , G06F16/35 , G06F16/332
Abstract: 本发明提供一种用于非知识密集型任务的检索增强方法和装置,包括:获取待检索任务;将所述待检索任务输入至第一检索模块,在预存的数据库中进行检索,以获得第一预设数量个待选样本;将所述待选样本和所述待检索任务输入至第二检索模块,响应于任务提示对所述待选样本进行排序,并得到第二预设数量个检索样本;将所述检索样本输入至预存的答案生成模块中,以获得检索答案。本发明将检索分为两个阶段,在第一阶段使用第一检索模块获得待选样本,在第二阶段使用第二检索模块根据任务提示将待选样本重排,得到检索样本,根据检索样本获得检索答案。由于检索模块不需要进行训练,本发明可以在消耗较小的训练资源的同时,拥有较好适用性与较高准确度。
-
公开(公告)号:CN116011451A
公开(公告)日:2023-04-25
申请号:CN202211627954.6
申请日:2022-12-16
Applicant: 清华大学 , 北京智源人工智能研究院
IPC: G06F40/295 , G06V20/62 , G06V10/774 , G06V10/74
Abstract: 本发明提供一种命名实体识别方法、装置、电子设备及存储介质,其中,所述命名实体识别方法包括:获取待识别文本和待匹配开放图像,其中,所述待匹配开放图像通过所述待识别文本进行检索匹配得到;将所述待识别文本和所待匹配开放图像输入至多模态命名实体识别模型,得到所述多模态命名实体识别模型输出的命名实体识别结果,其中,所述多模态命名实体识别模型基于配对训练集训练得到,所述配对训练集包括多组配对训练数据,所述配对训练数据包括文本训练数据和图像训练数据,所述图像训练数据通过所述文本训练数据进行检索匹配得到。通过本发明提供的命名实体识别方法,提高了多模态命名实体识别模型输出的命名实体识别结果的准确度。
-
-
-