基于上下文的大语言模型对话处理方法、装置及电子设备

    公开(公告)号:CN119831045A

    公开(公告)日:2025-04-15

    申请号:CN202411915111.5

    申请日:2024-12-24

    Abstract: 本申请实施例公开了一种基于上下文的大语言模型对话处理方法、装置及电子设备,可解决如何提供一种基于上下文相似度分析与智能筛选的动态管理方法来优化大语言模型交互的问题。该方法包括:获取用户输入的当前文本信息;对当前文本信息和预存的多个历史对话信息分别进行编码,得到当前文本向量和多个历史对话向量;根据每个历史对话向量和当前文本向量之间的语义相似度,对多个历史对话向量进行筛选,得到筛选后的目标历史对话信息;将当前文本信息和筛选后的目标历史对话信息进行拼接,得到目标输入文本;将目标输入文本输入到目标语言模型中,得到目标输出响应信息,目标语言模型包括大语言模型。

    一种基于大语言模型的统一信息抽取方法、介质及设备

    公开(公告)号:CN117764062A

    公开(公告)日:2024-03-26

    申请号:CN202311671334.7

    申请日:2023-12-07

    Abstract: 本发明提供了一种基于大语言模型的统一信息抽取方法、介质及设备,涉及信息抽取技术领域,包括:获取待处理文本以及目标指令,将待处理文本和目标指令拼接后输入目标信息抽取模型,以得到目标信息抽取模型输出的信息抽取结果。目标信息抽取模型,通过以下步骤得到:获取若干原始文本集,对若干原始文本集中的每一原始文本,进行目标训练样本生成处理,以得到目标训练样本集,根据目标训练数据集对预设大语言模型进行训练,以得到目标信息抽取模型。本发明能够使得目标信息抽取模型具备抽取不同任务类型信息的能力,提高信息抽取的效率,并可以降低模型的发散性。

    一种针对大语言模型的推理过程的优化方法及装置

    公开(公告)号:CN119849626A

    公开(公告)日:2025-04-18

    申请号:CN202411916870.3

    申请日:2024-12-24

    Abstract: 本申请实施例提供了一种针对大语言模型的推理过程的优化方法及装置,涉及大语言模型技术领域,该方法具体为:接收用户输入的问题文本;获取所述问题文本对应的目标特征集合,并基于所述目标特征集合对所述问题文本进行复杂度量化评估,以获取所述问题文本对应的目标复杂度;所述目标特征集合中的特征用于表征所述问题文本的复杂性;基于所述目标复杂度确定待激活的解码层的目标数量M,并将所述目标数量的解码层进行激活;其中,M为大于等于1的整数;待M个解码层激活之后,利用所述M个解码层对所述问题文本进行解码分析,获取所述问题文本对应的目标答复文本。本申请能够提高大语言模型的推理效率,同时避免资源浪费。

    基于大模型的隐私保护方法、装置、设备及介质

    公开(公告)号:CN119830345A

    公开(公告)日:2025-04-15

    申请号:CN202411915119.1

    申请日:2024-12-24

    Abstract: 本公开实施例涉及一种基于大模型的隐私保护方法、装置、设备及介质,该方法包括:获取用户输入文本中的隐私信息以及隐私信息的实体类型标识;根据用户输入文本和实体类型标识,对隐私信息进行基于上下文的编码处理和基于类型的解码处理,得到隐私信息对应的替代信息;基于隐私信息和替代信息之间的对应关系,对用户输入文本进行基于问答模型的脱敏问答并恢复隐私信息,生成用户输入文本的应答文本。从而,提高了替代信息上下文语义的连贯性和完整性,以及替代信息与隐私信息的实体类型一致性,降低了将隐私信息替换为替代信息对脱敏问答的影响,在脱敏问答过程中保护了用户隐私,又使得最终生成的应答文本具有更好的准确性以及文本连贯性。

    一种基于大语言模型的统一信息抽取方法、介质及设备

    公开(公告)号:CN117764062B

    公开(公告)日:2025-02-14

    申请号:CN202311671334.7

    申请日:2023-12-07

    Abstract: 本发明提供了一种基于大语言模型的统一信息抽取方法、介质及设备,涉及信息抽取技术领域,包括:获取待处理文本以及目标指令,将待处理文本和目标指令拼接后输入目标信息抽取模型,以得到目标信息抽取模型输出的信息抽取结果。目标信息抽取模型,通过以下步骤得到:获取若干原始文本集,对若干原始文本集中的每一原始文本,进行目标训练样本生成处理,以得到目标训练样本集,根据目标训练数据集对预设大语言模型进行训练,以得到目标信息抽取模型。本发明能够使得目标信息抽取模型具备抽取不同任务类型信息的能力,提高信息抽取的效率,并可以降低模型的发散性。

Patent Agency Ranking