零指代消解方法、训练零指代消解模型的方法及电子设备

    公开(公告)号:CN112256868A

    公开(公告)日:2021-01-22

    申请号:CN202011069841.X

    申请日:2020-09-30

    摘要: 本申请适用于终端人工智能技术领域,提供了零指代消解方法、训练零指代消解模型的方法及电子设备。上述训练零指代消解模型的方法包括:将训练文本中的所有词转换为第一向量;其中,训练文本中包括多个先行词和多个零代词,第一向量包括与各个先行词对应的第一先行词向量和与各个零代词对应的第一零代词向量,第一零代词向量中包含零代词的位置信息;将零代词的位置信息融合到第一先行词向量中,得到第二先行词向量;基于第一零代词向量和第二先行词向量,确定每个先行词的理论类别标签;其中,每个先行词对应一个预设类别标签;根据每个先行词的理论类别标签与预设类别标签,对零指代消解模型进行训练。上述方法能够提高零指代消解的准确性。

    一种大语言模型的集成检索增强方法、电子设备和存储介质

    公开(公告)号:CN118551835A

    公开(公告)日:2024-08-27

    申请号:CN202410564146.2

    申请日:2024-05-08

    IPC分类号: G06N5/022

    摘要: 本发明属于自然语言处理技术领域,具体设计一种大语言模型的集成检索增强方法、电子设备和存储介质。所述集成检索增强方法具体为,控制器根据用户输入调用多个检索器,返回多源多篇文档,并通过多种处理方式将不同文档整合扰动为多篇知识段,分别输入生成模块。生成模块返回多个回复后,控制模块通过回复间的一致性和客观打分器,选出最优回复。将最优参数搜索转化为一个目标函数不可导的优化问题,可以通过元启发搜索算法找到最优的检索增强配置,有效提升大语言模型在事实性问题上的能力。

    为角色化对话构建可扩展且安全的角色提示方法及其提示系统

    公开(公告)号:CN118551771A

    公开(公告)日:2024-08-27

    申请号:CN202410564144.3

    申请日:2024-05-08

    IPC分类号: G06F40/35 G06N3/006

    摘要: 本发明属于自然语言处理的类人的对话智能体技术方案,具体涉及一种为角色化对话构建可扩展且安全的角色提示方法及其提示系统。步骤1:组合式角色提示构建;步骤2:基于步骤1的组合式角色提示进行安全优化;步骤3:基于步骤2的安全优化的角色提示,进行角色化对话模拟。本发明用于解决人工构建角色化对话数据成本高昂,自动收集角色化对数据角色信息稀缺,以及直接应用简单地自动生成的提示让LLMs模拟角色可能会带来社会偏见和刻板印象等问题。

    奖励引导的自动越狱提示生成方法

    公开(公告)号:CN118551797A

    公开(公告)日:2024-08-27

    申请号:CN202410564150.9

    申请日:2024-05-08

    IPC分类号: G06N3/006

    摘要: 本发明提出奖励引导的自动越狱提示生成方法。该方法包括步骤1:初始化种子池,采集互联网上流传的越狱提示作为初始种子;步骤2:演化得到新提示,所述步骤2包含种子提示选择和演化两个环节;选择分数最高的种子,通过演化方法基于选中种子得到新的越狱提示;步骤3:评估新提示攻击效果。所述方法采用搜索的方式进行攻击充分利用了已有的越狱提示,具备攻击成功率高、效率高的优点,此外本发明引入奖励模型作为指导信号、提示融合作为演化方法进一步提高了算法的性能。

    一种基于层次化注意力机制的多轮对话模型构建方法

    公开(公告)号:CN107766506A

    公开(公告)日:2018-03-06

    申请号:CN201710986813.6

    申请日:2017-10-20

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30654

    摘要: 本发明涉及一种基于层次化注意力机制的多轮对话模型构建方法,是为了解决现有的人机对话系统依赖于大规模语料,训练速度受到语料规模的影响,并且由于对话生成的回复不唯一性,Seq2Seq模型总是倾向于生成通用,无意义的回复的缺点,而提出一种基于层次化注意力机制的多轮对话模型构建方法,包括:接收句子输入,针对每一个句子,从第一个单词开始计算加密隐函数,计算第每个句子的Attention权重,并计算话题语境表示向量,最后计算解密隐函数,同时将结果进行输出。本发明适用于开放域的聊天机器人系统。