一种定标集确定方法及装置

    公开(公告)号:CN110096708B

    公开(公告)日:2023-12-01

    申请号:CN201910361757.6

    申请日:2019-04-30

    Abstract: 本申请公开了一种定标集确定方法及装置,本方法首先获取各答题对象对目标题目的答题内容,然后根据各所述答题内容间的属性差别,对各答题内容进行聚类,通过聚类可以将属性相近的答题内容聚集到一个聚类簇中,由此得到至少两个聚类簇,其中,从属于同一聚类簇的各答题内容的属性差别更小,而从属于不同聚类簇的答题内容的属性差别更大。进一步,从每个聚类簇中抽取答题内容,由抽取的答题内容组成定标集。综上可见,本申请抽取的定标集包含了各个聚类簇中的答题内容,也即覆盖了各属性的答题内容,保证了定标集的均衡性。进一步,基于本申请抽取的定标集训练的自动评测模型,其评测准确度也会更高。

    用户意图识别方法、识别装置和电子设备

    公开(公告)号:CN114238601B

    公开(公告)日:2024-12-17

    申请号:CN202111505842.9

    申请日:2021-12-10

    Inventor: 赵峻瑶 常剑 王栋

    Abstract: 本发明提供一种用户意图识别方法、识别装置和电子设备,所述用户意图识别方法,包括:对当前会话信息进行编码,生成当前会话编码;基于所述当前会话编码和历史会话编码,生成当前的第一用户意图信息;基于所述第一用户意图信息和第一意图预测信息,生成所述当前会话信息对应的目标用户意图信息;所述第一意图预测信息用于表征上一轮会话信息确定的预测意图与所述第一用户意图信息的相关性。本发明的用户意图识别方法,可以对上一轮会话信息的意图理解进行有效判断,并在上一轮判断错误的情况下对本轮的用户意图信息进行及时修正,以生成最终的目标用户意图信息,从而保证在出现意图理解错误时,对话依然能够正常进行。

    文本表示方法、装置、电子设备与存储介质

    公开(公告)号:CN114118022B

    公开(公告)日:2024-10-25

    申请号:CN202111452650.6

    申请日:2021-12-01

    Abstract: 本发明提供一种文本表示方法、装置、电子设备与存储介质,所述方法包括:确定目标文本;将目标文本输入至跨语种文本表示模型,得到跨语种文本表示模型输出的文本表示,所述文本表示为所述目标文本的编码表示;其中,所述跨语种文本表示模型是以样本文本的文本表示与对应的样本正例的正例表示之间的一致性,以及所述样本文本的文本表示与对应的样本负例的负例表示之间的差异性为目标训练得到的,所述样本正例与所述样本文本的语种不同且语义相同,所述样本负例与所述样本文本的语种不同且语义不同。本发明提供的方法、装置、电子设备与存储介质,实现了不需要花费长时间的训练、仅需要少量的语料数据即可获得跨语种文本表示模型效果显著的提升。

    信息处理方法、装置、系统及电子设备

    公开(公告)号:CN118245576A

    公开(公告)日:2024-06-25

    申请号:CN202311867130.0

    申请日:2023-12-28

    Abstract: 本申请公开了一种信息处理方法、装置、系统及电子设备,应用于对话系统,包括:确定当前对话信息;基于参照信息改写当前对话信息,得到目标对话信息;参照信息包括当前对话信息的关联信息;基于目标对话信息进行信息交互,响应于目标对话信息满足第一约束,基于信息源执行检索步骤,以确定第一交互结果;将目标对话信息和第一交互结果输入预置的大语言模型,得到回复信息。本申请提供的方法在通过改写获得目标对话信息,对目标对话信息基于信息源进行检索,确定第一交互结果,通过预置的大语言模型基于目标对话信息和第一交互结果输出回复信息,提高了对话系统对信息的处理能力,加快了对话系统的反应速度,对系统的算力要求小。

    用户意图识别方法、识别装置和电子设备

    公开(公告)号:CN114238601A

    公开(公告)日:2022-03-25

    申请号:CN202111505842.9

    申请日:2021-12-10

    Inventor: 赵峻瑶 常剑 王栋

    Abstract: 本发明提供一种用户意图识别方法、识别装置和电子设备,所述用户意图识别方法,包括:对当前会话信息进行编码,生成当前会话编码;基于所述当前会话编码和历史会话编码,生成当前的第一用户意图信息;基于所述第一用户意图信息和第一意图预测信息,生成所述当前会话信息对应的目标用户意图信息;所述第一意图预测信息用于表征上一轮会话信息确定的预测意图与所述第一用户意图信息的相关性。本发明的用户意图识别方法,可以对上一轮会话信息的意图理解进行有效判断,并在上一轮判断错误的情况下对本轮的用户意图信息进行及时修正,以生成最终的目标用户意图信息,从而保证在出现意图理解错误时,对话依然能够正常进行。

    一种对话语料库的扩容方法、装置、设备及存储介质

    公开(公告)号:CN112231458B

    公开(公告)日:2023-03-21

    申请号:CN202011146220.7

    申请日:2020-10-23

    Abstract: 本申请提供了一种对话语料库的扩容方法、装置、设备及存储介质,其中,方法包括:获取输入文本总集;从输入文本总集中滤除在当前的对话语料库中存在匹配回复文本的输入文本,剩余的输入文本组成的集合作为目标输入文本集;利用预先建立的生成式对话生成模型,生成目标输入文本集中输入文本对应的回复文本,以得到第一对话语料集;将第一对话语料集中的对话语料加入当前的对话语料库。本申请提供的对话语料库的扩容方法可利用生成式对话生成模型自动生成输入文本对应的回复文本,从而得到对话语料,由于加入对话语料的对话语料自动生成,而无需人工编写,因此,获取对话语料的效率较高,人工成本较低。

Patent Agency Ranking