一种用户意图的语料扩展方法和系统

    公开(公告)号:CN111339309A

    公开(公告)日:2020-06-26

    申请号:CN202010440488.5

    申请日:2020-05-22

    Abstract: 本说明书的实施例公开了一种用户意图的语料扩展方法,该方法包括:获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图;从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术为对话记录中的服务话术;确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。

    一种训练词语权重模型的方法和系统

    公开(公告)号:CN111324722A

    公开(公告)日:2020-06-23

    申请号:CN202010409812.7

    申请日:2020-05-15

    Abstract: 本说明书实施例提供一种训练词语权重模型的方法和系统。所述方法包括:获取多个文本对;判断所述文本对中两个文本之间是否匹配,得到匹配结果;基于所述匹配结果确定所述文本对中文本的词语的重要性标识,得到含有所述重要性标识的多个文本对;基于多个训练数据训练词语权重模型,所述训练数据来源于含有所述重要性标识的多个文本对中的文本。

    用于处理文本的方法和装置

    公开(公告)号:CN111291172A

    公开(公告)日:2020-06-16

    申请号:CN202010146072.2

    申请日:2020-03-05

    Inventor: 王子豪 崔恒斌

    Abstract: 本说明书的实施例提供了用于处理文本的方法、装置、计算设备和机器可读存储介质。该方法包括:从用户与客服的当前对话数据中获取当前用户问句文本的上文信息;基于当前用户问句文本和上文信息,获取预先确定的至少一个候选回复文本;利用候选回复文本评分模型对当前用户问句文本、上文信息和至少一个候选回复文本进行处理,得到至少一个候选回复文本的评分结果,每个候选回复文本的评分结果表示该候选回复文本与当前用户问句文本的匹配程度;基于至少一个候选回复文本的评分结果,从至少一个候选回复文本中选择m个候选回复文本,作为要向客服呈现的目标回复文本,m为正整数。

    基于语音识别结果进行意图分类的方法和装置

    公开(公告)号:CN111177324A

    公开(公告)日:2020-05-19

    申请号:CN201911421937.5

    申请日:2019-12-31

    Abstract: 本说明书实施例提供一种基于语音识别结果进行意图分类的方法和装置,方法包括:获取针对目标语音进行自动语音识别后得到的目标文本;从预先建立的汉字到拼音的映射表中,查找所述目标文本包含的各汉字分别对应的拼音;基于所述各汉字分别对应的拼音,形成目标拼音序列;将所述目标文本和所述目标拼音序列作为目标文本语音对,将所述目标文本语音对输入预先训练的文本编码模型,通过所述文本编码模型输出所述目标文本语音对对应的目标编码向量;根据所述目标编码向量,对所述目标语音进行意图分类。能够降低意图分类的错误率。

    客服场景下用户问句的回复方法、装置及设备

    公开(公告)号:CN110765253A

    公开(公告)日:2020-02-07

    申请号:CN201911008117.3

    申请日:2019-10-22

    Abstract: 本说明书实施例提供一种客服场景下用户问句的回复方法、装置及设备,在回复方法中,接收第一租户下的当前用户问句。针对当前用户问句,获取当前用户问句的上下文信息。基于第一租户的租户标识、当前用户问句和上下文信息,生成新用户问句。基于新用户问句,从与第一租户对应的知识库中召回预定数目个答案。将预定数目个答案中的各答案以及新用户问句输入预测模型,以预测各答案与新用户问句的匹配分数。该预测模型包括多个租户共享的底层网络部分和多个租户分别对应的多个上层网络部分,多个上层网络部分具有相同的网络结构,以及针对不同租户训练得到的不同网络参数。基于匹配分数,从各答案中确定出目标答案并返回。

Patent Agency Ranking