-
公开(公告)号:CN116955559A
公开(公告)日:2023-10-27
申请号:CN202310908299.X
申请日:2023-07-21
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F40/35 , G06F40/289 , G06N3/0442 , G06N3/08
Abstract: 本申请涉及智能问答技术领域,提供一种问答匹配方法、装置、电子设备及存储介质。该方法包括:获取问答请求文本对应的第一分词集合,及问答请求文本对应的至少一个召回候选文本各自的第二分词集合;将第一分词集合及至少一个第二分词集合,分别输入至双向长短期记忆模型中,得到双向长短期记忆模型输出的第一分词集合对应的第一关键词集合,及至少一个第二分词集合各自对应的第二关键词集合;从至少一个第二关键词集合中,确定第一关键词集合对应的目标关键词集合;根据目标关键词集合,确定问答请求文本对应的答复文本。该方法无需对双向长短期记忆模型进行离线计算,可有效降低离线模型的训练时间,使得最终得到的答复文本的准确性较高。
-
公开(公告)号:CN112559719A
公开(公告)日:2021-03-26
申请号:CN202011556347.6
申请日:2020-12-23
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338
Abstract: 本发明实施例公开了一种意图识别方法、装置、电子设备和存储介质,涉及自然语言处理领域。意图识别方法包括:对待识别语音数据进行处理,获取所述待识别语音数据中的用户对象;获取所述用户对象的至少两个历史识别数据;对所述待识别语音数据进行意图识别,获取意图结果,并对所述意图结果进行评分,获取意图评分;根据所述历史识别数据、所述意图结果和所述意图评分获取意图识别结果。将本发明应用在智能设备中,来达到提高智能设备在进行意图识别时的识别结果准确率的目的。
-
公开(公告)号:CN116913263A
公开(公告)日:2023-10-20
申请号:CN202310940229.2
申请日:2023-07-28
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G10L15/18 , G10L15/16 , G10L15/22 , G10L17/06 , G06F16/432 , G06F16/435 , G06F40/35 , G06N3/0455
Abstract: 本发明涉及语义识别领域,提供一种融合用户特征的语义理解方法、装置及电子设备。方法包括:获取待处理文本,将待处理文本输入语义理解模型,基于语义理解模型对待处理文本进行第一次语义理解,得到初始语义理解结果;根据初始语义理解结果判断是否需要进行第二次语义理解;若确定需要进行第二次语义理解,则根据初始语义理解结果获取媒资信息,根据媒资信息获取媒资的内容热度特征和目标用户的用户特征;将内容热度特征和用户特征输入语义理解模型进行处理,并结合初始语义理解结果得到最终语义理解结果。本发明提供的一种融合用户特征的语义理解方法可以解决一般语义理解模型无法针对模糊文本输出一个准确的识别结果的问题。
-
公开(公告)号:CN112231474A
公开(公告)日:2021-01-15
申请号:CN202011091700.8
申请日:2020-10-13
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/35
Abstract: 本发明实施例涉及自然语言处理,公开了一种意图识别方法、系统、电子设备及存储介质。本发明中,获取待识别的交互文本;对交互文本进行领域分类,得到交互文本所属领域的分类结果;根据分类结果对包括所有授权领域的第一领域集进行降维处理,得到与分类结果相关的第二领域集;根据第二领域集对交互文本进行意图识别,得到识别结果。本发明实施例通过对交互文本进行领域分类,根据分类结果对第一领域集降维得到第二领域集,将第二领域集与交互文本进行意图匹配,得到识别结果,减少意图识别需要的识别时间,提高意图识别效率。
-
公开(公告)号:CN111241814A
公开(公告)日:2020-06-05
申请号:CN201911410367.X
申请日:2019-12-31
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/232 , G06F40/30 , G10L15/26 , G10L15/30
Abstract: 本发明实施例涉及自然语言处理领域,公开了一种语音识别文本的纠错方法、装置、电子设备及存储介质。本发明中接收语音信息;识别语音信息对应的至少一个用户意图;根据识别的至少一个用户意图,在云端数据集中选取用户意图的所有数据作为个性化模糊数据集;结合个性化模糊数据集与预先设置的基础模糊数据集对根据语音信息所识别的文本进行纠错,通过用户的个性化用户意图在保证纠错准确性的同时减少纠错所需数据量,提高纠错效率。
-
公开(公告)号:CN116956859A
公开(公告)日:2023-10-27
申请号:CN202310915243.7
申请日:2023-07-24
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/186 , G06F40/216 , G06F40/284 , G06F40/295 , G06F40/30 , G06F16/35 , G10L15/26
Abstract: 本发明提供一种文本改写方法、语音交互方法、装置及电子设备,其中方法包括:获取待改写文本,识别待改写文本中的命名实体,并确定命名实体在待改写文本中的位置信息;将位置信息和待改写文本输入至语言模型中,由语言模型得到并输出待改写文本的第一改写文本;将位置信息和待改写文本输入至图网络中,由图网络得到并输出第二改写文本;分别确定第一改写文本和第二改写文本的困惑度,将困惑度最低的改写文本确定为待改写文本的目标改写文本。此过程结合命名实体的位置信息,并基于双路连续重复文本合并的方法,计算不同通道改写后文本的语义流畅度获取最优改写文本,更好地避免对命名实体的错误改写,提高目标改写文本的准确性和可靠性。
-
公开(公告)号:CN116955654A
公开(公告)日:2023-10-27
申请号:CN202211019555.1
申请日:2022-08-24
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/38 , G06F40/232
Abstract: 本申请实施例公开了一种信息确定方法,该方法包括:获取待检测影视文本信息,目标文本检索模型中存在与待检测影视文本信息匹配的第一文本信息的情况下,基于第一文本信息确定目标文本信息;其中,目标文本检索模型中包括影视实体文本;在目标文本检索模型中不存在与待检测影视文本信息匹配的第一文本信息的情况下,基于目标文本纠错模型对待检测影视文本信息进行处理,确定目标文本信息。本申请实施例还公开了一种信息确定设备及计算机可读存储介质。
-
公开(公告)号:CN116910220A
公开(公告)日:2023-10-20
申请号:CN202310950620.0
申请日:2023-07-31
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请涉及人工智能技术领域,提供一种多轮对话交互处理方法、装置、设备和存储介质。该方法包括:采集历史对话数据和当前对话数据,将历史对话数据和当前对话数据输入至预先训练的联合模型,获取联合模型输出的历史对话向量和当前对话向量;对历史对话数据和当前对话数据进行拼接,得到拼接数据,将拼接数据输入至联合模型,获取联合模型输出的向量化的语义信息;基于历史对话向量和当前对话向量,确定需要进行文本检索,则基于向量化的语义信息,获取检索文本;基于检索文本,生成应答信息。本申请可以在判断是否引用知识的同时还能够通过用户语义信息生成合适的检索关键词去查询知识图谱,基于此,提高了智能对话的效率和准确性。
-
公开(公告)号:CN111241814B
公开(公告)日:2023-04-28
申请号:CN201911410367.X
申请日:2019-12-31
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/232 , G06F40/30 , G10L15/26 , G10L15/30
Abstract: 本发明实施例涉及自然语言处理领域,公开了一种语音识别文本的纠错方法、装置、电子设备及存储介质。本发明中接收语音信息;识别语音信息对应的至少一个用户意图;根据识别的至少一个用户意图,在云端数据集中选取用户意图的所有数据作为个性化模糊数据集;结合个性化模糊数据集与预先设置的基础模糊数据集对根据语音信息所识别的文本进行纠错,通过用户的个性化用户意图在保证纠错准确性的同时减少纠错所需数据量,提高纠错效率。
-
公开(公告)号:CN112528657A
公开(公告)日:2021-03-19
申请号:CN202011549896.0
申请日:2020-12-23
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明实施例涉及数据分析与处理技术领域,公开了一种基于双向LSTM的文本意图识别方法及装置、服务器和介质。该方法包括:对待识别意图的初始语料进行分词后转换成向量矩阵;将向量矩阵传入双向LSTM神经网络进行训练;根据双向LSTM神经网络的输出进行分类得到初始语料的意图。本发明实施例能够基于文本的时序特征信息进行意图识别,提高准确率,同时还能够在保证准确率的情况下,降低内存占用,提高训练效率。
-
-
-
-
-
-
-
-
-