-
公开(公告)号:CN112256868A
公开(公告)日:2021-01-22
申请号:CN202011069841.X
申请日:2020-09-30
IPC分类号: G06F16/35 , G06F40/151 , G06K9/62 , G06N3/04
摘要: 本申请适用于终端人工智能技术领域,提供了零指代消解方法、训练零指代消解模型的方法及电子设备。上述训练零指代消解模型的方法包括:将训练文本中的所有词转换为第一向量;其中,训练文本中包括多个先行词和多个零代词,第一向量包括与各个先行词对应的第一先行词向量和与各个零代词对应的第一零代词向量,第一零代词向量中包含零代词的位置信息;将零代词的位置信息融合到第一先行词向量中,得到第二先行词向量;基于第一零代词向量和第二先行词向量,确定每个先行词的理论类别标签;其中,每个先行词对应一个预设类别标签;根据每个先行词的理论类别标签与预设类别标签,对零指代消解模型进行训练。上述方法能够提高零指代消解的准确性。
-
公开(公告)号:CN115935050A
公开(公告)日:2023-04-07
申请号:CN202111017439.1
申请日:2021-08-31
IPC分类号: G06F16/9535 , G06F18/214
摘要: 本申请实施例公开了一种信息推荐方法、训练方法及相关装置,用于使得用户明确自己的需求,以提高推荐的信息的准确性。本申请实施例方法包括:获取用户对于第一问题的第一反馈信息,第一问题是基于第一槽位提出的;基于第一反馈信息和第二槽位向用户推荐第一信息;获取用户对于第一信息的第二反馈信息;基于第一反馈信息和第二反馈信息,并通过第一模型向用户推荐第二信息。
-
公开(公告)号:CN116431784A
公开(公告)日:2023-07-14
申请号:CN202310302845.5
申请日:2023-03-24
申请人: 哈尔滨工业大学
IPC分类号: G06F16/332 , G06F16/335 , G06F16/338
摘要: 一种利用相邻信息增强对话式推荐系统的方法,它属于计算机人工智能技术领域。本发明解决了现有的对话式推荐系统存在稀疏用户偏好以及训练数据不足的问题。本发明检索相邻物品,利用当前对话和相邻物品来构建伪标签数据缓解训练集数据不足的问题,增强对话式推荐系统的训练过程;检索相邻对话,并利用相邻对话的信息来缓解用户稀疏偏好挑战,增强对话式推荐系统的预测物品的过程;本发明方法对缓解对话式推荐系统的稀疏用户偏好以及训练数据不足的挑战起到很好的作用,可以使对话式推荐系统的物品推荐和回复生成效果均有显著的提升。本发明方法可以应用于计算机人工智能领域用。
-
公开(公告)号:CN113392629B
公开(公告)日:2022-10-28
申请号:CN202110733081.6
申请日:2021-06-29
申请人: 哈尔滨工业大学
IPC分类号: G06F40/211 , G06F40/284 , G06F40/295 , G06N3/04 , G06N3/08
摘要: 基于预训练模型的人称代词消解方法,涉及人工智能技术领域,针对现有技术中代词消解的准确率低问题,本申请模型使用基于排序的代词消解框架,对于一个待消解的代词,存在一个候选先行词的集合,对于每一个候选先行词进行消解打分,打分最高的候选先行词作为消解对象进行消解。本申请引入预训练模型,利用预训练模型使用大量无标注文本进行训练的特点,能够更好的捕捉上下文信息,有效提高代词消解的指标,从而更好的帮助下游任务,提高代词消解的准确率,并提高了代词消解的效率。
-
公开(公告)号:CN107679225B
公开(公告)日:2021-03-09
申请号:CN201710986821.0
申请日:2017-10-20
申请人: 哈尔滨工业大学
IPC分类号: G06F16/332
摘要: 一种基于关键词的回复生成方法,本发明涉及基于关键词的回复生成方法。本发明为了解决现有方法灵活性差、容易产生语意损失,以及序列对序列模型倾向于生成一般性万能回复的问题。本发明包括:一:根据输入的消息生成关键词;二:将输入的消息转化成上下文向量,将第一个关键词和上下文向量送入解码器,若得到的预测结果与第一个关键词一致,则将第二个关键词和上下文向量送入解码器;若得到的预测结果与第一个关键词不一致,则仍将第一个关键词和上下文向量送入解码器,直至得到的预测结果与第一个关键词一致后,再将第二个关键词和上下文向量送入解码器,直至所有关键词按顺序送入解码器,并得到预测结果。本发明用于聊天机器人回复生成领域。
-
公开(公告)号:CN118364103A
公开(公告)日:2024-07-19
申请号:CN202410461572.3
申请日:2024-04-17
申请人: 哈尔滨工业大学
IPC分类号: G06F16/35 , G06F18/21 , G06F18/2431 , G06F40/216 , G06N3/042 , G06N3/0455 , G06N3/0895 , G06N5/045
摘要: 本发明属于自然语言处理技术领域,具体涉及一种自验证式的探索预训练语言模型中明喻知识的方法及其系统。步骤1、构建多级明喻识别数据集;步骤2、创建多级明喻识别任务,帮助PLMs评估明喻质量;步骤3、将多级明喻识别分数融合进明喻生成任务。本发明为解决现有预训练语言模型无法很好评价明喻好坏从而无法很好地探索明喻知识的问题。
-
公开(公告)号:CN108681538B
公开(公告)日:2022-02-22
申请号:CN201810523282.1
申请日:2018-05-28
申请人: 哈尔滨工业大学
IPC分类号: G06F40/289 , G06F40/284 , G06F40/211 , G06N3/04
摘要: 一种基于深度学习的动词短语省略消解方法,它属于计算机人工智能技术领域。本发明解决了现有动词短语省略消解方法存在的触发词判断和先行短语识别准确率低的问题。本发明对确定好的数据集1和数据集2进行预处理;判断触发词的过程加入了对句子上下文特征和句子级特征的提取,将提取的句子特征转化为向量输入支持向量机,进而根据支持向量机的输出结果确定输入句子的触发词;最后利用多层感知机,从触发词生成的多个候选先行短语中识别出正确的先行短语。本发明提取句子特征时加入了上下文特征和句子级特征,可以使触发词判断的准确率达到90%左右,先行短语识别的准确率达到85%以上。本发明可以应用于计算机人工智能技术领域用。
-
公开(公告)号:CN108681538A
公开(公告)日:2018-10-19
申请号:CN201810523282.1
申请日:2018-05-28
申请人: 哈尔滨工业大学
CPC分类号: G06F17/277 , G06F17/271 , G06F17/2775 , G06N3/0445
摘要: 一种基于深度学习的动词短语省略消解方法,它属于计算机人工智能技术领域。本发明解决了现有动词短语省略消解方法存在的触发词判断和先行短语识别准确率低的问题。本发明对确定好的数据集1和数据集2进行预处理;判断触发词的过程加入了对句子上下文特征和句子级特征的提取,将提取的句子特征转化为向量输入支持向量机,进而根据支持向量机的输出结果确定输入句子的触发词;最后利用多层感知机,从触发词生成的多个候选先行短语中识别出正确的先行短语。本发明提取句子特征时加入了上下文特征和句子级特征,可以使触发词判断的准确率达到90%左右,先行短语识别的准确率达到85%以上。本发明可以应用于计算机人工智能技术领域用。
-
公开(公告)号:CN107679225A
公开(公告)日:2018-02-09
申请号:CN201710986821.0
申请日:2017-10-20
申请人: 哈尔滨工业大学
IPC分类号: G06F17/30
摘要: 一种基于关键词的回复生成方法,本发明涉及基于关键词的回复生成方法。本发明为了解决现有方法灵活性差、容易产生语意损失,以及序列对序列模型倾向于生成一般性万能回复的问题。本发明包括:一:根据输入的消息生成关键词;二:将输入的消息转化成上下文向量,将第一个关键词和上下文向量送入解码器,若得到的预测结果与第一个关键词一致,则将第二个关键词和上下文向量送入解码器;若得到的预测结果与第一个关键词不一致,则仍将第一个关键词和上下文向量送入解码器,直至得到的预测结果与第一个关键词一致后,再将第二个关键词和上下文向量送入解码器,直至所有关键词按顺序送入解码器,并得到预测结果。本发明用于聊天机器人回复生成领域。
-
公开(公告)号:CN116340488A
公开(公告)日:2023-06-27
申请号:CN202310298629.8
申请日:2023-03-24
申请人: 哈尔滨工业大学
IPC分类号: G06F16/332 , G06F16/335 , G06F16/338
摘要: 面向开放域人机对话的技能推荐系统,它属于计算机人工智能技术领域。本发明解决了现有开放域人机对话中存在的当用户输入中有错误或者歧义信息时机器人可能做出与对话上下文不连贯的回复,以及没有特定的技能引导语句的问题。本发明利用基于弱监督学习的技能识别模块识别用户输入文本中的技能需求。闲聊回复模块根据用户输入分别采用生成式和检索式模型生成候选回复,在排序阶段通过基于Bert的文本相关性打分器对候选回复进行排序打分,选择得分最高的回复作为最优的闲聊回复,技能推荐模块根据最优的闲聊回复主动推荐合适的技能,生成包含推荐技能的流畅回复。本发明方法可以应用于开放域人机对话中的技能推荐。
-
-
-
-
-
-
-
-
-