-
公开(公告)号:CN105468609A
公开(公告)日:2016-04-06
申请号:CN201410429144.9
申请日:2014-08-27
申请人: 中兴通讯股份有限公司 , 哈尔滨工业大学
摘要: 本发明提供了一种获取复述短语的方法,该方法包括:利用统计机器翻译系统执行一次翻译和二次翻译,依次得到一次翻译结果和二次翻译结果;所述一次翻译为从源短语到中间短语的翻译;所述二次翻译为从中间短语到复述短语的翻译;根据所述一次翻译结果和二次翻译结果确定从源短语到复述短语的关联关系。本发明还提供了一种获取复述短语的装置、一种基于复述短语的问题改写方法及装置。
-
公开(公告)号:CN116431784A
公开(公告)日:2023-07-14
申请号:CN202310302845.5
申请日:2023-03-24
申请人: 哈尔滨工业大学
IPC分类号: G06F16/332 , G06F16/335 , G06F16/338
摘要: 一种利用相邻信息增强对话式推荐系统的方法,它属于计算机人工智能技术领域。本发明解决了现有的对话式推荐系统存在稀疏用户偏好以及训练数据不足的问题。本发明检索相邻物品,利用当前对话和相邻物品来构建伪标签数据缓解训练集数据不足的问题,增强对话式推荐系统的训练过程;检索相邻对话,并利用相邻对话的信息来缓解用户稀疏偏好挑战,增强对话式推荐系统的预测物品的过程;本发明方法对缓解对话式推荐系统的稀疏用户偏好以及训练数据不足的挑战起到很好的作用,可以使对话式推荐系统的物品推荐和回复生成效果均有显著的提升。本发明方法可以应用于计算机人工智能领域用。
-
公开(公告)号:CN113392629B
公开(公告)日:2022-10-28
申请号:CN202110733081.6
申请日:2021-06-29
申请人: 哈尔滨工业大学
IPC分类号: G06F40/211 , G06F40/284 , G06F40/295 , G06N3/04 , G06N3/08
摘要: 基于预训练模型的人称代词消解方法,涉及人工智能技术领域,针对现有技术中代词消解的准确率低问题,本申请模型使用基于排序的代词消解框架,对于一个待消解的代词,存在一个候选先行词的集合,对于每一个候选先行词进行消解打分,打分最高的候选先行词作为消解对象进行消解。本申请引入预训练模型,利用预训练模型使用大量无标注文本进行训练的特点,能够更好的捕捉上下文信息,有效提高代词消解的指标,从而更好的帮助下游任务,提高代词消解的准确率,并提高了代词消解的效率。
-
公开(公告)号:CN107679225B
公开(公告)日:2021-03-09
申请号:CN201710986821.0
申请日:2017-10-20
申请人: 哈尔滨工业大学
IPC分类号: G06F16/332
摘要: 一种基于关键词的回复生成方法,本发明涉及基于关键词的回复生成方法。本发明为了解决现有方法灵活性差、容易产生语意损失,以及序列对序列模型倾向于生成一般性万能回复的问题。本发明包括:一:根据输入的消息生成关键词;二:将输入的消息转化成上下文向量,将第一个关键词和上下文向量送入解码器,若得到的预测结果与第一个关键词一致,则将第二个关键词和上下文向量送入解码器;若得到的预测结果与第一个关键词不一致,则仍将第一个关键词和上下文向量送入解码器,直至得到的预测结果与第一个关键词一致后,再将第二个关键词和上下文向量送入解码器,直至所有关键词按顺序送入解码器,并得到预测结果。本发明用于聊天机器人回复生成领域。
-
公开(公告)号:CN118364103A
公开(公告)日:2024-07-19
申请号:CN202410461572.3
申请日:2024-04-17
申请人: 哈尔滨工业大学
IPC分类号: G06F16/35 , G06F18/21 , G06F18/2431 , G06F40/216 , G06N3/042 , G06N3/0455 , G06N3/0895 , G06N5/045
摘要: 本发明属于自然语言处理技术领域,具体涉及一种自验证式的探索预训练语言模型中明喻知识的方法及其系统。步骤1、构建多级明喻识别数据集;步骤2、创建多级明喻识别任务,帮助PLMs评估明喻质量;步骤3、将多级明喻识别分数融合进明喻生成任务。本发明为解决现有预训练语言模型无法很好评价明喻好坏从而无法很好地探索明喻知识的问题。
-
公开(公告)号:CN108681538B
公开(公告)日:2022-02-22
申请号:CN201810523282.1
申请日:2018-05-28
申请人: 哈尔滨工业大学
IPC分类号: G06F40/289 , G06F40/284 , G06F40/211 , G06N3/04
摘要: 一种基于深度学习的动词短语省略消解方法,它属于计算机人工智能技术领域。本发明解决了现有动词短语省略消解方法存在的触发词判断和先行短语识别准确率低的问题。本发明对确定好的数据集1和数据集2进行预处理;判断触发词的过程加入了对句子上下文特征和句子级特征的提取,将提取的句子特征转化为向量输入支持向量机,进而根据支持向量机的输出结果确定输入句子的触发词;最后利用多层感知机,从触发词生成的多个候选先行短语中识别出正确的先行短语。本发明提取句子特征时加入了上下文特征和句子级特征,可以使触发词判断的准确率达到90%左右,先行短语识别的准确率达到85%以上。本发明可以应用于计算机人工智能技术领域用。
-
公开(公告)号:CN108681538A
公开(公告)日:2018-10-19
申请号:CN201810523282.1
申请日:2018-05-28
申请人: 哈尔滨工业大学
CPC分类号: G06F17/277 , G06F17/271 , G06F17/2775 , G06N3/0445
摘要: 一种基于深度学习的动词短语省略消解方法,它属于计算机人工智能技术领域。本发明解决了现有动词短语省略消解方法存在的触发词判断和先行短语识别准确率低的问题。本发明对确定好的数据集1和数据集2进行预处理;判断触发词的过程加入了对句子上下文特征和句子级特征的提取,将提取的句子特征转化为向量输入支持向量机,进而根据支持向量机的输出结果确定输入句子的触发词;最后利用多层感知机,从触发词生成的多个候选先行短语中识别出正确的先行短语。本发明提取句子特征时加入了上下文特征和句子级特征,可以使触发词判断的准确率达到90%左右,先行短语识别的准确率达到85%以上。本发明可以应用于计算机人工智能技术领域用。
-
公开(公告)号:CN107679225A
公开(公告)日:2018-02-09
申请号:CN201710986821.0
申请日:2017-10-20
申请人: 哈尔滨工业大学
IPC分类号: G06F17/30
摘要: 一种基于关键词的回复生成方法,本发明涉及基于关键词的回复生成方法。本发明为了解决现有方法灵活性差、容易产生语意损失,以及序列对序列模型倾向于生成一般性万能回复的问题。本发明包括:一:根据输入的消息生成关键词;二:将输入的消息转化成上下文向量,将第一个关键词和上下文向量送入解码器,若得到的预测结果与第一个关键词一致,则将第二个关键词和上下文向量送入解码器;若得到的预测结果与第一个关键词不一致,则仍将第一个关键词和上下文向量送入解码器,直至得到的预测结果与第一个关键词一致后,再将第二个关键词和上下文向量送入解码器,直至所有关键词按顺序送入解码器,并得到预测结果。本发明用于聊天机器人回复生成领域。
-
公开(公告)号:CN116340488A
公开(公告)日:2023-06-27
申请号:CN202310298629.8
申请日:2023-03-24
申请人: 哈尔滨工业大学
IPC分类号: G06F16/332 , G06F16/335 , G06F16/338
摘要: 面向开放域人机对话的技能推荐系统,它属于计算机人工智能技术领域。本发明解决了现有开放域人机对话中存在的当用户输入中有错误或者歧义信息时机器人可能做出与对话上下文不连贯的回复,以及没有特定的技能引导语句的问题。本发明利用基于弱监督学习的技能识别模块识别用户输入文本中的技能需求。闲聊回复模块根据用户输入分别采用生成式和检索式模型生成候选回复,在排序阶段通过基于Bert的文本相关性打分器对候选回复进行排序打分,选择得分最高的回复作为最优的闲聊回复,技能推荐模块根据最优的闲聊回复主动推荐合适的技能,生成包含推荐技能的流畅回复。本发明方法可以应用于开放域人机对话中的技能推荐。
-
公开(公告)号:CN113392629A
公开(公告)日:2021-09-14
申请号:CN202110733081.6
申请日:2021-06-29
申请人: 哈尔滨工业大学
IPC分类号: G06F40/211 , G06F40/284 , G06F40/295 , G06N3/04 , G06N3/08
摘要: 基于预训练模型的人称代词消解方法,涉及人工智能技术领域,针对现有技术中代词消解的准确率低问题,本申请模型使用基于排序的代词消解框架,对于一个待消解的代词,存在一个候选先行词的集合,对于每一个候选先行词进行消解打分,打分最高的候选先行词作为消解对象进行消解。本申请引入预训练模型,利用预训练模型使用大量无标注文本进行训练的特点,能够更好的捕捉上下文信息,有效提高代词消解的指标,从而更好的帮助下游任务,提高代词消解的准确率,并提高了代词消解的效率。
-
-
-
-
-
-
-
-
-