一种文本生成方法及系统

    公开(公告)号:CN113111188A

    公开(公告)日:2021-07-13

    申请号:CN202110400913.2

    申请日:2021-04-14

    Applicant: 清华大学

    Abstract: 本发明提供一种文本生成方法及系统,包括:获取待输入的知识图谱;将所述待输入的知识图谱输入至文本生成框架,构建所述知识图谱与输出文本的对齐关系模型;其中所述文本生成框架是基于知识图谱和文本联合表示学习所得到的。本发明通过基于知识图谱和文本联合表示学习的文本生成框架,能够在编码端引入知识图谱结构信息的同时,构建输入图谱和输出文本的显式对齐关系,达到现有模型最优性能。

    对话系统中提问的方法及装置、电子设备、计算机可读介质

    公开(公告)号:CN108491514B

    公开(公告)日:2020-12-01

    申请号:CN201810251972.6

    申请日:2018-03-26

    Applicant: 清华大学

    Inventor: 黄民烈 朱小燕

    Abstract: 本公开涉及一种对话系统中提问的方法及装置、电子设备和计算机可读介质。属于计算机技术领域,该对话系统中提问的方法包括:接收输入信息;通过模型的编码器将所述输入信息编码成隐状态序列;将所述隐状态序列输入至所述模型的解码器,生成相应的输出信息;其中,组成所述输出信息的每个词分别属于预先定义的预设数量的词类型中的一种,所述输出信息相关于所述输入信息。

    利用可解释推理网络的多关系问答系统

    公开(公告)号:CN107992528A

    公开(公告)日:2018-05-04

    申请号:CN201711115025.6

    申请日:2017-11-13

    Applicant: 清华大学

    Abstract: 本申请公开了一种利用可解释推理网络的多关系问答方法,其通过多跳方式进行,所述方法包括:步骤1、将输入的问题转换为分布式的问题表示;步骤2、根据前一跳的推理状态和前一跳的问题表示,预测当前跳的关系;步骤3、如果所预测的当前跳的关系并非终止关系,则根据所预测的当前跳的关系,将所述前一跳的推理状态和所述前一跳的问题表示更新为当前跳的推理状态和当前跳的问题表示,并作为下一跳返回到步骤2,否则,转到步骤4;以及所述步骤4、根据当前跳的推理状态,确定并输出当前跳的回答。该方法可提供可追踪和可观察的中间预测,用于推理分析和故障诊断。

    一种从文档集中自动发现新词的方法及装置

    公开(公告)号:CN103955453A

    公开(公告)日:2014-07-30

    申请号:CN201410220317.6

    申请日:2014-05-23

    Applicant: 清华大学

    Inventor: 黄民烈 朱小燕

    Abstract: 本发明公开了一种从文档集中自动发现新词的方法及装置,其中,模板获取单元获取一个或多个模板;词语提取单元从所述文档集中提取出与所述一个或多个模板中的各模板相匹配的词语;候选模板集合加入单元从所述一个或多个模板中至少选取一部分模板加入到候选模板集合;候选词集合加入单元从提取出的与所述一个或多个模板中的各模板相匹配的词语中至少选取一部分词语加入到候选词集合;新词集合加入单元基于候选模板集合中的模板对所述候选词集合中的候选词排序,基于所述排序将一定数量的候选词加入到新词集合。与现有技术相比,本发明提供的方法和装置可以有效地发现新词。

    一种元素间拓扑关系的展示和搜索工具

    公开(公告)号:CN102542074B

    公开(公告)日:2013-10-30

    申请号:CN201210037647.2

    申请日:2012-02-17

    Applicant: 清华大学

    Inventor: 黄民烈 朱小燕

    Abstract: 公开了一种同时实现元素的网状关系展示、元素的查找与搜索、元素间特殊路径的搜索、邻居关系的判断以及两元素间前k短路径的搜索的元素间拓扑关系的展示和搜索工具,包括依次相连的输入模块、XML文件预处理模块、节点搜索模块、XML中间结果生成模块、渲染模块,在XML文件预处理模块和XML中间结果生成模块之间还分别设有路径搜索模块、节点展开收缩模块。

    一种基于突破点的新闻话题时间线摘要生成方法

    公开(公告)号:CN102646114A

    公开(公告)日:2012-08-22

    申请号:CN201210037970.X

    申请日:2012-02-17

    Applicant: 清华大学

    Inventor: 黄民烈 朱小燕

    Abstract: 公开了一种自动、高效率地挖掘出目标新闻话题发展过程中的重要时刻及所发生的重大事件、从而极大地帮助了读者了解一个新闻话题的演变过程的基于突破点的新闻话题时间线摘要生成方法,包括以下步骤:(1)根据用户输入的话题关键词从相关新闻网站上下载用检索词搜索得到的所有新闻文章,然后对这些新闻文章进行预处理;(2)对目标话题在各个时间片段上的活跃度变化趋势建立话题活跃度隐马尔科夫模型,并删除目标话题不活跃的时间片段;(3)利用主题转换隐马尔科夫模型对各时间片段中的主题转换序列进行建模;(4)抽取出与当日发生的重大事件最相关的句子作为该突破点的摘要;(5)输出目标话题的时间线摘要。

    一种元素间拓扑关系的展示和搜索工具

    公开(公告)号:CN102542074A

    公开(公告)日:2012-07-04

    申请号:CN201210037647.2

    申请日:2012-02-17

    Applicant: 清华大学

    Inventor: 黄民烈 朱小燕

    Abstract: 公开了一种同时实现元素的网状关系展示、元素的查找与搜索、元素间特殊路径的搜索、邻居关系的判断以及两元素间前k短路径的搜索的元素间拓扑关系的展示和搜索工具,包括依次相连的输入模块、XML文件预处理模块、节点搜索模块、XML中间结果生成模块、渲染模块,在XML文件预处理模块和XML中间结果生成模块之间还分别设有路径搜索模块、节点展开收缩模块。

    一种知识驱动的对话生成方法及装置

    公开(公告)号:CN113111190B

    公开(公告)日:2024-11-29

    申请号:CN202110413536.6

    申请日:2021-04-16

    Applicant: 清华大学

    Abstract: 本发明提供一种知识驱动的对话生成方法及装置,包括:将待回复文本序列输入训练好的深度神经网路对话模型,得到所述待回复文本的回复文本序列;其中,所述深度神经网路对话模型储存有知识图谱实体关系的特征表示数据集;其中,所述训练好的深度神经网路对话模型是根据携带真实回复文本序列标签的待回复文本样本序列和所述知识图谱实体关系的特征表示数据集进行训练后得到的。通过本发明的方法,根据待回复文本中的非结构化信息和知识图谱的结构化信息,基于训练好的深度神经网络对话模型,计算出知识图谱中的实体表示,可以更高效地应用知识图谱来生成具有恰当语义和丰富信息量的对话回复。

    对话方法、介质、装置和计算设备

    公开(公告)号:CN110569339B

    公开(公告)日:2022-04-19

    申请号:CN201910663791.9

    申请日:2019-07-22

    Applicant: 清华大学

    Abstract: 本发明的实施方式提供了一种对话方法。所述对话包括对话双方之间的多轮对话,所述对话双方的一方为目标智能体,另一方为用户或对手智能体,所述方法包括:根据本轮对话中的对手话语预估目标智能体对应的动作;基于预估的所述动作估计对手对应的动作;选择针对所述对手动作的最优动作;按照选择的所述最优动作生成相应的话语。通过预估对手的动作以选择更加合适的动作并生成相应的话语,本发明的方法使得智能体的决策具有前瞻性,能够产生更加合适的对话,为用户带来了更好的体验。此外,本发明的实施方式提供了一种对话装置、介质及计算设备。

    用于多方对话的篇章解析方法、装置、介质及计算设备

    公开(公告)号:CN109635282B

    公开(公告)日:2021-07-20

    申请号:CN201811403349.4

    申请日:2018-11-22

    Applicant: 清华大学

    Inventor: 黄民烈 朱小燕

    Abstract: 本发明的实施方式提供了一种用于多方对话的篇章解析方法、装置、介质及计算设备。该方法包括:获得EDU序列;按照发言顺序依次对EDU序列中的每个EDU进行处理,其中,在针对当前EDU的处理中:根据当前EDU的非结构化特征以及当前EDU之前的每个EDU的非结构化特征和结构化特征,通过第一多层神经网络获得当前EDU与当前EDU之前的每个EDU之间的依赖程度,将当前EDU之前的多个EDU之中与当前EDU之间依赖程度最大的EDU,作为当前EDU的父亲EDU,以及在当前EDU及其父亲EDU之间构建依赖链接,以基于已构建的依赖链接,确定当前已解析的篇章结构并获得当前EDU的结构化特征。本发明的上述技术,能够实现多方对话场景下的篇章解析,解析结果相比现有技术能够显著提高。

Patent Agency Ranking