问答方法、问答数据集生成方法及装置

    公开(公告)号:CN114817510B

    公开(公告)日:2022-10-14

    申请号:CN202210715592.X

    申请日:2022-06-23

    Applicant: 清华大学

    Abstract: 本发明涉及人工智能技术领域,提供一种问答方法、问答数据集生成方法及装置,方法包括:获取待回答问题,将待回答问题输入至问答模型,得到待回答问题的答案;问答模型是基于问答数据集得到的,针对提问策略库的每种问题模板,从提问对象库中选择与第一占位符对应的若干目标元素,基于元素描述策略库的M种元素描述模板生成目标元素的M个元素描述信息,将若干目标元素的M个元素描述信息依次替换问题模板中对应的第一占位符,生成多个第一问题;基于第一问题中具有别名的元素将第一问题转写成第二问题,并通过生成第二问题的释义将第二问题转写成第三问题;基于所有第三问题及目标元素生成问答数据集,解决了问答数据集的质量问题,提高了质量。

    问答推理方法及装置
    2.
    发明授权

    公开(公告)号:CN114817512B

    公开(公告)日:2023-03-14

    申请号:CN202210738644.5

    申请日:2022-06-28

    Applicant: 清华大学

    Abstract: 本发明涉及人工智能技术领域,提供一种问答推理方法及装置,其中方法包括:确定推理目标问题的答案所需的至少一个算子;针对至少一个算子中至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果;基于至少一个算子的执行结果,得到答案。如此解决现有技术中推理引擎的推理效率不高的缺陷,由于确定的推理目标问题的答案所需的至少一个算子,能够展示出推理目标问题的答案的过程,透明可解释,并且,由于针对至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果,提高了算子的执行速度,进而提高了答案的推理效率。

    问答推理方法及装置
    3.
    发明公开

    公开(公告)号:CN114817512A

    公开(公告)日:2022-07-29

    申请号:CN202210738644.5

    申请日:2022-06-28

    Applicant: 清华大学

    Abstract: 本发明涉及人工智能技术领域,提供一种问答推理方法及装置,其中方法包括:确定推理目标问题的答案所需的至少一个算子;针对至少一个算子中至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果;基于至少一个算子的执行结果,得到答案。如此解决现有技术中推理引擎的推理效率不高的缺陷,由于确定的推理目标问题的答案所需的至少一个算子,能够展示出推理目标问题的答案的过程,透明可解释,并且,由于针对至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果,提高了算子的执行速度,进而提高了答案的推理效率。

    问答方法、装置、电子设备及存储介质

    公开(公告)号:CN115617954B

    公开(公告)日:2023-03-28

    申请号:CN202211440775.1

    申请日:2022-11-17

    Applicant: 清华大学

    Abstract: 本发明涉及人工智能技术领域,提供一种问答方法、装置、电子设备及存储介质,其中方法包括:将问题输入生成模型,获得问题对应的推理程序;基于目标知识库执行问题对应的推理程序得到问题的答案;生成模型是基于目标知识库之外的外部知识库和对应的第一数据集,以及目标知识库和对应的第二数据集,进行训练得到的,第一数据集包括第一问题样本和对应的第一推理程序标签,第二数据集包括第二问题样本和对应的答案样本;生成模型用于通过解码程序的树形结构所转换的序列中每个位置的词汇得到问题对应的推理程序;或者,通过解析程序骨架以及程序骨架所需的参数得到问题对应的推理程序。解决平行语料缺失的问题,提升了问答性能。

    问答方法、装置、电子设备及存储介质

    公开(公告)号:CN115617954A

    公开(公告)日:2023-01-17

    申请号:CN202211440775.1

    申请日:2022-11-17

    Applicant: 清华大学

    Abstract: 本发明涉及人工智能技术领域,提供一种问答方法、装置、电子设备及存储介质,其中方法包括:将问题输入生成模型,获得问题对应的推理程序;基于目标知识库执行问题对应的推理程序得到问题的答案;生成模型是基于目标知识库之外的外部知识库和对应的第一数据集,以及目标知识库和对应的第二数据集,进行训练得到的,第一数据集包括第一问题样本和对应的第一推理程序标签,第二数据集包括第二问题样本和对应的答案样本;生成模型用于通过解码程序的树形结构所转换的序列中每个位置的词汇得到问题对应的推理程序;或者,通过解析程序骨架以及程序骨架所需的参数得到问题对应的推理程序。解决平行语料缺失的问题,提升了问答性能。

    问答方法、问答数据集生成方法及装置

    公开(公告)号:CN114817510A

    公开(公告)日:2022-07-29

    申请号:CN202210715592.X

    申请日:2022-06-23

    Applicant: 清华大学

    Abstract: 本发明涉及人工智能技术领域,提供一种问答方法、问答数据集生成方法及装置,方法包括:获取待回答问题,将待回答问题输入至问答模型,得到待回答问题的答案;问答模型是基于问答数据集得到的,针对提问策略库的每种问题模板,从提问对象库中选择与第一占位符对应的若干目标元素,基于元素描述策略库的M种元素描述模板生成目标元素的M个元素描述信息,将若干目标元素的M个元素描述信息依次替换问题模板中对应的第一占位符,生成多个第一问题;基于第一问题中具有别名的元素将第一问题转写成第二问题,并通过生成第二问题的释义将第二问题转写成第三问题;基于所有第三问题及目标元素生成问答数据集,解决了问答数据集的质量问题,提高了质量。

    知识密集型推理问答方法、装置、电子设备和存储介质

    公开(公告)号:CN117634617B

    公开(公告)日:2024-05-17

    申请号:CN202410102332.4

    申请日:2024-01-25

    Applicant: 清华大学

    Abstract: 本发明涉及计算机领域,提供一种知识密集型推理问答方法、装置、电子设备和存储介质,方法包括:确定推理目标问题所需的步骤集合,步骤集合包括对应各步骤的知识操作原语;针对步骤集合中的各步骤,顺序进行原语执行,在此过程中,基于任一步骤对应的知识操作原语的各种执行方式、以及各种执行方式在数据管理器中关联的知识,确定该步骤对应的知识操作原语的目标执行方式,并基于目标执行方式、以及目标执行方式在数据管理器中关联的知识,执行该步骤对应的知识操作原语;基于步骤集合中步骤进行原语执行的结果,确定目标问题对应的答案。本发明提供的方法、装置、电子设备和存储介质,将符号逻辑与神经计算进行结合,确保问答实现的可靠性。

    知识密集型推理问答方法、装置、电子设备和存储介质

    公开(公告)号:CN117634617A

    公开(公告)日:2024-03-01

    申请号:CN202410102332.4

    申请日:2024-01-25

    Applicant: 清华大学

    Abstract: 本发明涉及计算机领域,提供一种知识密集型推理问答方法、装置、电子设备和存储介质,方法包括:确定推理目标问题所需的步骤集合,步骤集合包括对应各步骤的知识操作原语;针对步骤集合中的各步骤,顺序进行原语执行,在此过程中,基于任一步骤对应的知识操作原语的各种执行方式、以及各种执行方式在数据管理器中关联的知识,确定该步骤对应的知识操作原语的目标执行方式,并基于目标执行方式、以及目标执行方式在数据管理器中关联的知识,执行该步骤对应的知识操作原语;基于步骤集合中步骤进行原语执行的结果,确定目标问题对应的答案。本发明提供的方法、装置、电子设备和存储介质,将符号逻辑与神经计算进行结合,确保问答实现的可靠性。

    一种阅读理解数据集生成方法及组件

    公开(公告)号:CN116975222A

    公开(公告)日:2023-10-31

    申请号:CN202310723628.3

    申请日:2023-06-16

    Applicant: 清华大学

    Abstract: 本发明提供一种阅读理解数据集生成方法及组件,该方法包括:构建阅读理解的知识文档;知识文档包括阅读材料文本、背景知识库和阅读材料文本与背景知识库的实体对齐关系;根据知识文档进行推理链抽取,得到推理链和问题三元组;根据推理链和问题三元组进行数据生成,得到自然语言问题和自然语言问题对应的答案,从而得到高质量的数据库,语言智能系统根据数据库进行深度语义理解推理出问题的答案的效率和精准性更高。

    文本问题的解答方法、装置、电子设备及存储介质

    公开(公告)号:CN116561273A

    公开(公告)日:2023-08-08

    申请号:CN202310429991.4

    申请日:2023-04-20

    Applicant: 清华大学

    Abstract: 本发明涉及自然语言处理技术领域,提供一种文本问题的解答方法、装置、电子设备及存储介质,包括:确定目标文本问题,基于目标文本问题生成层次化问题分解树,层次化问题分解树包括根节点和叶子节点,根节点对应于目标文本问题,叶子节点对应于原子问题;确定目标文本问题和原子问题在不同知识源下的答案文本,根据答案文本确定目标文本问题的标准答案文本。本发明通过基于目标文本问题生成层次化问题分解树,并确定层次化问题分解树上的问题在不同知识源下的答案文本,根据答案文本确定目标文本问题的标准答案文本,做到更好地表示复杂问题的层次化的语义信息,并可以同时在不同层次上整合不同知识源中的信息用以回答复杂问题。

Patent Agency Ranking