基于新闻事件的关系分析方法及装置

    公开(公告)号:CN113158672A

    公开(公告)日:2021-07-23

    申请号:CN202110326769.2

    申请日:2021-03-26

    Applicant: 清华大学

    Abstract: 本发明提供一种基于新闻事件的关系分析方法及装置,其中方法包括:获取多篇新闻文本;对多篇新闻文本进行聚类,得到聚类后的多个新闻事件;对多个新闻事件进行实体链接、实体抽取、实体关系抽取、事件关系抽取、实体与事件关系抽取,根据实体链接结果、实体抽取结果、实体关系抽取结果、事件关系抽取结果、实体与事件关系抽取结果进行关联分析得到分析结果。本发明通过原始新闻文本聚类实现新闻事件级别分析,得到多个事件,再通过对事件文本抽取实体、实体关系、事件关系、事件与实体的关系。进而通过实体链接,将实体背景知识进行补充,实现对事件的深层次挖掘,从而使读者能够获得更全面和深入的信息。

    一种电热耦合综合能源系统最优潮流计算方法

    公开(公告)号:CN110752605B

    公开(公告)日:2021-05-14

    申请号:CN201911040179.2

    申请日:2019-10-29

    Abstract: 本发明涉及一种基于广义逆法的电热耦合综合能源系统最优潮流计算方法,属于电力/综合能源系统运行调控技术领域。该方法首先建立了区域电热耦合综合能源系统的稳态模型,然后基于广义逆矩阵理论,建立了区域综合能源系统的多目标最优潮流模型,多目标包括能源使用成本最小化和配电系统网络损耗最小化,并基于牛顿拉夫逊法迭代进行求解,电力系统与热力系统之间的信息传递通过耦合设备运行功率折算实现。本发明提出的方法可以准确地反映区域综合能源系统的运行状况,具有良好的数值稳定性和收敛性,优化过程是一个可行解的趋优过程,每一步都可以得到一个更优的可行解,计算可以根据实际情况随时停止,适用于实时系统优化调度应用。

    一种扩充慕课课程概念的方法及系统

    公开(公告)号:CN112734608A

    公开(公告)日:2021-04-30

    申请号:CN202011583108.X

    申请日:2020-12-28

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种扩充慕课课程概念的方法及系统,该方法包括:将在线的交互式游戏作为训练环境,训练得到强化学习模型;基于课内概念集合和所述强化学习模型进行概念扩展,并在扩展过程中获取用户反馈,所述课内概念集合是由慕课课程中需补充讲解的课程知识点内容构成的;将所述用户反馈返回所述交互式游戏中重新进行扩展,直至达到预设目标,得到扩展结果。本发明实施例通过使用强化学习的训练方法,可以在某些特定课程上进行训练后大规模应用于新设立的课程,相比传统的方法节省了大量人工标注,因此具有较强的延展性。同时,并且由于多层次的训练模式,可以在处理涉及多学科的领域的课程时,保持产生较高质量的扩展结果。

    一种为中英文单词对预测义原树的方法及系统

    公开(公告)号:CN112579794A

    公开(公告)日:2021-03-30

    申请号:CN202011565924.8

    申请日:2020-12-25

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种为中英文单词对预测义原树的方法及系统,包括:获取待预测单词对,以及所述待预测单词对应的类别义原;基于已知的预设义原集合和语义关系集合,和所述待预测单词对应的类别义原,采用预设义原树生成算法为所述待预测单词对预测生成义原树。本发明实施例通过已知的义原知识库,给定单词对的类别义原信息,为给定单词对预测义原树,实现了自动预测义原树,相比人工手动标注义原树需要花费大量的时间和成本,具有更高效和更准确的特点。

    事件检测模型的构建方法、装置、电子设备及存储介质

    公开(公告)号:CN111813931B

    公开(公告)日:2021-03-16

    申请号:CN202010548917.0

    申请日:2020-06-16

    Applicant: 清华大学

    Abstract: 本发明实施例提供了一种基于开放域知识增强的事件检测深度学习模型的构建方法、装置、电子设备及存储介质,方法包括:获取标注数据和未标注数据;将标注数据输入到第一事件分类模型中,进行训练;根据外部语义库采用义原映射算法,对未标注数据中的第一数据子集进行处理,得到开放域触发词识别结果;根据开放域触发词识别结果和第二数据子集,采用知识蒸馏的方式,对第二事件分类模型进行训练;对训练后的第一事件分类模型和训练后的第二事件分类模型进行联合训练,得到基于开放域知识增强的事件检测深度学习模型。本发明实施例得到的基于开放域知识增强的事件检测深度学习模型可以有效解决各类标注分布不均匀的长尾难题。

    领域知识图谱的构建方法及装置

    公开(公告)号:CN112487212A

    公开(公告)日:2021-03-12

    申请号:CN202011507759.0

    申请日:2020-12-18

    Applicant: 清华大学

    Abstract: 本发明提供一种领域知识图谱的构建方法及装置,所述方法包括:获取目标领域的种子词汇;利用所述目标领域的种子词汇,进行词汇扩展,直至扩展得到的词汇满足预设条件,获得所述目标领域的相关词汇;从现有数据库中提取所述相关词汇对应的原始数据;基于所述原始数据进行知识图谱的构建,生成所述目标领域的知识图谱。在本发明实施例中,通过利用目标领域的种子词汇进行词汇扩展获得相关词汇,并基于相关词汇获取原始数据,基于原始数据进行知识图谱构建,提供了一套适用于任何领域的知识图谱的构建方法,在知识图谱的构建过程中无需依赖该特定领域的专家知识和行业调研才能实现,可有效提升知识图谱的构建效率,节省人力物力。

    一种区域综合能源系统运行状态计算方法

    公开(公告)号:CN110781598A

    公开(公告)日:2020-02-11

    申请号:CN201911040182.4

    申请日:2019-10-29

    Abstract: 本发明公开了一种区域综合能源系统运行状态计算方法,所述方法包括,建立以下计算模型:建筑热负荷模型、热力管道模型、耦合设备模型、电力系统模型、热电联产机组模型、地源热泵机组模型;基于上述模型,依次获取负荷节点热功率、热力系统的运行状态结果、热电联产机组模型运行状态结果、地源热泵机组模型的运行状态结果及节点的电功率,最终获取区域综合能源系统的运行状态。本发明的计算方法可以用于分析区域综合能源系统的运行状态,并可同时计算各种并网能源设备的内部运行状态,为研究系统和设备特性、制定相应的运行控制策略提供数据基础。

    基于原子知识算子的大语言模型异构知识推理方法及装置

    公开(公告)号:CN119670883A

    公开(公告)日:2025-03-21

    申请号:CN202411635486.6

    申请日:2024-11-15

    Applicant: 清华大学

    Abstract: 本发明提供一种基于原子知识算子的大语言模型异构知识推理方法及装置,其中的方法包括:基于原始待解答问题,构建原子推理树;其中,原子推理树包括父节点和叶节点,父节点中的根节点为原始待解答问题,父节点中的非根节点为由原始待解答问题分解得到的不同层级子问题,叶节点为由原始待解答问题分解得到的原子问题,每一叶节点对应一个原子知识算子,原子知识算子包括搜索算子、关系算子以及过滤算子;对于叶节点,基于大语言模型和原子知识算子,根据检索‑知识对原子问题进行推理;对于父节点,基于大语言模型,根据子节点推理答案、兄弟节点推理答案或检索‑知识对子问题进行推理;对原子推理树从叶节点到根节点自下而上进行推理,得到原始待解答问题的推理结果;其中,检索‑知识通过从多种异构知识源执行动态知识检索得到。该方法通过将原始待解答问题分解到原子级别的细粒度,并使原子推理树中的叶节点对应一个原子知识算子,实现了更精确的推理结果,与此同时,通过在每个子问题和原子问题节点允许从多种异构知识源动态检索知识,能够灵活应对不同类型的查询,提供了更丰富、准确和互补的信息,增强了算法的整体推理能力。

    大语言模型的训练方法、装置、电子设备及存储介质

    公开(公告)号:CN119647586A

    公开(公告)日:2025-03-18

    申请号:CN202411522546.3

    申请日:2024-10-29

    Applicant: 清华大学

    Abstract: 本发明提供一种大语言模型的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域。其中,大语言模型的训练方法,包括:获取指令响应数据对;其中,指令响应数据对由指令和利用大语言模型根据指令生成的响应组成,响应包括预设领域的文本;从指令响应数据对包含的响应中,提取响应包含的约束信息;根据响应、响应包含的约束信息以及响应对应的指令,生成训练数据集;利用训练数据集,对预训练的大语言模型进行继续训练,得到目标大语言模型,以利用目标大语言模型根据指令,生成响应。本发明可以高效地训练得到可准确执行具有复杂约束的指令的大语言模型,进而有效提升计算资源的利用率。

    一种旅游知识语义分析方法及装置

    公开(公告)号:CN114036956B

    公开(公告)日:2024-12-03

    申请号:CN202111371152.9

    申请日:2021-11-18

    Applicant: 清华大学

    Abstract: 本发明提供一种旅游知识语义分析方法及装置。其中,该方法包括:获取待理解旅游知识文本;将所述待理解旅游知识文本输入至基于异构旅游知识的预训练语言模型中,得到所述预训练语言模型输出的语义理解结果;其中,所述预训练语言模型是以预设的非结构化文本、半结构化文本和满足结构条件的预设知识三元组文本为训练样本,并基于相应的无监督训练任务将所述训练样本统一建模到相同的上下文表示空间中得到的。本发明提供的旅游知识语义分析方法,能够通过利用多种格式文本训练得到的基于异构旅游知识的预训练语言模型对不同粒度的旅游知识文本进行分析,以提高旅游知识文本语义理解的准确度和鲁棒性,从而提升用户的使用体验。

Patent Agency Ranking