一种基于分层图对比学习的知识感知多域推荐方法及系统

    公开(公告)号:CN116501956A

    公开(公告)日:2023-07-28

    申请号:CN202310347942.6

    申请日:2023-04-03

    Applicant: 清华大学

    Abstract: 本发明提供一种基于分层图对比学习的知识感知多域推荐方法及系统,包括:获取分层交互网络上多个节点,通过加权求和平滑目标节点和邻居节点进行分层表示,基于分层消息传递机制,通过交互的项目及其连接的实体来聚合更多偏好知识;基于预设的对比学习方法,在分层节点中删除部分节点进行对比学习的数据增强;基于增强后的数据通过在跨多域中域共享图对比学习和在特定域中独域图对比学习,识别目标用户内在的偏好特征;基于目标用户内在的偏好特征进行多任务模型构建,对所述多任务模型进行优化训练生成多域推荐模型,通过所述多域推荐模型完成多域推荐。本发明解决了现有多域推荐难以准确推测用户喜好的问题。

    一种基于预训练的慕课自适应学习系统构建方法和装置

    公开(公告)号:CN114567815B

    公开(公告)日:2023-05-02

    申请号:CN202210068224.0

    申请日:2022-01-20

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于预训练的慕课自适应学习系统构建方法和装置,其中,该方法包括:获取第一预设时间内慕课平台记录的学生学习行为数据,以及预设条件下的辅助信息,辅助信息至少包括课程结构元信息和视频字幕文本;基于学生学习行为数据,以预设的粒度对学习行为日志进行聚合与处理,得到学生学习行为序列;基于辅助信息进行知识挖掘,获取课程结构元信息与视频的初始表示;基于学生学习行为序列和初始表示构建学习行为预训练模型,并采用掩码预测任务训练模型;将学习行为预训练模型应用于学习资源推荐和学习资源评估两个核心下游任务。本发明能够对慕课场景的学习行为、学习资源进行统一建模,构建出性能更强、更通用的自适应学习系统。

    知识图谱的信息补全方法、装置、电子设备及存储介质

    公开(公告)号:CN115964509A

    公开(公告)日:2023-04-14

    申请号:CN202211635657.6

    申请日:2022-12-19

    Applicant: 清华大学

    Abstract: 本发明涉及信息处理技术领域,提供一种知识图谱的信息补全方法、装置、电子设备及存储介质,包括:确定待补全信息序列中的已知元素对应的文本信息;根据文本信息确定文本预测序列;将文本预测序列中的各元素对应的文本信息与已有的知识图谱中各个节点信息和节点关系信息进行语义匹配,确定信息序列;根据信息序列构建用于补全信息的关联路径;根据用于补全信息的关联路径对待补全信息序列中的未知元素进行确定。本发明能够提高确定未知信息的准确性,达到完善知识图谱的目的。

    百科知识图谱动态更新方法、装置、设备及介质

    公开(公告)号:CN115658931B

    公开(公告)日:2023-04-07

    申请号:CN202211681737.5

    申请日:2022-12-27

    Applicant: 清华大学

    Abstract: 本申请涉及计算机技术领域,特别涉及一种百科知识图谱动态更新方法、装置、设备及介质,其中,包括:获取百科知识图谱的待更新数据列表,其中,待更新数据列表包括待更新词条的页面文本和/或词条简介中链接的页面文本;根据预设更新周期遍历待更新数据列表,抽取待更新数据列表中页面文本的预设关键信息,基于预设关键信息更新百科知识图谱中三元组,得到更新结果;对更新结果进行结构化,得到更新后的百科知识图谱,并基于更新后的百科知识图谱更新数据库中存储的百科知识图谱。由此,解决了相关技术中需人工手动修改审核更新,无法自动更新和维护百科知识图谱,导致更新效率较低、维护成本较高等问题。

    故事脉络构建方法、装置、电子设备和存储介质

    公开(公告)号:CN115033668B

    公开(公告)日:2022-11-11

    申请号:CN202210965268.3

    申请日:2022-08-12

    Applicant: 清华大学

    Abstract: 本发明涉及自然语言处理技术领域,提供一种故事脉络构建方法、装置、电子设备和存储介质,包括:获取待构建脉络的新闻集合;基于关系检测模型,对新闻集合中的每两个新闻进行脉络关系检测,得到每两个新闻之间的脉络关系检测结果;基于每两个新闻之间的脉络关系检测结果,构建新闻集合对应的故事脉络;关系检测模型基于正样本对和负样本对训练得到,正样本对基于话题相同、时间相邻且事件不同的样本新闻确定,负样本对基于话题相同且时间间隔的样本新闻和/或话题不同的样本新闻确定,样本新闻的话题和事件基于聚类得到。本发明在无需人工参与的情况下,提高了数据集构建的效率和可靠性,扩张了数据集规模,保障了故事脉络构建的可靠性和准确性。

    一种为中英文单词对预测义原树的方法及系统

    公开(公告)号:CN112579794B

    公开(公告)日:2022-11-11

    申请号:CN202011565924.8

    申请日:2020-12-25

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种为中英文单词对预测义原树的方法及系统,包括:获取待预测单词对,以及所述待预测单词对应的类别义原;基于已知的预设义原集合和语义关系集合,和所述待预测单词对应的类别义原,采用预设义原树生成算法为所述待预测单词对预测生成义原树。本发明实施例通过已知的义原知识库,给定单词对的类别义原信息,为给定单词对预测义原树,实现了自动预测义原树,相比人工手动标注义原树需要花费大量的时间和成本,具有更高效和更准确的特点。

    问答推理方法及装置
    7.
    发明公开

    公开(公告)号:CN114817512A

    公开(公告)日:2022-07-29

    申请号:CN202210738644.5

    申请日:2022-06-28

    Applicant: 清华大学

    Abstract: 本发明涉及人工智能技术领域,提供一种问答推理方法及装置,其中方法包括:确定推理目标问题的答案所需的至少一个算子;针对至少一个算子中至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果;基于至少一个算子的执行结果,得到答案。如此解决现有技术中推理引擎的推理效率不高的缺陷,由于确定的推理目标问题的答案所需的至少一个算子,能够展示出推理目标问题的答案的过程,透明可解释,并且,由于针对至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果,提高了算子的执行速度,进而提高了答案的推理效率。

    一种旅游知识图谱模型确定方法及装置

    公开(公告)号:CN114036317A

    公开(公告)日:2022-02-11

    申请号:CN202111372439.3

    申请日:2021-11-18

    Applicant: 清华大学

    Abstract: 本发明提供一种旅游知识图谱模型确定方法及装置。其中,该方法包括:从预设的旅游数据源获取相应的旅游知识数据;基于所述旅游知识数据进行概念层建模确定相应的旅游本体;基于所述旅游本体进行实例层建模得到旅游知识图谱模型。本发明提供的旅游知识图谱模型确定方法,能够通过分别构建概念层和实例层来定义面向旅游路径规划的旅游本体和旅游路径实例,丰富旅游知识图谱模型包含内容,以提高查询旅游路径和景点信息的准确度,从而提升用户的使用体验。

    基于图神经网络的中文开放信息抽取方法和装置

    公开(公告)号:CN113705196A

    公开(公告)日:2021-11-26

    申请号:CN202110882753.X

    申请日:2021-08-02

    Applicant: 清华大学

    Abstract: 本发明提供一种基于图神经网络的中文开放信息抽取方法和装置,包括:将待测中文语句文本输入谓语抽取模型,输出谓语结果;谓语抽取模型是基于样本中文语句文本和谓语标签进行训练得到的,谓语抽取模型训练时的网络结构包括顺次连接的嵌入词性的字符上下文表示网络、第一多粒度依存图字符表示神经网络和谓语区间分类网络;将谓语结果和待测中文语句文本输入主宾抽取模型,输出主语结果和宾语结果;主宾抽取模型是基于样本中文语句文本和主谓宾三元组标签进行训练得到的,主宾抽取模型训练时的网络结构与谓语抽取模型架构相同。本发明提供的方法和装置,实现了融合分词和依存句法信息,提高了抽取开放的事实主谓宾知识三元组的准确率。

    知识概念构建方法和装置
    10.
    发明公开

    公开(公告)号:CN113268608A

    公开(公告)日:2021-08-17

    申请号:CN202110606634.1

    申请日:2021-05-27

    Applicant: 清华大学

    Abstract: 本发明提供一种知识概念层数据构建方法和装置,其中,方法包括获取原始数据和大规模知识图谱;对原始数据进行概念抽取,得到多个概念;对所述概念和所述原始数据进行概念上下位关系抽取,得到不同概念的概念上下位关系;对所述概念和所述原始数据进行概念属性抽取,得到所述概念的概念属性;将所述概念作为关键词输入大规模知识图谱中进行检索,获取所述概念在大规模知识图谱中的概念相关信息;将所述概念、所述概念的上下位关系、所述第一概念属性、所述概念相关信息相融合,得到完整的概念层数据。基于所述概念层数据对大规模知识图谱进行更新。本发明通过上述步骤实现对知识图谱的动态更新以及在使用过程中进行扩展。

Patent Agency Ranking