事件关系预测方法、装置、电子设备、介质及程序产品

    公开(公告)号:CN116501868A

    公开(公告)日:2023-07-28

    申请号:CN202310325479.5

    申请日:2023-03-29

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种事件关系预测方法、装置、电子设备、介质及程序产品,该方法包括:对输入文本进行聚类得到多个互不相交的原始组;对原始组进行两两融合得到多个交叉组;利用摘要生成模型生成原始组的第一摘要及交叉组的第二摘要;分别获取输入文本、第一摘要及第二摘要中的事件的向量表示及事件对的向量表示;根据输入文本、第一摘要及第二摘要中事件对的向量表示获取待预测事件对的向量表示;将待预测事件对的向量表示输入至预训练的事件关系预测模型,输出待预测事件对的事件关系预测结果。本发明实施例有效提升了模型处理长距离事件关系预测的能力,减少事件关系预测过程中遇到的冗余信息的影响,提高了事件关系的预测效率和准确率。

    事件百科文档自动生成方法和装置

    公开(公告)号:CN113282745B

    公开(公告)日:2023-04-18

    申请号:CN202010104947.2

    申请日:2020-02-20

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种事件百科文档自动生成方法和装置,所述事件百科文档自动生成方法包括:基于现存的与待处理事件同事件类别的百科文档,生成该事件类别的主题树,其中所述主题树包括多个主题;获取所述待处理事件的相关文档集合;基于所述相关文档集合和所述主题树,确定与多个所述主题分别对应的目标文本信息;根据与多个所述主题分别对应的所述目标文本信息,确定与多个所述主题分别对应的摘要;基于与多个所述主题分别对应的所述摘要,生成所述待处理事件的百科文档。本发明实施例的事件百科文档自动生成方法,可以对新事件自动生成包括多个主题的百科文档,使得生成的百科文档目录更完善,更细致地描述事件不同方面的重点信息。

    一种知识感知结合深度强化学习的跨域推荐方法及系统

    公开(公告)号:CN115599990A

    公开(公告)日:2023-01-13

    申请号:CN202211132191.8

    申请日:2022-09-16

    Abstract: 本发明提供一种知识感知结合深度强化学习的跨域推荐方法及系统,包括:获取跨域推荐任务,将所述跨域推荐任务转换为协同知识图谱上的马尔可夫决策过程框架;基于所述马尔可夫决策过程框架采用注意力机制和图卷积网络,获取并融合域内和跨域的邻居状态表示结果;通过训练好的受约束的邻居剪枝策略对融合的域内和跨域邻居状态表示结果进行剪枝,生成剪枝邻居集;将所述剪枝邻居集输入至预设的自监督模型,通过所述自监督模型生成并优化推荐策略。本发明解决了现有信息推送准确性低的缺陷,实现通过跨域推荐提升信息推送的准确度。

    文档处理方法、文档摘要生成方法及装置

    公开(公告)号:CN115563240A

    公开(公告)日:2023-01-03

    申请号:CN202211035766.4

    申请日:2022-08-26

    Applicant: 清华大学

    Abstract: 本发明提供一种文档处理方法、文档摘要生成方法及装置,文档处理方法包括:获取待处理文档集以及关键词集;将关键词集中的关键词分别插入至待处理文档集中的各待处理文档中,得到待测序列;确定各待测序列的困惑度,并基于各待测序列的困惑度确定各待处理文档的第一评分结果;基于各待处理文档的第一评分结果对待处理文档集进行筛选,得到目标文档。文档摘要生成方法包括:基于关键词集中的各关键词从待处理文档集中抽取目标文档;基于目标文档生成摘要。本发明能够有效提高目标文档的有效性,进而保证了摘要的生成效果。

    问答方法、问答数据集生成方法及装置

    公开(公告)号:CN114817510B

    公开(公告)日:2022-10-14

    申请号:CN202210715592.X

    申请日:2022-06-23

    Applicant: 清华大学

    Abstract: 本发明涉及人工智能技术领域,提供一种问答方法、问答数据集生成方法及装置,方法包括:获取待回答问题,将待回答问题输入至问答模型,得到待回答问题的答案;问答模型是基于问答数据集得到的,针对提问策略库的每种问题模板,从提问对象库中选择与第一占位符对应的若干目标元素,基于元素描述策略库的M种元素描述模板生成目标元素的M个元素描述信息,将若干目标元素的M个元素描述信息依次替换问题模板中对应的第一占位符,生成多个第一问题;基于第一问题中具有别名的元素将第一问题转写成第二问题,并通过生成第二问题的释义将第二问题转写成第三问题;基于所有第三问题及目标元素生成问答数据集,解决了问答数据集的质量问题,提高了质量。

    跨域推荐方法、装置、电子设备及存储介质

    公开(公告)号:CN115098692A

    公开(公告)日:2022-09-23

    申请号:CN202210614778.6

    申请日:2022-05-30

    Applicant: 清华大学

    Abstract: 本发明提供一种跨域推荐方法、装置、电子设备及存储介质,其中,所述方法应用于数据稀疏的目标域,目标域的目标域实体包括待推荐用户实体和待推荐商品实体,所述方法包括:获取知识图谱和源域,其中,源域中的源域实体包括源域用户实体和源域商品实体;基于知识图谱,对目标域实体和源域实体进行转换,得到目标域实体向量和源域实体向量;基于目标域实体向量和源域实体向量,通过图注意力模型得到待推荐用户实体的融合偏好特征;基于待推荐用户实体的融合偏好特征,通过跨域贝叶斯机制进行推荐,得到待推荐用户实体关于待推荐商品实体的推荐排序。通过本发明提高了对待推荐用户实体进行商品实体推荐的推荐效率。

    故事脉络构建方法、装置、电子设备和存储介质

    公开(公告)号:CN115033668A

    公开(公告)日:2022-09-09

    申请号:CN202210965268.3

    申请日:2022-08-12

    Applicant: 清华大学

    Abstract: 本发明涉及自然语言处理技术领域,提供一种故事脉络构建方法、装置、电子设备和存储介质,包括:获取待构建脉络的新闻集合;基于关系检测模型,对新闻集合中的每两个新闻进行脉络关系检测,得到每两个新闻之间的脉络关系检测结果;基于每两个新闻之间的脉络关系检测结果,构建新闻集合对应的故事脉络;关系检测模型基于正样本对和负样本对训练得到,正样本对基于话题相同、时间相邻且事件不同的样本新闻确定,负样本对基于话题相同且时间间隔的样本新闻和/或话题不同的样本新闻确定,样本新闻的话题和事件基于聚类得到。本发明在无需人工参与的情况下,提高了数据集构建的效率和可靠性,扩张了数据集规模,保障了故事脉络构建的可靠性和准确性。

    常识知识评分和排序方法及装置
    108.
    发明公开

    公开(公告)号:CN114861913A

    公开(公告)日:2022-08-05

    申请号:CN202210292415.5

    申请日:2022-03-23

    Applicant: 清华大学

    Abstract: 本发明提供一种常识知识评分和排序方法及装置,其中,常识知识评分方法包括:获取待评分常识三元组对象和与待评分常识三元组对象对应的义原树组;将待评分常识三元组对象和义原树组输入至评分模型,获得评分模型输出的投票结果;其中,评分模型是基于样本组以及对应的投票标签进行训练后得到的,样本组包括常识三元组样本以及与常识三元组样本对应的义原树组样本,投票标签是根据样本组预先确定的,并与样本组一一对应。本发明提供的常识知识评分和排序方法及装置通过结合三元组自身信息和外部知识库的义原信息,实现了对待评分常识三元组对象进行综合评分,提高了常识知识评分和排序的准确率。

    一种基于预训练的慕课自适应学习系统构建方法和装置

    公开(公告)号:CN114567815A

    公开(公告)日:2022-05-31

    申请号:CN202210068224.0

    申请日:2022-01-20

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于预训练的慕课自适应学习系统构建方法和装置,其中,该方法包括:获取第一预设时间内慕课平台记录的学生学习行为数据,以及预设条件下的辅助信息,辅助信息至少包括课程结构元信息和视频字幕文本;基于学生学习行为数据,以预设的粒度对学习行为日志进行聚合与处理,得到学生学习行为序列;基于辅助信息进行知识挖掘,获取课程结构元信息与视频的初始表示;基于学生学习行为序列和初始表示构建学习行为预训练模型,并采用掩码预测任务训练模型;将学习行为预训练模型应用于学习资源推荐和学习资源评估两个核心下游任务。本发明能够对慕课场景的学习行为、学习资源进行统一建模,构建出性能更强、更通用的自适应学习系统。

    用于命名实体识别的模型训练方法、识别方法及装置

    公开(公告)号:CN113298253B

    公开(公告)日:2021-12-14

    申请号:CN202110621275.7

    申请日:2021-06-03

    Applicant: 清华大学

    Abstract: 本发明提供一种用于命名实体识别的模型训练方法、识别方法及装置,该模型训练方法包括:将预定义类数据输入到由编码模块和分类模块构建的第一原型网络,得到学习后的编码模块;将预定义类数据分别输入到学习前后的编码模块,结果分别输入到组分类器进行训练;将其他类数据分别输入到学习前后的编码模块,结果分别输入到训练后的组分类器,得到其他类数据的分组结果;将预定义类数据和其他类数据输入到第二原型网络,对第二原型网络进行训练。本发明提供的用于命名实体识别的模型训练方法、识别方法及装置,通过利用预定义类的弱监督信号,能够有效地从其他类中挖掘更多的未定义类,从而利用其他类中丰富的语义信息,增强小样本命名实体识别能力。

Patent Agency Ranking