-
公开(公告)号:CN119990203A
公开(公告)日:2025-05-13
申请号:CN202411812196.4
申请日:2024-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
IPC: G06N3/06 , G06F18/2431
Abstract: 本发明提供一种大模型安全神经元筛选方法和装置,方法包括:对基础大模型进行安全对齐,得到安全对齐模型;计算所述安全对齐模型和所述基础大模型的神经元激活差异;基于所述神经元激活差异,确定对所述基础大模型进行安全对齐时的安全神经元。本发明从模型自身内部的性质出发,不受任务形式限制,容易扩展,适用于大模型中的安全神经元发现,为进一步研究大模型的安全机理提供方案。
-
公开(公告)号:CN119990134A
公开(公告)日:2025-05-13
申请号:CN202411808989.9
申请日:2024-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
IPC: G06F40/30 , G06F40/284 , G06F40/237
Abstract: 本发明提供一种使用自述式提示与集成梯度的语义贡献识别方法及系统,包括:获取输入数据并编写特定的问题提示;将所述问题提示多次输入至预设的大语言模型,引导大语言模型自动识别并报告在决策过程中起到关键作用的词汇,生成关键词提议集合;基于所述关键词提议集合抽取关键词,生成第一语义贡献度列表;基于所述输入数据通过预设的公式进行集成梯度计算,生成第二语义贡献度列表;将所述第一语义贡献度列表和第二语义贡献度列表进行整合分析,确定对大语言模型决策有重大影响的词汇。本发明解决了现有技术中大语言模型行为解释单一方法的局限性问题,提高了模型解释的全面性和准确性,满足了在多种自然语言处理应用中对可解释性的要求。
-
公开(公告)号:CN110781302B
公开(公告)日:2024-06-21
申请号:CN201911013208.6
申请日:2019-10-23
Applicant: 清华大学 , 腾讯科技(深圳)有限公司
IPC: G06F16/35 , G06F16/31 , G06F16/332 , G06F40/30 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明提供了一种文本中事件角色的处理方法、装置、电子设备及存储介质;方法包括:通过角色处理模型中的编码器对文本中的单词进行编码,得到文本中单词的编码信息;通过编码器对文本中单词的编码信息进行特征聚合,得到所述文本的聚合特征;通过所述角色处理模型中的注意力模型,将至少一个事件角色的多个上层概念、以及所述文本中单词的编码信息进行关联,得到所述文本面向所述事件角色的语义向量;通过所述角色处理模型中的分类器对至少一个所述文本面向所述事件角色的语义向量、以及所述文本的聚合特征进行分类,得到对应所述文本的事件角色。通过本发明,能够根据事件角色的上层概念,自动并准确地抽取文本中的事件角色。
-
公开(公告)号:CN116501956A
公开(公告)日:2023-07-28
申请号:CN202310347942.6
申请日:2023-04-03
Applicant: 清华大学
IPC: G06F16/9535 , G06N3/042 , G06N3/08
Abstract: 本发明提供一种基于分层图对比学习的知识感知多域推荐方法及系统,包括:获取分层交互网络上多个节点,通过加权求和平滑目标节点和邻居节点进行分层表示,基于分层消息传递机制,通过交互的项目及其连接的实体来聚合更多偏好知识;基于预设的对比学习方法,在分层节点中删除部分节点进行对比学习的数据增强;基于增强后的数据通过在跨多域中域共享图对比学习和在特定域中独域图对比学习,识别目标用户内在的偏好特征;基于目标用户内在的偏好特征进行多任务模型构建,对所述多任务模型进行优化训练生成多域推荐模型,通过所述多域推荐模型完成多域推荐。本发明解决了现有多域推荐难以准确推测用户喜好的问题。
-
公开(公告)号:CN114567815B
公开(公告)日:2023-05-02
申请号:CN202210068224.0
申请日:2022-01-20
Applicant: 清华大学
IPC: H04N21/466 , H04N21/442 , G09B5/06 , G06F40/295
Abstract: 本发明公开了一种基于预训练的慕课自适应学习系统构建方法和装置,其中,该方法包括:获取第一预设时间内慕课平台记录的学生学习行为数据,以及预设条件下的辅助信息,辅助信息至少包括课程结构元信息和视频字幕文本;基于学生学习行为数据,以预设的粒度对学习行为日志进行聚合与处理,得到学生学习行为序列;基于辅助信息进行知识挖掘,获取课程结构元信息与视频的初始表示;基于学生学习行为序列和初始表示构建学习行为预训练模型,并采用掩码预测任务训练模型;将学习行为预训练模型应用于学习资源推荐和学习资源评估两个核心下游任务。本发明能够对慕课场景的学习行为、学习资源进行统一建模,构建出性能更强、更通用的自适应学习系统。
-
公开(公告)号:CN115964509A
公开(公告)日:2023-04-14
申请号:CN202211635657.6
申请日:2022-12-19
Applicant: 清华大学
IPC: G06F16/36 , G06F40/30 , G06F18/22 , G06F18/214
Abstract: 本发明涉及信息处理技术领域,提供一种知识图谱的信息补全方法、装置、电子设备及存储介质,包括:确定待补全信息序列中的已知元素对应的文本信息;根据文本信息确定文本预测序列;将文本预测序列中的各元素对应的文本信息与已有的知识图谱中各个节点信息和节点关系信息进行语义匹配,确定信息序列;根据信息序列构建用于补全信息的关联路径;根据用于补全信息的关联路径对待补全信息序列中的未知元素进行确定。本发明能够提高确定未知信息的准确性,达到完善知识图谱的目的。
-
公开(公告)号:CN115658931B
公开(公告)日:2023-04-07
申请号:CN202211681737.5
申请日:2022-12-27
Applicant: 清华大学
Abstract: 本申请涉及计算机技术领域,特别涉及一种百科知识图谱动态更新方法、装置、设备及介质,其中,包括:获取百科知识图谱的待更新数据列表,其中,待更新数据列表包括待更新词条的页面文本和/或词条简介中链接的页面文本;根据预设更新周期遍历待更新数据列表,抽取待更新数据列表中页面文本的预设关键信息,基于预设关键信息更新百科知识图谱中三元组,得到更新结果;对更新结果进行结构化,得到更新后的百科知识图谱,并基于更新后的百科知识图谱更新数据库中存储的百科知识图谱。由此,解决了相关技术中需人工手动修改审核更新,无法自动更新和维护百科知识图谱,导致更新效率较低、维护成本较高等问题。
-
公开(公告)号:CN115827838A
公开(公告)日:2023-03-21
申请号:CN202211475495.4
申请日:2022-11-23
Applicant: 北京智谱华章科技有限公司 , 清华大学
IPC: G06F16/332 , G06F16/36 , G06F16/23
Abstract: 本申请提出一种基于故事续写和动态知识库的对话生成方法及系统,该方法包括:获取用户输入的初始故事,并从初始故事中确定对话角色;构建知识库,从初始故事中抽取出与对话角色相关的知识存入知识库,并获取与知识库中已有知识相关的外部补充知识,以对知识库进行更新;基于更新后的知识库中的知识和初始故事,生成与用户交互的对话,并获取用户返回的对话;抽取对话内容中的事件知识,并基于初始故事和事件知识进行故事续写,将续写后的故事存入知识库;基于续写后的故事,循环进行知识库的更新、与用户的交互对话和故事续写,直至对话结束。该方法基于动态知识库和角色故事续写的框架生成对话,提高了与AI对话的拟真度和趣味性。
-
公开(公告)号:CN115033668B
公开(公告)日:2022-11-11
申请号:CN202210965268.3
申请日:2022-08-12
Applicant: 清华大学
IPC: G06F16/33 , G06F16/35 , G06F40/284 , G06F40/295 , G06F40/30
Abstract: 本发明涉及自然语言处理技术领域,提供一种故事脉络构建方法、装置、电子设备和存储介质,包括:获取待构建脉络的新闻集合;基于关系检测模型,对新闻集合中的每两个新闻进行脉络关系检测,得到每两个新闻之间的脉络关系检测结果;基于每两个新闻之间的脉络关系检测结果,构建新闻集合对应的故事脉络;关系检测模型基于正样本对和负样本对训练得到,正样本对基于话题相同、时间相邻且事件不同的样本新闻确定,负样本对基于话题相同且时间间隔的样本新闻和/或话题不同的样本新闻确定,样本新闻的话题和事件基于聚类得到。本发明在无需人工参与的情况下,提高了数据集构建的效率和可靠性,扩张了数据集规模,保障了故事脉络构建的可靠性和准确性。
-
公开(公告)号:CN112579794B
公开(公告)日:2022-11-11
申请号:CN202011565924.8
申请日:2020-12-25
Applicant: 清华大学
Abstract: 本发明实施例提供一种为中英文单词对预测义原树的方法及系统,包括:获取待预测单词对,以及所述待预测单词对应的类别义原;基于已知的预设义原集合和语义关系集合,和所述待预测单词对应的类别义原,采用预设义原树生成算法为所述待预测单词对预测生成义原树。本发明实施例通过已知的义原知识库,给定单词对的类别义原信息,为给定单词对预测义原树,实现了自动预测义原树,相比人工手动标注义原树需要花费大量的时间和成本,具有更高效和更准确的特点。
-
-
-
-
-
-
-
-
-