-
公开(公告)号:CN112307130B
公开(公告)日:2022-07-05
申请号:CN202011135229.8
申请日:2020-10-21
Applicant: 清华大学 , 腾讯科技(深圳)有限公司
IPC: G06F16/28 , G06F16/215 , G06F40/284 , G06N3/08
Abstract: 本发明实施例提供一种文档级远程监督关系抽取方法及系统,该方法包括:获取远程监督数据;基于训练好的预降噪模型,对所述远程监督数据进行降噪处理,得到目标远程监督数据,所述训练好的预降噪模型是由标注为正样例的样本远程监督数据和标注为负样例的样本远程监督数据训练得到的;将所述目标远程监督数据输入到训练好的文本编码器模型中,得到文档级关系抽取结果,所述训练好的文本编码器模型是由降噪后的样本文档级远程监督数据训练得到的。本发明实施例通过预训练方式对远程监督数据进行降噪,能够有效地滤除远程监督数据中的噪音,并利用大规模的降噪后数据对模型进行预训练,从而实现文档级远程监督关系抽取,提升文档级关系抽取效果。
-
公开(公告)号:CN112528019A
公开(公告)日:2021-03-19
申请号:CN202011388845.4
申请日:2020-12-01
Applicant: 清华大学 , 腾讯科技(深圳)有限公司
Abstract: 本发明提供一种文本中实体关系处理方法、装置、电子设备及存储介质,该方法包括:获取目标文本;将目标文本输入到预设的实体关系处理模型中,得到目标文本中实体关系的类别;实体关系处理模型为将训练文本的特征信息和实体关系的类别作为输入,通过机器学习训练得到的,用于确定文本中实体关系的类别的模型;实体关系处理模型包括编码层、参数优化层和分类层,编码层用于根据目标文本确定特征信息,分类层用于根据目标文本的特征信息和分类参数确定目标文本中实体关系的类别,参数优化层用于对分类参数进行优化;分类参数由文本的类别的元信息确定,实现将类别的元信息作为文本的特性信息的判断指引,使文本中实体关系的分类更准确和高效。
-
公开(公告)号:CN106202095A
公开(公告)日:2016-12-07
申请号:CN201510224059.3
申请日:2015-05-05
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种群组消息显示方法及装置,属于即时通讯领域。所述方法包括:获取未读的群组消息;提取该未读的群组消息的特征信息,该特征信息包括该未读的群组消息的发布者的标识和/或该未读的群组消息包含的关键词;检测该特征信息与预先设置的特定信息是否匹配;若是,则将该未读的群组消息添加入该特定信息对应的消息聚合列表,在检测到对该特定信息对应的消息入口的指定操作时,显示该消息聚合列表,将由指定群成员发布或者包含指定的关键词的群组消息聚合在一起进行显示,不需要用户在群组消息的显示界面中查找即可以快速显示用户感兴趣的消息,简化用户操作,节约用户时间。
-
公开(公告)号:CN112528019B
公开(公告)日:2025-01-10
申请号:CN202011388845.4
申请日:2020-12-01
Applicant: 清华大学 , 腾讯科技(深圳)有限公司
Abstract: 本发明提供一种文本中实体关系处理方法、装置、电子设备及存储介质,该方法包括:获取目标文本;将目标文本输入到预设的实体关系处理模型中,得到目标文本中实体关系的类别;实体关系处理模型为将训练文本的特征信息和实体关系的类别作为输入,通过机器学习训练得到的,用于确定文本中实体关系的类别的模型;实体关系处理模型包括编码层、参数优化层和分类层,编码层用于根据目标文本确定特征信息,分类层用于根据目标文本的特征信息和分类参数确定目标文本中实体关系的类别,参数优化层用于对分类参数进行优化;分类参数由文本的类别的元信息确定,实现将类别的元信息作为文本的特性信息的判断指引,使文本中实体关系的分类更准确和高效。
-
公开(公告)号:CN117217858A
公开(公告)日:2023-12-12
申请号:CN202311133410.9
申请日:2023-08-31
Applicant: 腾讯科技(深圳)有限公司 , 清华大学
IPC: G06Q30/0601 , G06F40/30 , G06F16/9535
Abstract: 本申请公开了一种基于人工智能的物品推荐方法、装置、设备及存储介质。该方法包括:获取至少一个第一训练样本和至少一个第二训练样本;基于第一训练样本对预训练语言模型进行训练,得到训练后的预训练语言模型;基于第二训练样本对训练后的预训练语言模型进行调整,得到调整后的预训练语言模型,调整后的预训练语言模型用于物品推荐。由于第二训练样本包括一个用户的至少两个历史选取物品的第二文本表示,而第二文本表示既包括在多个领域的泛化性属性的文本表示,也包括在特定领域的个性化属性的文本表示,因此,调整后的预训练语言模型能够从多个历史选取物品的第二文本表示中,较好地学习到用户的偏好,从而为用户进行更准确地物品推荐。
-
公开(公告)号:CN115080736A
公开(公告)日:2022-09-20
申请号:CN202210567681.4
申请日:2022-05-23
Applicant: 清华大学 , 腾讯科技(深圳)有限公司
Abstract: 本发明提供一种判别式语言模型的模型调整方法及装置,所述方法包括以下步骤:获取预训练的判别式语言模型和下游任务的训练数据集;响应于任务请求,根据所述任务请求的类型和所述训练数据集,对所述预训练的语言模型进行调整;其中,所述判别式语言模型是通过文本样本训练得到的。通过对判别式语言模型在不同的下游任务阶段进行模型参数的调整,消除判别式语言模型在模型预训练阶段与下游任务之间的差别,提高模型的整体效果。
-
公开(公告)号:CN113505231A
公开(公告)日:2021-10-15
申请号:CN202110492335.X
申请日:2021-05-06
Applicant: 清华大学 , 腾讯科技(深圳)有限公司
Abstract: 本发明提供一种开放层次结构关系的发现方法、装置和电子设备,包括:基于新的语料库确定待测语句;将每一个所述待测语句输入关系表征模型,输出对应的关系表征向量;对所有待测语句的关系表征向量进行聚类,确定新的关系类型;基于预设规则将所述新的关系类型插入所述原层次结构关系中;其中,所述关系表征模型是基于所述原层次结构关系中的样本语句和对应的关系类型标签进行训练得到的,所述关系表征模型训练过程中使用的损失函数基于动态层级三元组损失构建。本发明提供的方法、装置和电子设备,实现了更好理解原层次结构关系中的关系类型,将发现出的新关系自动加入已有的原层次结构关系中。
-
公开(公告)号:CN106326104B
公开(公告)日:2021-03-16
申请号:CN201510397199.0
申请日:2015-07-08
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F11/36
Abstract: 本发明公开了一种终端控件测试方法,包括:遍历预先建立的控件交互界面图表数据模型的节点和边得到所有可点击控件作为待测试控件;获取当前上下文状态,基于所述上下文状态确定测试页面的返回路径;根据所述返回路径返回测试页面,在所述测试页面对所述待测试控件进行测试。本发明还公开一种终端控件测试装置。本发明实现全自动化的遍历来识别出终端的控件对控件进行测试,提高了终端测试的智能化程度。
-
公开(公告)号:CN106302096A
公开(公告)日:2017-01-04
申请号:CN201510305100.X
申请日:2015-06-04
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明提供了一种会话页面中实现地理位置展示的方法,包括:会话页面中触发开启用户和联系人之间的地理位置展示时上报用户位置信息;接收中转服务器根据所述联系人和上报的用户位置信息返回的地图加载信息;在所述会话页面的背景加载所述地图加载信息,以得到标识了用户所在地理位置,或用户所在地理位置和联系人所在地理位置的地图。此外,还提供了一种与该方法匹配的会话页面中实现地理位置展示的系统。上述会话页面中实现地理位置展示的方法和系统能使得用户和联系人之间的地理位置展示不需要依赖于终端中的地图应用或者浏览器提供的地图,且能简化操作。
-
公开(公告)号:CN115080736B
公开(公告)日:2024-09-20
申请号:CN202210567681.4
申请日:2022-05-23
Applicant: 清华大学 , 腾讯科技(深圳)有限公司
IPC: G06F16/35 , G06F18/214
Abstract: 本发明提供一种判别式语言模型的模型调整方法及装置,所述方法包括以下步骤:获取预训练的判别式语言模型和下游任务的训练数据集;响应于任务请求,根据所述任务请求的类型和所述训练数据集,对所述预训练的语言模型进行调整;其中,所述判别式语言模型是通过文本样本训练得到的。通过对判别式语言模型在不同的下游任务阶段进行模型参数的调整,消除判别式语言模型在模型预训练阶段与下游任务之间的差别,提高模型的整体效果。
-
-
-
-
-
-
-
-
-