-
公开(公告)号:CN110390102B
公开(公告)日:2024-07-12
申请号:CN201910665337.7
申请日:2019-07-22
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F40/30 , G06F40/284
Abstract: 本申请公开了一种情感分析的方法和相关装置,能够好地反映出待处理文本的情感信息,参考意义较大。本申请方法包括:包括:获取待处理文本;生成表征所述待处理文本的第一特征向量;根据预置的情感分析模型和所述第一特征向量生成第一情感标签向量,所述情感分析模型表征所述第一特征向量与所述第一情感标签向量之间的对应关系;在所述第一情感标签向量中,一个维度上的数值表征一个情感标签对于所述待处理文本的第一重要程度。
-
公开(公告)号:CN110909142B
公开(公告)日:2023-03-31
申请号:CN201911141607.0
申请日:2019-11-20
Applicant: 腾讯科技(深圳)有限公司 , 清华大学
IPC: G06F16/332 , G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本发明提供了问答模型的问题语句处理方法,包括:通过问答模型的隐变量生成网络,确定与所述目标问题语句所对应的至少一个词语级的隐变量;通过所述问答模型的答复语句生成网络,确定与所述问答模型相匹配的人设特征向量;响应于所述人设特征向量,通过所述问答模型的答复语句生成网络,根据所述至少一个词语级的隐变量,生成与所述词语级的隐变量相对应的答复词语以及所述答复词语的被选取概率;根据所述答复词语的被选取概率,选取至少一个答复词语组成与所述目标问题语句相对应的答复语句;输出所述答复语句。本发明还提供了问题语句处理装置、电子设备及存储介质。本发明能够实现所述答复语句与所述问答模型对应的人设特征相匹配。
-
公开(公告)号:CN115700608A
公开(公告)日:2023-02-07
申请号:CN202110871788.3
申请日:2021-07-30
Applicant: 腾讯科技(深圳)有限公司
IPC: G06N5/025
Abstract: 本申请实施例公开一种数据处理方法、装置、计算机设备以及存储介质,其中方法包括如下步骤:获取目标用户已作答的问题和未做答的目标问题;根据已做答的问题和目标问题生成目标用户的问题序列、知识点序列和答题记录序列;对问题序列、知识点序列和答题记录序列进行特征提取,生成问题序列对应的问题向量、知识点序列对应的知识点向量和答题记录序列对应的答题记录向量;对问题向量和知识点向量进行图特征提取生成对应的图向量;通过问题作答预测模型,基于图向量、问题向量、知识点向量和答题记录向量生成所述目标用户作答所述目标问题的正确概率。采用本申请,可以准确掌握用户对知识点的掌握程度,提高了预测用户答题的准确率。
-
公开(公告)号:CN115114442A
公开(公告)日:2022-09-27
申请号:CN202210360766.5
申请日:2022-04-07
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/36 , G06F16/31 , G06F16/332 , G06N20/00
Abstract: 本申请公开了一种知识图谱的更新方法和装置、存储介质及电子设备。其中,该方法包括:获取待更新的第一时序知识图谱,根据第一时序知识图谱构建第一函数和第二函数,根据第一函数和第二函数构建目标评价函数,根据目标评价函数,在第二组四元组中确定出待补入的四元组,并将待补入的四元组添加至第一时序知识图谱中,得到第二时序知识图谱。本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景,本申请解决了时序知识图谱的利用效率较低的技术问题。
-
公开(公告)号:CN113076426A
公开(公告)日:2021-07-06
申请号:CN202110630360.X
申请日:2021-06-07
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请提供了一种多标签文本分类及模型训练方法、装置、设备及存储介质,本申请在训练多标签文本分类模型的过程中,会基于该多标签文本分类模型输出的各标签的标签预测特征,来训练能够捕获标签间相关性的分类器,通过同步训练该分类器和该多标签文本分类模型,使得训练出的多标签文本分类模型也能够更为精准的捕获标签间的相关性,而标签的相关性为确定文本相关的标签提供更多的信息依据,从而使得多标签文本分类模型能够更为准确识别出文本相关的标签,提高利用该多标签文本分类模型确定文本相关的多个标签的准确性。
-
公开(公告)号:CN110795552A
公开(公告)日:2020-02-14
申请号:CN201911005505.6
申请日:2019-10-22
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/335 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种训练样本生成方法,包括:获取待处理的初始文本数据;对所述初始文本数据进行分词处理,以形成与所述初始文本数据相匹配的关键词;根据与所述初始文本数据相匹配的关键词对初始文本进行筛选,以形成针对指定业务的目标文本;通过所述目标文本对相应的文本处理模型进行训练;根据所述文本处理模型的训练结果对所述目标文本进行领域数据增广处理,以形成针对指定业务的训练样本。本发明还提供了训练样本生成装置、电子设备及存储介质。本发明能够实现提升训练样本的针对性,使其更适用于机器阅读理解任务,同时提高了对特定业务领域的神经网络模型的识别精准度、增强其鲁棒性。
-
公开(公告)号:CN110795538A
公开(公告)日:2020-02-14
申请号:CN201911048077.5
申请日:2019-10-30
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请实施例公开了一种基于人工智能的文本评分方法和相关设备,该方法包括:可以获取目标文章中的段落或语句作为待评分文本,并计算待评分文本在每个评分维度下的维度分数。其中,评分维度包括扣题维度、语句通顺维度、文采维度、高级文本维度、连贯性维度、立意维度、布局维度中的一种或多种组合。最后,根据计算出的维度分数,确定待评分文本的目标分数。该方法站在作者的角度,基于对目标文章的更细化的评分方式,帮助作者更详细的了解目标文章中的段落甚至语句的写作水平。
-
公开(公告)号:CN110162600A
公开(公告)日:2019-08-23
申请号:CN201910419481.2
申请日:2019-05-20
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请公开了一种信息处理的方法,包括:获取第一待处理信息;若第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,N组对话信息是与第一待处理信息相邻的对话信息,候选先行词集合包括至少一个候选先行词,候选先行词包括至少一个名词,N为大于或等于1的整数;通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果;根据候选先行词的分类结果,对第一待处理信息中的第一指代词进行消除,得到第二待处理信息。本申请还提供了一种会话响应的方法以及装置。本申请实施例能够提取到更贴近实际含义的候选先行词,从而提升指代消除的准确性。
-
公开(公告)号:CN111783429B
公开(公告)日:2024-06-07
申请号:CN202010759411.4
申请日:2020-07-31
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F40/211 , G06F40/30 , G06F40/253 , G06F40/126 , G06N3/0464 , G06N3/0895
Abstract: 本申请实施例公开了一种信息处理方法、装置、电子设备以及存储介质,可适用于人工智能以及大数据等领域。该方法包括:获取待处理语句和待处理语句对应的上文语句;若待处理语句为省略句的情况下,则确定待处理语句的第一语句特征和上文语句的第二语句特征;根据第一语句特征和第二语句特征,生成待处理语句对应的完整语句;根据完整语句进行相应的处理。采用本申请实施例,可将用户输入的省略句恢复为完整语句,可提高对用户输入语句的信息处理效果。
-
公开(公告)号:CN110750998B
公开(公告)日:2023-10-31
申请号:CN201910974382.0
申请日:2019-10-14
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请实施例公开了一种文本输出方法、装置、计算机设备和存储介质;本申请实施例可以获取问题文本和检测文本,将检测文本划分为多个检测子文本;构建问题文本中第一字单元的第一特征向量和检测子文本中第二字单元的第二特征向量;分别对第一特征向量和第二特征向量进行非线性处理,得到处理后的第一特征向量和第二特征向量;分别对处理后的第一特征向量和第二特征向量进行特征提取,得到第一目标特征向量和第二目标特征向量;根据第一目标特征向量和第二目标特征向量,预测第一字单元的第一概率和第二字单元的第二概率;基于第一概率和第二概率,确定并输出问题文本对应的答案文本。该方案能够提高文本输出的精准度。
-
-
-
-
-
-
-
-
-