-
公开(公告)号:CN110196981A
公开(公告)日:2019-09-03
申请号:CN201910504977.X
申请日:2019-06-11
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/27
Abstract: 本发明实施例提出一种文本表示方法、装置、设备和存储介质,其中的方法包括获取目标文本对应的多个词向量;从多个词向量中,获取目标文本的全局特征;根据全局特征生成多个全局信息,每个全局信息与至少一个词向量对应;根据多个词向量以及多个全局信息,获取目标文本的多个局部特征;根据多个局部特征生成目标文本的表示向量。本发明实施例的方法将文本的全局特征融合在局部特征的抽取过程中,因此生成的局部特征对于全局背景的理解会更好。进而,只需要很浅的网络就可以直接对文本进行分类,并取得优异的分类效果,并且无需额外的更深层的网络,以降低学习难度。
-
公开(公告)号:CN110196981B
公开(公告)日:2023-07-25
申请号:CN201910504977.X
申请日:2019-06-11
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/279 , G06F18/213 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/047 , G06N3/048 , G06F16/35
Abstract: 本发明实施例提出一种文本表示方法、装置、设备和存储介质,其中的方法包括获取目标文本对应的多个词向量;从多个词向量中,获取目标文本的全局特征;根据全局特征生成多个全局信息,每个全局信息与至少一个词向量对应;根据多个词向量以及多个全局信息,获取目标文本的多个局部特征;根据多个局部特征生成目标文本的表示向量。本发明实施例的方法将文本的全局特征融合在局部特征的抽取过程中,因此生成的局部特征对于全局背景的理解会更好。进而,只需要很浅的网络就可以直接对文本进行分类,并取得优异的分类效果,并且无需额外的更深层的网络,以降低学习难度。
-