-
公开(公告)号:CN114266230B
公开(公告)日:2024-11-05
申请号:CN202111644937.9
申请日:2021-12-30
Applicant: 讯飞医疗科技股份有限公司
IPC: G06F40/157 , G06F40/279 , G06N3/0464 , G06N3/084
Abstract: 本申请公开了一种文本结构化处理方法、装置、存储介质及计算机设备。该方法包括:基于知识字典中的实体及实体类型,对待结构化处理的文本信息进行实体提取编码处理,得到文本信息中的各实体的实体编码特征,将文本信息对应的文本字符特征与实体编码特征进行拼接处理,得到包括文本字符特征和实体编码特征的特征集合,获取特征集合中各特征相对于文本信息的实体注意力权重,根据实体注意力权重,对文本信息进行编码得到文本信息所对应的文本编码特征,文本编码特征进行解码得到文本信息中的结构化信息。本申请可同时抽取文本信息中的关联关系和实体,消除了误差传播,增强了不同实体之间的信息交互,提高了文本结构化处理的准确性。
-
公开(公告)号:CN111145913B
公开(公告)日:2024-02-20
申请号:CN201911391777.4
申请日:2019-12-30
Applicant: 讯飞医疗科技股份有限公司
IPC: G16H50/70 , G06F18/241
Abstract: 本申请提供了一种基于多重注意力模型的分类方法,将获取的第一向量和第二向量输入预设的分类模型,得到分类模型输出的待分类的对象的分类结果,其中,分类模型中的第一类注意力模块可以建立第一向量与第二向量之间的相关性,得到第一特征向量以及第二特征向量。分类模型中的第二类注意力模块可以建立第一特征向量以及第二特征向量之间的相关性,得到第一分类向量,并基于第一分类向量确定分类结果。综上,本申请的分类方法使用了两种类型的注意力模型,从多个角度建立向量之间的相关性,并以相关性确定分类特征向量,从而实现了知识的重用性和共享性,有利于提高分类结果的准确性。
-