-
公开(公告)号:CN114266230B
公开(公告)日:2024-11-05
申请号:CN202111644937.9
申请日:2021-12-30
Applicant: 讯飞医疗科技股份有限公司
IPC: G06F40/157 , G06F40/279 , G06N3/0464 , G06N3/084
Abstract: 本申请公开了一种文本结构化处理方法、装置、存储介质及计算机设备。该方法包括:基于知识字典中的实体及实体类型,对待结构化处理的文本信息进行实体提取编码处理,得到文本信息中的各实体的实体编码特征,将文本信息对应的文本字符特征与实体编码特征进行拼接处理,得到包括文本字符特征和实体编码特征的特征集合,获取特征集合中各特征相对于文本信息的实体注意力权重,根据实体注意力权重,对文本信息进行编码得到文本信息所对应的文本编码特征,文本编码特征进行解码得到文本信息中的结构化信息。本申请可同时抽取文本信息中的关联关系和实体,消除了误差传播,增强了不同实体之间的信息交互,提高了文本结构化处理的准确性。
-
公开(公告)号:CN116167375A
公开(公告)日:2023-05-26
申请号:CN202211703714.X
申请日:2022-12-27
Applicant: 讯飞医疗科技股份有限公司
IPC: G06F40/295 , G06F40/30 , G06F16/33 , G06F16/35 , G10L15/26 , G10L15/18 , G10L15/02 , G10L15/16 , G10L25/30
Abstract: 本申请提出一种实体提取方法、装置、电子设备和存储介质,能够基于从文本数据中提取得到的特定类型的命名实体,分别确定命名实体的实体特征、命名实体的每个候选实体的实体特征。其中,候选实体为特定实体库中与命名实体的相似度大于设定相似度的实体,实体特征包括实体的语义特征和语音特征。然后,根据命名实体和每个候选实体的实体特征,从候选实体中确定实体提取结果。本申请中,能够提取命名实体和候选实体的语义特征、语音特征,进而丰富命名实体和候选实体的特征内容,在命名实体的实体描述方式存在形式不规范、内容丰富多样的情况下,也能够从候选实体中提取正确的实体。
-
公开(公告)号:CN112883194B
公开(公告)日:2024-02-20
申请号:CN202110367733.9
申请日:2021-04-06
Applicant: 讯飞医疗科技股份有限公司
IPC: G16H50/70 , G16H50/20 , G06F16/35 , G16H10/60 , G06F18/214
Abstract: 本申请提供了一种症状信息抽取方法、装置、设备及存储介质,其中,方法包括:获取与待抽取症状信息的第一文本中的内容匹配的症状标准词,作为目标医学知识;将目标医学知识融入第一文本中,融入目标医学知识的文本作为第二文本;基于预先建立的症状信息抽取模型对第二文本进行症状信息的抽取,抽取出的症状信息作为第一文本对应的症状信息抽取结果。经由本申请提供的症状信息抽取方法可从待抽取症状信息的病情文本中抽取出标准的症状描述信息。
-
公开(公告)号:CN116205230A
公开(公告)日:2023-06-02
申请号:CN202211712884.4
申请日:2022-12-26
Applicant: 讯飞医疗科技股份有限公司
IPC: G06F40/295 , G06F16/33 , G06F16/35 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本申请提出一种实体识别方法、装置、电子设备及存储介质,方法包括:将待识别文本输入到预先训练的实体识别模型中,得到待识别文本对应的实体标签;其中,实体识别模型至少通过将预先构建的实体识别规则嵌入与实体识别规则相匹配的第一训练样本,并利用嵌入实体识别规则后的第一训练样本进行实体识别训练得到,与实体识别规则相匹配的第一训练样本,包括能够通过实体识别规则识别样本中的实体的文本样本。采用本方案,将预先构建的实体识别规则融入到实体识别模型中,实体识别规则可以在样本较少时,也能得到较高的识别效果,因此,融入了实体识别规则的实体识别模型,能够提高实体识别模型的准确率,从而提高医疗文本的命名实体识别的准确率。
-
-
-