文本结构化处理方法、装置、存储介质及计算机设备

    公开(公告)号:CN114266230B

    公开(公告)日:2024-11-05

    申请号:CN202111644937.9

    申请日:2021-12-30

    Abstract: 本申请公开了一种文本结构化处理方法、装置、存储介质及计算机设备。该方法包括:基于知识字典中的实体及实体类型,对待结构化处理的文本信息进行实体提取编码处理,得到文本信息中的各实体的实体编码特征,将文本信息对应的文本字符特征与实体编码特征进行拼接处理,得到包括文本字符特征和实体编码特征的特征集合,获取特征集合中各特征相对于文本信息的实体注意力权重,根据实体注意力权重,对文本信息进行编码得到文本信息所对应的文本编码特征,文本编码特征进行解码得到文本信息中的结构化信息。本申请可同时抽取文本信息中的关联关系和实体,消除了误差传播,增强了不同实体之间的信息交互,提高了文本结构化处理的准确性。

    一种症状信息抽取方法、装置、设备及存储介质

    公开(公告)号:CN112883194B

    公开(公告)日:2024-02-20

    申请号:CN202110367733.9

    申请日:2021-04-06

    Abstract: 本申请提供了一种症状信息抽取方法、装置、设备及存储介质,其中,方法包括:获取与待抽取症状信息的第一文本中的内容匹配的症状标准词,作为目标医学知识;将目标医学知识融入第一文本中,融入目标医学知识的文本作为第二文本;基于预先建立的症状信息抽取模型对第二文本进行症状信息的抽取,抽取出的症状信息作为第一文本对应的症状信息抽取结果。经由本申请提供的症状信息抽取方法可从待抽取症状信息的病情文本中抽取出标准的症状描述信息。

    实体识别方法、装置、电子设备及存储介质

    公开(公告)号:CN116205230A

    公开(公告)日:2023-06-02

    申请号:CN202211712884.4

    申请日:2022-12-26

    Abstract: 本申请提出一种实体识别方法、装置、电子设备及存储介质,方法包括:将待识别文本输入到预先训练的实体识别模型中,得到待识别文本对应的实体标签;其中,实体识别模型至少通过将预先构建的实体识别规则嵌入与实体识别规则相匹配的第一训练样本,并利用嵌入实体识别规则后的第一训练样本进行实体识别训练得到,与实体识别规则相匹配的第一训练样本,包括能够通过实体识别规则识别样本中的实体的文本样本。采用本方案,将预先构建的实体识别规则融入到实体识别模型中,实体识别规则可以在样本较少时,也能得到较高的识别效果,因此,融入了实体识别规则的实体识别模型,能够提高实体识别模型的准确率,从而提高医疗文本的命名实体识别的准确率。

Patent Agency Ranking