疾病知识挖掘方法、装置、电子设备和存储介质

    公开(公告)号:CN116206767A

    公开(公告)日:2023-06-02

    申请号:CN202211735593.7

    申请日:2022-12-30

    Abstract: 本发明公开了一种疾病知识挖掘方法、装置、电子设备和存储介质,属于数据挖掘技术领域,其中,疾病知识挖掘方法包括:从疾病数据库中获取待挖掘的多源原始数据;基于预先构建的扩展疾病列表,对原始数据进行筛选;对筛选后的原始数据进行数据预处理;对预处理后的原始数据进行实体识别,得到预处理后的原始数据对应的实体信息;基于实体信息,对预处理后的原始数据进行疾病知识挖掘,对挖掘的疾病知识进行标准化处理,得到标准疾病知识;对标准疾病知识进行去重处理,得到预处理后的原始数据对应的疾病知识文本。本发明可对不同来源的原始数据进行疾病知识挖掘,提高了疾病知识挖掘的效率和准确率。

    实体识别方法、装置、电子设备及存储介质

    公开(公告)号:CN116205230A

    公开(公告)日:2023-06-02

    申请号:CN202211712884.4

    申请日:2022-12-26

    Abstract: 本申请提出一种实体识别方法、装置、电子设备及存储介质,方法包括:将待识别文本输入到预先训练的实体识别模型中,得到待识别文本对应的实体标签;其中,实体识别模型至少通过将预先构建的实体识别规则嵌入与实体识别规则相匹配的第一训练样本,并利用嵌入实体识别规则后的第一训练样本进行实体识别训练得到,与实体识别规则相匹配的第一训练样本,包括能够通过实体识别规则识别样本中的实体的文本样本。采用本方案,将预先构建的实体识别规则融入到实体识别模型中,实体识别规则可以在样本较少时,也能得到较高的识别效果,因此,融入了实体识别规则的实体识别模型,能够提高实体识别模型的准确率,从而提高医疗文本的命名实体识别的准确率。

Patent Agency Ranking