医学文献分类模型训练方法、医学文献分类方法及其装置

    公开(公告)号:CN108959236B

    公开(公告)日:2021-11-09

    申请号:CN201710358918.7

    申请日:2017-05-19

    Abstract: 本申请公开了一种医学文献分类模型训练方法、医学文献分类方法及其装置,该训练方法,包括:从样本文献中提取待标注数据;利用预先建立的分类体系和标注规则库,对待标注数据进行标注,其中分类体系和标注规则库基于用户对医学文献的分类需求而构建,分类体系包括至少两个分类维度,每个分类维度包括至少两个文献类别,每个文献类别具有相关联的标注规则;将标注数据作为训练数据对分类模型进行训练,得到医学文献分类模型。根据本申请实施例提供的技术方案,通过对文献进行基于专业分类体系和标注规则的分类,能够解决现有医学文献的分类不够细化和专业的问题。

    医学文献分类模型训练方法、医学文献分类方法及其装置

    公开(公告)号:CN108959236A

    公开(公告)日:2018-12-07

    申请号:CN201710358918.7

    申请日:2017-05-19

    CPC classification number: G06F17/277 G06K9/6256

    Abstract: 本申请公开了一种医学文献分类模型训练方法、医学文献分类方法及其装置,该训练方法,包括:从样本文献中提取待标注数据;利用预先建立的分类体系和标注规则库,对待标注数据进行标注,其中分类体系和标注规则库基于用户对医学文献的分类需求而构建,分类体系包括至少两个分类维度,每个分类维度包括至少两个文献类别,每个文献类别具有相关联的标注规则;将标注数据作为训练数据对分类模型进行训练,得到医学文献分类模型。根据本申请实施例提供的技术方案,通过对文献进行基于专业分类体系和标注规则的分类,能够解决现有医学文献的分类不够细化和专业的问题。

    实体挖掘系统和方法
    3.
    发明授权

    公开(公告)号:CN108132947B

    公开(公告)日:2022-06-03

    申请号:CN201611089730.9

    申请日:2016-12-01

    Inventor: 张喜媛 曾刚 何戬

    Abstract: 本发明提供一种实体挖掘系统和方法,该系统包括:标注单元,配置用于获取当前领域的第一组知识信息和若干实体,根据该若干实体对第一组知识信息进行标注;规则挖掘单元,配置用于从标注实体的第一组知识信息中筛选若干关联的高频词汇,并筛选若干高频词汇中共现频率最高的若干词组以生成有序关联规则;实体挖掘单元,配置用于获取当前领域的第二组知识信息,根据有序关联规则对第二组知识信息进行挖掘,得到若干实体候选;过滤单元,配置用于根据预定的过滤规则对各实体候选进行过滤,生成实体挖掘结果并输出。本发明利用有序关联规则进行实体挖掘,提高了实体挖掘的准确率,并对挖掘结果进行有效过滤,保障了挖掘结果的准确性。

    实体挖掘系统和方法
    4.
    发明公开

    公开(公告)号:CN108132947A

    公开(公告)日:2018-06-08

    申请号:CN201611089730.9

    申请日:2016-12-01

    Inventor: 张喜媛 曾刚 何戬

    Abstract: 本发明提供一种实体挖掘系统和方法,该系统包括:标注单元,配置用于获取当前领域的第一组知识信息和若干实体,根据该若干实体对第一组知识信息进行标注;规则挖掘单元,配置用于从标注实体的第一组知识信息中筛选若干关联的高频词汇,并筛选若干高频词汇中共现频率最高的若干词组以生成有序关联规则;实体挖掘单元,配置用于获取当前领域的第二组知识信息,根据有序关联规则对第二组知识信息进行挖掘,得到若干实体候选;过滤单元,配置用于根据预定的过滤规则对各实体候选进行过滤,生成实体挖掘结果并输出。本发明利用有序关联规则进行实体挖掘,提高了实体挖掘的准确率,并对挖掘结果进行有效过滤,保障了挖掘结果的准确性。

Patent Agency Ranking