一种基于最邻近对比学习的小样本编码方法

    公开(公告)号:CN116842455A

    公开(公告)日:2023-10-03

    申请号:CN202310685368.5

    申请日:2023-06-09

    Abstract: 本发明公开了一种基于最邻近对比学习的小样本编码方法,利用卷积神经网络和ICD编码描述捕捉文本语义特征,并利用注意力机制以捕获到与ICD信息关系密切相关的病历文本内容,使用额外的结构化知识的统一医学语言系统和ICD编码的树形层次结构来构建对比学习的正负样本,进而训练了一个针对同一个编码不同表述的自CMCL模型,使得同义表述和其缩写的特征表示在特征空间中更接近,不同编码的表述在特征空间中距离更远。最后利用k邻近模块整合训练集中已有知识获得最佳预测结果。

Patent Agency Ranking