一种面向医疗的少样本多模态细粒度实体分类方法及系统

    公开(公告)号:CN119917669A

    公开(公告)日:2025-05-02

    申请号:CN202510414327.1

    申请日:2025-04-03

    Applicant: 南开大学

    Abstract: 本发明涉及电数字数据处理技术领域,尤其涉及一种面向医疗的少样本多模态细粒度实体分类方法及系统,方法包括如下步骤:构建少样本训练集、少样本验证集及少样本测试集,并扩充文本信息得到扩充训练集;获得句子的文本表征;获得图像的全局视觉表征、局部对象表征及跨模态语义表征;获得优化后的单模态表征;获得多模态融合表征;计算每个细粒度实体类别的预测概率及二元交叉熵损失;进行迭代优化训练,直至达到设定次数,在少样本验证集上进行性能验证,在少样本测试集上开展最终效果评估。本发明提供的方法及系统通过有效地抽取层次化多模态特征提升细粒度分类的性能,可为医疗领域提供更加精确可靠的实体分类技术。

    数据处理方法及装置、电子设备、计算机可读存储介质

    公开(公告)号:CN116150700A

    公开(公告)日:2023-05-23

    申请号:CN202211556844.5

    申请日:2022-12-06

    Abstract: 本公开提供了一种数据处理方法及装置、电子设备、计算机可读存储介质。该方法包括:基于目标对象的时间序列数据获取目标对象的隐藏特征向量;基于目标对象的文本数据获取目标对象的实体特征向量和全局特征向量;其中,实体特征向量用于表征文本数据中实体的特征,全局特征向量用于表征文本数据的特征;将实体特征向量融合隐藏特征向量,获得实体融合特征向量,以及,将隐藏特征向量融合实体特征向量,获得隐藏融合特征向量;基于隐藏融合特征向量、实体融合特征向量和全局特征向量确定目标对象的多模态融合特征;基于目标对象的多模态融合特征预测目标对象出现目标状态的概率。本公开的实施例能够提高预测的准确性。

Patent Agency Ranking