-
公开(公告)号:CN116166770A
公开(公告)日:2023-05-26
申请号:CN202211233682.1
申请日:2022-10-10
Applicant: 马上消费金融股份有限公司 , 南开大学
IPC: G06F16/33 , G06F16/35 , G06F40/279 , G06F18/214 , G06F18/241 , G06N3/04
Abstract: 本公开提供了一种实体链接模型的训练方法及装置、实体链接方法及装置,该方法包括:对链接训练样本和链接训练样本对应的链接训练样本信息进行特征提取,获得链接训练样本的第一特征向量;链接训练样本是训练实体链接模型采用的样本;链接训练样本信息是与链接训练样本关联的信息;对链接训练样本的第一特征向量进行编码,获得链接训练样本的编码;基于链接训练样本的编码,获得链接训练样本的预测类型;预测类型是预测到的类型信息;基于链接训练样本的预测类型和链接训练样本的第一标准类型信息调整实体链接模型的参数。根据本公开的实施例能够提高实体链接模型的泛化能力,以及减少过拟合的情况。
-
公开(公告)号:CN119917669A
公开(公告)日:2025-05-02
申请号:CN202510414327.1
申请日:2025-04-03
Applicant: 南开大学
IPC: G06F16/353 , G06F18/2431 , G06F18/214 , G06F18/21 , G06F40/211 , G06F40/216 , G06F40/30
Abstract: 本发明涉及电数字数据处理技术领域,尤其涉及一种面向医疗的少样本多模态细粒度实体分类方法及系统,方法包括如下步骤:构建少样本训练集、少样本验证集及少样本测试集,并扩充文本信息得到扩充训练集;获得句子的文本表征;获得图像的全局视觉表征、局部对象表征及跨模态语义表征;获得优化后的单模态表征;获得多模态融合表征;计算每个细粒度实体类别的预测概率及二元交叉熵损失;进行迭代优化训练,直至达到设定次数,在少样本验证集上进行性能验证,在少样本测试集上开展最终效果评估。本发明提供的方法及系统通过有效地抽取层次化多模态特征提升细粒度分类的性能,可为医疗领域提供更加精确可靠的实体分类技术。
-
公开(公告)号:CN116150700A
公开(公告)日:2023-05-23
申请号:CN202211556844.5
申请日:2022-12-06
Applicant: 马上消费金融股份有限公司 , 南开大学
IPC: G06F18/25 , G06N3/08 , G06N3/0464
Abstract: 本公开提供了一种数据处理方法及装置、电子设备、计算机可读存储介质。该方法包括:基于目标对象的时间序列数据获取目标对象的隐藏特征向量;基于目标对象的文本数据获取目标对象的实体特征向量和全局特征向量;其中,实体特征向量用于表征文本数据中实体的特征,全局特征向量用于表征文本数据的特征;将实体特征向量融合隐藏特征向量,获得实体融合特征向量,以及,将隐藏特征向量融合实体特征向量,获得隐藏融合特征向量;基于隐藏融合特征向量、实体融合特征向量和全局特征向量确定目标对象的多模态融合特征;基于目标对象的多模态融合特征预测目标对象出现目标状态的概率。本公开的实施例能够提高预测的准确性。
-
-