-
公开(公告)号:CN116881713A
公开(公告)日:2023-10-13
申请号:CN202310816049.3
申请日:2023-07-05
Applicant: 东南大学
IPC: G06F18/214 , G06F18/24 , G06F18/21 , G06N3/048 , G06N3/08
Abstract: 本发明公开一种基于主动查询和分组标注的多义数据标注方法,具体包括以下步骤:(1)用户初始时选择小部分多义数据进行精确标注;(2)利用深度神经网络在小部分已标注数据上训练多标记分类网络;(3)利用多标记分类网络对未标注数据的标记向量进行预测;(4)对该被查询示例的标记空间分组,小部分组发送给领域专家进行精确标注;(5)将该样本加入已标注集,更新多标记分类网络参数,在测试集上测试效果;(6)如果用户对当前模型性能满意,则结束,否则转步骤(3)。本发明能够在多义数据标注的质量和成本之间达到一定平衡,在减少标注成本的同时提高标注质量。