一种基于双分支混合学习网络的无偏差场景图生成方法

    公开(公告)号:CN115565052A

    公开(公告)日:2023-01-03

    申请号:CN202211060522.1

    申请日:2022-08-30

    Abstract: 本发明公开了一种基于双分支混合学习网络的无偏差场景图生成方法,涉及图像处理技术领域,解决最近无偏差场景图生成方法不能同时照顾头部谓词和尾部谓词学习的技术问题,包括以下步骤:将图像输入到目标检测器中,得到图像中实例的视觉特征、语义特征以及空间特征;将图像中实例的特征送入到粗粒度学习分支和细粒度学习分支中,其中粗粒度学习分支用以学习头部谓词的专家知识以及获得头部谓词的鲁棒性特征,细粒度学习分支用以预测具有信息性的尾部谓词;知识蒸馏,采用语义上下文模块,对细粒度学习分支的预测结果中不合理的预测进行修正,同时计算所预测的场景图的语义和所标注的场景图的语义之间的差距,并用均方差损失优化。

Patent Agency Ranking