基于属性学习的未知场景遥感图像字幕生成方法

    公开(公告)号:CN117152303A

    公开(公告)日:2023-12-01

    申请号:CN202311075484.1

    申请日:2023-08-25

    Abstract: 本发明公开了一种基于属性学习的未知场景遥感图像字幕生成方法,主要解决现有方法只能产生在训练过程中出现过的词语和句子,不能对未知的场景进行准确描述的问题。其实现方案是:搭建一个属性提取器、设置一个可学习的属性标识向量A,并在多标签分类数据集上进行预训练;搭建由属性推理模块和主体词生成模块构成的基于属性学习的解码器;将主题编码器、属性提取器、基于属性学习的解码器级联,构成基于属性学习的未知场景遥感图像字幕生成网络,并对其进行迭代训练;将测试集遥感图像输入到训练好的字幕生成网络生成字幕描述。本发明提高了未知场景下遥感图像的描述准确率,能适应遥感图像的多种场景,可用于地物图像检索、灾情预测及图像理解。

    基于分割图引导与正则约束的手部姿势与形状估计方法

    公开(公告)号:CN116152199A

    公开(公告)日:2023-05-23

    申请号:CN202310153013.1

    申请日:2023-02-23

    Abstract: 本发明公开了一种基于分割图引导与正则约束的手部姿态与形状估计方法,主要解决现有技术在手物遮挡情况下估计结果准确率较低的问题。其实现方案是:将数据集划分为训练数据集与测试数据集;构建由特征提取主干、正则约束金字塔模块、分割引导模块以及回归模块构成的基于分割图引导与正则约束的手部姿势与形状估计网络;使用训练数据集对该网络进行训练;将测试数据集输入到训练好的网络中得到手部估计结果。本发明通过引入分割引导模块以利用不同可见度的手部分割图辅助手物遮挡下的估计,并通过引入正则约束金字塔模块对网络特征进行约束,相较于现有手部姿势与形状估计方法,显著提高了手部估计效果,可用于手部图像解译的中间处理。

Patent Agency Ranking