一处局部分块卷积的目标跟踪方法、系统及存储介质

    公开(公告)号:CN109711431A

    公开(公告)日:2019-05-03

    申请号:CN201811425819.7

    申请日:2018-11-27

    Abstract: 本发明提供了一种局部分块卷积的跟踪方法、系统及存储介质,该跟踪方法包括步骤S1:给定一个带有目标的初始帧,提取候选样本;步骤S2:将候选样本送入网络进行特征提取;步骤S3:将特征图分别送入基层卷积层和M个并行的分块卷积层,对于每一个局部分块目标使用一层卷积层来计算响应输出;步骤S4:融合各个分块响应输出后与基层卷积层的响应输出叠加作为最终的响应输出;步骤S5:通过在线检测得到当前帧目标中心位置后,根据当前中心点在当前帧提取不同尺度大小的搜索块;步骤S6:对不同尺度大小的候选对象进行尺度归一化。本发明的有益效果是:本发明能更好的适应目标在运动过程中的发生的变化,具有更强的鲁棒性。

    用于训练图像生成模型的方法及装置

    公开(公告)号:CN116091630A

    公开(公告)日:2023-05-09

    申请号:CN202211357095.3

    申请日:2022-11-01

    Abstract: 本公开的实施例提供一种用于训练图像生成模型的方法和装置。图像生成模型包括背景擦除模块、文本转换模块和融合模块。在该方法中,获取训练图像集。训练图像集包括:包含第一文本的风格图像和包含第二文本的内容图像。第一和第二文本分别具有第一和第二文本风格属性。通过背景擦除模块从风格图像中获得背景图像和第一文本掩码图像。第一文本掩码图像被用于计算背景擦除模块的损失函数。通过文本转换模块将内容图像中的第二文本转换为第一文本风格属性以获得转换后的内容图像和第二文本掩码图像。通过融合模块将转换后的内容图像与背景图像融合以得到目标图像。最小化背景擦除模块、文本转换模块和融合模块的损失函数以更新图像生成模型的参数。

    文本识别方法及文本识别装置
    4.
    发明公开

    公开(公告)号:CN115424285A

    公开(公告)日:2022-12-02

    申请号:CN202210915729.6

    申请日:2022-08-01

    Abstract: 本公开的实施例提供一种文本识别方法和文本识别装置。在该文本识别方法中,获取包括文本的图片。文本包括多个字符。通过浅层卷积神经网络来提取图片的特征以生成原始特征图。然后,通过注意力模块分别针对原始特征图的宽度维度和高度维度确定第一和第二注意力区域。将第一和第二注意力区域的重合区域确定为注意力选择区域。接着,根据原始特征图和注意力选择区域来生成候选特征矩阵。之后,将候选特征矩阵与原始特征图相乘以生成特征交互矩阵。对特征交互矩阵进行标准化处理以得到二维注意力权重矩阵。对原始特征图与二维注意力权重矩阵进行点积运算以获得增强特征矩阵。然后,根据增强特征矩阵和文本中的已识别字符来识别文本中的未识别字符。

Patent Agency Ranking