基于在线增强检测的视频文字目标追踪方法与电子设备

    公开(公告)号:CN111931571B

    公开(公告)日:2022-05-17

    申请号:CN202010643270.X

    申请日:2020-07-07

    Abstract: 本发明公开了一种基于在线增强检测的视频文字目标追踪方法:逐帧输入视频图片;使用文字目标检测与特征提取网络进行文字目标的定位与特征提取,获取文字目标位置和包含语义信息和空间背景信息的特征向量,使特征向量对于不同身份的文字目标有很强的区分度;利用文字位置距离、文字形态距离、文字特征距离进行帧与帧之间文字目标的匹配,通过匈牙利算法获取文字目标匹配结果,匹配成功的文字目标赋予相同的身份;建立在线增强检测机制,使用基于孪生网络的跟踪器对先前帧中未匹配成功的文字目标预测其在当前帧的位置,同时基于此预测结果增强当前视频帧文字目标检测结果;根据视频图片帧中检测到的文字目标身份,确定所有文字目标的运动轨迹。

    基于水印分解模型的可见水印去除方法和电子设备

    公开(公告)号:CN111932431A

    公开(公告)日:2020-11-13

    申请号:CN202010643268.2

    申请日:2020-07-07

    Abstract: 本发明公开了一种基于水印分解模型的可见水印去除方法,通过结合深度网络和水印分解模型,构造一个新型的网络。首先输入一张水印图片,利用分解网络得到该图片的水印、水印透明度以及用来判断水印区域的二值掩码;然后根据水印分解公式计算间接得到初步无水印图,再将该无水印图放入优化网络,由水印图周边信息直接优化该无水印图;最后利用非水印区域不变的特征和检测得到的二值掩码得到无水印图。本发明结合了水印分解模型和深度学习网络去除水印,进行端到端的训练,在准确度上取得了卓越的效果;此外还能够在去除水印的同时分离水印,从而能够将分离的水印用于数据扩增上,让网络进行终生学习。本发明还提供了相应的电子设备。

    基于在线增强检测的视频文字目标追踪方法与电子设备

    公开(公告)号:CN111931571A

    公开(公告)日:2020-11-13

    申请号:CN202010643270.X

    申请日:2020-07-07

    Abstract: 本发明公开了一种基于在线增强检测的视频文字目标追踪方法:逐帧输入视频图片;使用文字目标检测与特征提取网络进行文字目标的定位与特征提取,获取文字目标位置和包含语义信息和空间背景信息的特征向量,使特征向量对于不同身份的文字目标有很强的区分度;利用文字位置距离、文字形态距离、文字特征距离进行帧与帧之间文字目标的匹配,通过匈牙利算法获取文字目标匹配结果,匹配成功的文字目标赋予相同的身份;建立在线增强检测机制,使用基于孪生网络的跟踪器对先前帧中未匹配成功的文字目标预测其在当前帧的位置,同时基于此预测结果增强当前视频帧文字目标检测结果;根据视频图片帧中检测到的文字目标身份,确定所有文字目标的运动轨迹。

    一种基于边界点检测的场景文本端到端识别方法

    公开(公告)号:CN110837835B

    公开(公告)日:2022-11-08

    申请号:CN201911038568.1

    申请日:2019-10-29

    Abstract: 本发明公开了一种基于边界点检测的场景文本端到端识别方法,通过特征金字塔网络提取文本特征,用于区域提取网络生成候选文本框;然后通过多方向矩形检测网络检测文本实例的更为精准的多方向包围盒;其次在多方向包围盒内检测文本的上下两条边界点序列;最后利用检测到的边界点序列将任意形状的文本转化为水平文本供后续的基于注意力机制的序列识别网络进行识别,最后利用集束搜索算法找到给定词典中预测序列的最匹配单词得到最终的文本识别结果。该方法可以在不需要字符级别的标注情况下同时检测和识别自然图像中任意形状的场景文本,包括水平文本、多方向文本和曲形文本,并且可以完全地进行端到端训练。

    一种基于边界点检测的场景文本端到端识别方法

    公开(公告)号:CN110837835A

    公开(公告)日:2020-02-25

    申请号:CN201911038568.1

    申请日:2019-10-29

    Abstract: 本发明公开了一种基于边界点检测的场景文本端到端识别方法,通过特征金字塔网络提取文本特征,用于区域提取网络生成候选文本框;然后通过多方向矩形检测网络检测文本实例的更为精准的多方向包围盒;其次在多方向包围盒内检测文本的上下两条边界点序列;最后利用检测到的边界点序列将任意形状的文本转化为水平文本供后续的基于注意力机制的序列识别网络进行识别,最后利用集束搜索算法找到给定词典中预测序列的最匹配单词得到最终的文本识别结果。该方法可以在不需要字符级别的标注情况下同时检测和识别自然图像中任意形状的场景文本,包括水平文本、多方向文本和曲形文本,并且可以完全地进行端到端训练。

    基于水印分解模型的可见水印去除方法和电子设备

    公开(公告)号:CN111932431B

    公开(公告)日:2023-07-18

    申请号:CN202010643268.2

    申请日:2020-07-07

    Abstract: 本发明公开了一种基于水印分解模型的可见水印去除方法,通过结合深度网络和水印分解模型,构造一个新型的网络。首先输入一张水印图片,利用分解网络得到该图片的水印、水印透明度以及用来判断水印区域的二值掩码;然后根据水印分解公式计算间接得到初步无水印图,再将该无水印图放入优化网络,由水印图周边信息直接优化该无水印图;最后利用非水印区域不变的特征和检测得到的二值掩码得到无水印图。本发明结合了水印分解模型和深度学习网络去除水印,进行端到端的训练,在准确度上取得了卓越的效果;此外还能够在去除水印的同时分离水印,从而能够将分离的水印用于数据扩增上,让网络进行终生学习。本发明还提供了相应的电子设备。

Patent Agency Ranking