视频信息的处理方法、装置、电子设备和介质

    公开(公告)号:CN114494935B

    公开(公告)日:2024-01-05

    申请号:CN202111539627.0

    申请日:2021-12-15

    Abstract: 本公开提供了一种视频信息的处理方法、一种用于鉴别伪造图像的神经网络模型的训练方法、装置、电子设备和介质,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉技术领域,可应用于人脸识别、人脸检测等场景。实现方案为:对包括第一视频帧序列的待检测视频进行采样,以获取包括多个视频帧的第二视频帧序列;确定第二视频帧序列中的伪造视频帧;以及响应于确定第二视频帧序列中的第一视频帧为伪造视频帧,基于第一视频帧以及在第二视频帧序列中与第一视频帧相邻的第二视频帧,在第一视频帧序列中确定待检测视频中的伪造片段。

    一种票据图像识别方法、装置、设备及存储介质

    公开(公告)号:CN111709339B

    公开(公告)日:2023-09-19

    申请号:CN202010517447.1

    申请日:2020-06-09

    Abstract: 本申请公开了一种票据图像识别方法、装置、设备及存储介质,涉及人工智能深度学习和图像处理领域。具体实现方案为:对票据图像进行文本检测,确定所述票据图像中的至少两个文本框的属性信息集和关系信息集;根据所述文本框的属性信息集和关系信息集,确定所述文本框的类型,以及与所述文本框存在结构关系的关联文本框;根据所述文本框的类型,以及与所述文本框存在结构关系的关联文本框,提取所述票据图像的结构化票据数据。本申请实施例的方案能够支持自动识别多种不同版本的票据图像,且识别过程无需借助模板,提高了票据图像识别的通用性和准确性。

    目标识别模型训练方法、装置、设备以及存储介质

    公开(公告)号:CN111523597B

    公开(公告)日:2023-08-25

    申请号:CN202010327806.7

    申请日:2020-04-23

    Abstract: 本申请实施例公开了目标识别模型训练方法、装置、设备以及存储介质,涉及人工智能技术领域。该方法的一具体实施方式包括:构建扰动前的深度卷积神经网络;获取样本图像集,其中,样本图像集中包括已标注目标样本图像和未标注目标样本图像;利用样本图像集对扰动前的深度卷积神经网络和扰动后的深度卷积神经网络进行半监督训练,得到目标识别模型。该实施方式提供了一种半监督目标识别技术,能够充分利用闭集样本和开集样本进行半监督学习,有效地降低了目标识别中的样本标注成本。

    图像处理方法、装置、电子设备及可读存储介质

    公开(公告)号:CN111860163B

    公开(公告)日:2023-08-22

    申请号:CN202010555785.4

    申请日:2020-06-17

    Abstract: 本申请公开了图像处理方法、装置、电子设备及可读存储介质,涉及计算机视觉技术领域。本申请实施例通过人脸识别模块和业务处理模块分别维护一个图像缓冲队列,即人脸识别模块维护人脸图像的人脸图像缓冲队列,以及业务处理模块维护背景图像即第一图像的背景图像缓冲队列,由于人脸识别模块只维护人脸图像缓冲队列,只需将所确定的最优人脸图像即待匹配的人脸图像传输给业务处理模块,进而由业务处理模块从其所维护的背景图像缓冲队列中,匹配到与人脸识别模块传输的最优人脸图像所匹配的背景图像,能够实现对视频源中所出现的人脸进行图像识别处理与图像匹配处理。

    目标检测模型的训练方法、装置、电子设备和存储介质

    公开(公告)号:CN116611491A

    公开(公告)日:2023-08-18

    申请号:CN202310444257.5

    申请日:2023-04-23

    Abstract: 本申请公开了目标检测模型的训练方法、装置、电子设备和存储介质,涉及人工智能技术领域,具体为计算机视觉、深度学习等技术领域,可应用于智慧城市等场景。方案为:对获取样本图像进行编码,获取样本图像对应的编码特征;对编码特征与M组查询特征中的每组查询特征进行解码,获取每组查询特征对应的一组预测结果,其中,M组查询特征是对目标检测模型的多个第一查询特征进行分组得到的;根据每组预测结果中各预测结果与样本图像对应的第一标注之间的匹配结果,对目标检测模型进行训练。由此,分组对预测结果与标注进行匹配,从整体上来讲,样本图像中每个目标可以匹配上多个正样本,使得每个样本图像的监督信号增强,加速了模型的收敛速度。

    图像去模糊方法和装置
    8.
    发明授权

    公开(公告)号:CN111626956B

    公开(公告)日:2023-08-08

    申请号:CN202010455735.9

    申请日:2020-05-26

    Abstract: 本申请公开了一种图像去模糊方法和装置,涉及计算机视觉技术领域。具体实现方案为:对第一模糊目标图像进行图像处理,得到第二模糊目标图像;其中,第一模糊目标图像基于真实采集的模糊目标图像得到;将第一模糊目标图像输入生成式对抗网络的图像生成器,得到图像生成器输出的第一清晰目标图像;将第二模糊目标图像输入图像生成器,得到图像生成器输出的第二清晰目标图像;其中,图像生成器对第一清晰目标图像和第二清晰目标图像采用距离损失函数进行约束;基于第一清晰目标图像和第二清晰目标图像,确定增强的清晰目标图像。该方案可以避免生成式对抗网络学习到输入的模糊目标图像以外的内容,确保清晰图像的内容不发生改变,提高了输出的清晰图像与模糊目标图像的一致性和准确度。

    扭曲文档图像的矫正方法和装置

    公开(公告)号:CN111260586B

    公开(公告)日:2023-07-04

    申请号:CN202010066508.7

    申请日:2020-01-20

    Abstract: 本发明实施例提供一种扭曲文档图像的矫正方法和装置,其中,扭曲文档图像的矫正方法包括:获取扭曲文档图像;将扭曲文档图像输入到矫正模型中,得到扭曲文档图像对应的矫正后的图像;其中,矫正模型是以图像样本集合为输入,以图像样本集合中每个图像样本对应的矫正后的图像为输出训练得到的模型,图像样本存在扭曲。通过将待矫正的扭曲文档图像输入到矫正模型中,通过矫正模型可以获取扭曲文档图像对应的矫正后的图像,端到端的实现了文档图像矫正,提高了文档图像矫正的准确率,扩展了文档图像矫正的应用场景。

    深度学习模型的训练方法、目标检测方法及装置

    公开(公告)号:CN116071625B

    公开(公告)日:2023-06-02

    申请号:CN202310206397.9

    申请日:2023-03-07

    Abstract: 本申请提供了一种深度学习模型的训练方法、目标检测方法及装置,涉及计算机视觉、深度学习。该训练方法具体实现方案为:利用第一深度学习模型对样本图像进行处理,得到第一图像特征;并根据初始位置分布特征图和第一图像特征,得到第一特征图。利用第二深度学习模型对样本图像进行处理,得到第二图像特征;并根据初始位置分布特征图和第二图像特征,得到第二特征图。利用第一深度学习模型对样本图像进行目标检测,得到第一检测结果。基于目标损失函数,根据第一检测结果、第一特征图和第二特征图,调整第一深度学习模型的模型参数和初始位置分布特征图,得到与样本图像对应的目标位置分布特征图和经训练的第一深度学习模型。

Patent Agency Ranking