一种多模态信息综合检索的街景图像定位方法及系统

    公开(公告)号:CN116737983A

    公开(公告)日:2023-09-12

    申请号:CN202310528506.9

    申请日:2023-05-11

    Abstract: 本发明公开了一种多模态信息综合检索的街景图像定位方法及系统,通过建立多模态信息数据库,使用视觉特征提取模型和场景文字识别模型建立多模态信息数据库;通过融合特征检索,把全局特征与局部特征相融合进行初步召回检索;通过几何验证重排,使用基于局部特征的几何验证算法对初步召回检索结果重排,得到精细化检索结果;通过场景文字检索,计算查询图片与数据库图片的场景文字集合重叠度,并以此分数为依据排序得到最终检索结果。本发明考虑了多模态信息的综合检索方案,可以大大提高实际应用中的图像定位准确率,并且一定程度解决了单模态信息在某些场景完全定位失败的问题。

    一种基于特征解耦合的人脸隐私保护方法和装置

    公开(公告)号:CN112668401B

    公开(公告)日:2023-01-17

    申请号:CN202011447934.1

    申请日:2020-12-09

    Abstract: 本发明公开一种基于特征解耦合的人脸隐私保护方法和装置。该方法包括:1)数据预处理,预先训练身份特征提取器EI和外貌特征提取器EA。2)训练人脸伪装生成模型执行相同人脸生成任务。3)训练人脸伪装生成模型执行不同人脸生成任务。4)完成模型训练后,采用已训练的EI、EA和G网络对输入人脸图像进行伪装人脸图像生成。其中步骤1)使用分类损失对EI和EA进行预训练。步骤2)使用人脸重建损失进行模型训练。步骤3)分别设计了外貌特征和身份特征的L2范数损失函数,以约束模型特征提取的准确性以及生成结果的可控性。本发明能够实现保持人脸身份匹配的同时显著改变人脸的外观特征,并通过实验数据证明了隐私保护的有效性。

    渐近回归边界的任意形状场景文字检测方法及装置

    公开(公告)号:CN113139539B

    公开(公告)日:2023-01-13

    申请号:CN202110280975.4

    申请日:2021-03-16

    Abstract: 本发明公开了一种渐近回归边界的任意形状场景文字检测方法及装置,包括:提取待检测图像的视觉特征,对视觉特征进行特征融合,获取特征表达;将特征表达输入水平建议框生成网络,生成水平文字候选框;将特征表达及水平文字候选框输入方向建议框生成网络,生成方向文字建议框;将特征表达及方向文字建议框输入任意形状文字边界生成网络,获取场景文字检测结果。本发明通过渐近回归能产生更精确及平滑的文字边界,利用边界采样点之间的几何拓扑关系以及语义关系获得更准确点的位置,模型具有更好的泛化性、更有效的执行速度和更强的检测能力。

    一种基于焦点损失函数的自然场景下文字检测定位方法和装置

    公开(公告)号:CN109117836B

    公开(公告)日:2022-05-24

    申请号:CN201810729838.2

    申请日:2018-07-05

    Abstract: 本发明公开一种基于焦点损失函数的自然场景下文字检测定位方法和装置。该方法首先对标注的数据进行预处理,然后构造文本检测定位网络,然后引用聚焦损失函数作为训练过程损失函数的一部分,然后对待检测的自然场景图片进行检测。该方法通过调整现有标注使标注更加适合所设计的文字检测网络;基于FCN网络将多卷积层进行合并,使之更加符合文字检测任务;通过引入聚焦损失函数在训练过程中平衡正负样本,提高检测精度。本发明能够在文字检测定位上取得高精度高召回的效果。

    一种基于深度学习的低俗图片识别方法

    公开(公告)号:CN109214275B

    公开(公告)日:2022-04-15

    申请号:CN201810794432.2

    申请日:2018-07-19

    Abstract: 本发明公开一种基于深度学习的低俗图片识别方法,该方法对上下半身检测网络进行训练,对上下半身低俗分类网络进行训练,训练采用困难样本挖掘,使得网络训练过程中对困难样本侧重训练,提高检测精度;对图片进行低俗级联检测,检测过程中上下半身检测得分阈值采用动态调整,检测获得的上下半身区域缩放后输入至上下半身低俗分类网络,进行低俗识别。本发明在图片低俗识别中具有极佳的精度,在正负样本比例悬殊的情况下,仍能保持极低的误报率,具备良好实用性。

    基于统计深度特征的染色伪造图像检测方法及电子装置

    公开(公告)号:CN111754459A

    公开(公告)日:2020-10-09

    申请号:CN202010428810.2

    申请日:2020-05-20

    Abstract: 本发明提供一种基于统计深度特征的染色伪造图像检测方法及电子装置,该方法包括:将图像从RGB颜色空间变换到可将亮度信息与色度信息解耦合的颜色空间,分别获取每个颜色通道的直方图统计分布信息,将所获得的直方图统计分布信息串联得到颜色统计分布向量;提取颜色统计分布向量的统计深度特征,并对统计深度特征进行特征抽象任务,得到池化特征;对池化特征进行分类,根据正负样本的概率值,判定染色伪造图像。本发明利用端到端的深度学习技术对染色伪造图像和自然图像的统计分布差异进行深度特征提取并完成分类任务,染色伪造图像检测模型的性能得到大大提升。

    一种基于上下文信息的Android组件间隐私泄露行为识别方法及系统

    公开(公告)号:CN107103240B

    公开(公告)日:2020-02-11

    申请号:CN201710261243.4

    申请日:2017-04-20

    Abstract: 本发明公开了一种基于上下文信息的Android组件间隐私泄露行为识别方法及系统。本方法为:1)从Android应用程序中提取组件间通信参数信息;2)根据提取的组件间通信参数信息匹配该Android应用程序中相互通信的两个组件,形成组件调用链;3)根据所述组件调用链信息对Android应用程序执行静态插桩,连接相互通信的两个组件;4)对插桩后的应用程序代码执行静态污点分析,获取组件间隐私信息传输相关的行为路径,并提取所述行为路径上的上下文信息;5)根据得到的行为路径上的上下文信息,判断组件间隐私信息传输行为是否为隐私泄露行为。本发明大大提高了组件间通信分析的准确性。

    一种基于深度学习的自然场景下文字检测定位方法

    公开(公告)号:CN107346420A

    公开(公告)日:2017-11-14

    申请号:CN201710463101.6

    申请日:2017-06-19

    Abstract: 本发明提供一种基于深度学习的自然场景下文字检测定位方法。基于Faster R-CNN的RPN(多层卷积神经网络),根据文字的特征信息,改变RPN中的anchor大小以及回归方式,并加入RNN网络层对图片上下文信息进行分析,构造一个能够有效地检测出文字的文字检测网络。另外,本发明采用聚类方法,设定anchor的大小。特别地,本发明使用困难样本挖掘进行级联训练,能够减少对于文字的误检率。在测试方面,本发明采用级联测试的方法,最终,准确高效的实现文字的定位。

Patent Agency Ranking