-
公开(公告)号:CN114998972A
公开(公告)日:2022-09-02
申请号:CN202210759642.4
申请日:2022-06-29
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明给出了一种轻量级的人脸过滤方法和系统,包括制作人脸数据集,人脸数据集包括真实拍摄的人脸图像和网络图片,经过数据清洗分类后以随机分配的方式混入人脸数据集中;构建轻量级人脸过滤的神经网络模型,在主干网络中,通过基于批归一化的缩放因子调节的注意力机制模块,使用批归一化的缩放因子衡量权重,代替全连接层;在网络颈部,在每个特征融合阶段通过上采样或下采样的方式融合所有的图像特征,并且在每一个特征向量前加一个权重参数以充分过滤空间上的冲突信息;损失函数采用类平衡的损失函数CBLoss和FocalLoss相结合。本发明网络设计和训练方式贴近于实际应用,在网络轻量化的同时能够提高人脸多分类的准确度,具有很好的落地效果。
-
公开(公告)号:CN112348015A
公开(公告)日:2021-02-09
申请号:CN202011238231.8
申请日:2020-11-09
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开了一种基于级联神经网络的文字检测方法、装置及存储介质,该方法通过收集样本,并对样本进行处理生成数据集;搭建第一全卷积网络,通过数据集对第一全卷积网络进行训练至网络收敛,并通过训练后的第一全卷积网络对数据集进行推理,获得回归结果;搭建第二全卷积网络,通过回归结果对第二全卷积网络进行训练至网络收敛;将待验证图片输入第一全卷积网络,若第一全卷积网络判断在滑窗范围内存在文字,则裁剪下滑窗范围内的区域做双线性插值尺度变换并输入第二全卷积网络,通过第二全卷积网络判断区域是否为文字区域。该方法具有更好的泛化性能,并能够在保证检测准确率与召回率的同时,降低模型大小,从而提升文字检测算法性能。
-
公开(公告)号:CN117095329A
公开(公告)日:2023-11-21
申请号:CN202310959022.X
申请日:2023-08-01
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V20/40 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 公开了一种减缓行人属性识别类内变化的方法和系统,包括接收数据集中任一张图像xi输入主干网络进行多标签分类任务的行人属性识别,采用二值交叉熵作为损失函数;利用指数信息瓶颈作用于主干网络的每个卷积模块和注意力机制模块,过滤特征中存在的冗余干扰特征信息。本申请提出的指数信息瓶颈方法可以集成到注意力模块中,形成一个新颖的行人熟悉识别网络,可以进一步处理基于注意力机制的属性内变化,指数信息瓶颈方法是即插即用的,在推理期间没有任何额外的计算开销。
-
公开(公告)号:CN115578714A
公开(公告)日:2023-01-06
申请号:CN202211183158.8
申请日:2022-09-27
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 公开了一种基于浅层特征信息增强的车辆颜色识别方法和系统,包括在车辆颜色识别的卷积神经网络中嵌入浅层特征信息增强模块,卷积神经网络包括浅层卷积块、中层卷积块和高层卷积块,浅层特征信息增强模块嵌入浅层卷积块和中层卷积块之后;车辆图片作为浅层卷积块的输入依次进行特征提取,浅层特征信息增强模块接收特征输入,经过多个1*1卷积层获得不同维度的特征,对不同维度的特征进行矩阵相乘获得增强信息表达的特征,送入下一卷积块;将各卷积块的特征依次送入全局平均池化层、对应的分类层进行分类,并利用标签平滑正则化的交叉熵损失函数进行约束。浅层特征信息增强模块可灵活的插入卷积神经网络任意位置,增强特征信息,增加模型的泛化性。
-
公开(公告)号:CN115546907A
公开(公告)日:2022-12-30
申请号:CN202211153579.6
申请日:2022-09-21
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 公开了多尺度特征聚合的活体检测方法和系统,包括将RGB图像通过图像变换转换为HSV图像,将RGB图像和HSV图像融合为RGB‑HSV图像并送入主干网络;将主干网络提取的特征送入特征深度拓展模块,并将输出送入多特征提取模块以获得更多的上下文信息;将最终输出经过池化层和分类层,并在交叉熵损失函数的约束下进行训练。本发明提出的一种多尺度特征聚合的活体检测方法和系统,其具有参数量小、对图像的接受域大、多尺度特征聚合的特点,利用了空洞卷积以扩大网络的感受野,获取更多的上下文信息,利用RGB图像和HSV图像作为6通道的图像作为输入,运行速度与仅使用RGB图像的运行速度是一致的,在性能和效率之间取得了很好的平衡。
-
公开(公告)号:CN113591936B
公开(公告)日:2022-09-09
申请号:CN202110779118.9
申请日:2021-07-09
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及一种车辆姿态估计方法、终端设备及存储介质,该方法中包括:S1:采集包含车辆的图像,并对图像中车辆对应的姿态和车辆目标的边界框进行标注,将标注后的图像组成训练集;S2:构建基于YOLOv2网络的车辆姿态估计模型,通过训练集对车辆姿态估计模型进行训练;S3:通过训练后的车辆姿态估计模型对车辆姿态和车辆目标进行估计。本发明可以和智能交通系统的检测任务融合为一个主干网络,具有较好的泛化性,不需要额外设计负责车辆姿态估计的网络结构,只需要修改检测器的输入和输出就能实现这种车辆姿态估计,在现实场景中具有较强的应用,且减少了硬件设施的消耗。
-
公开(公告)号:CN113920296B
公开(公告)日:2022-07-15
申请号:CN202111395021.4
申请日:2021-11-23
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明给出了一种基于对比学习的文本识别方法与系统,包括无标签的文本图像样本,对其中每个样本进行数据增强输入卷积网络进行识别训练生成识别模型,再基于所述识别模型构建基本编码器来计算并输出特征序列;将所述特征序列输入实例映射函数生成对应的实例再映射为多个子实例,将所有的子实例作为对比损失函数中的子元素进行对比学习,将结果反馈到所述卷积网络用于更新所述卷积网络;获取包含文本信息的有标签的文本图像样本输入所述基本编码器,对所述卷积网络的参数进行调节直到所述识别模型收敛。本方法将对比学习应用于序列的各个元素,充分利用无标注数据学习有效的表征信息,再基于自监督对比学习的方法进行建模,显著提高了识别效果。
-
公开(公告)号:CN114445436A
公开(公告)日:2022-05-06
申请号:CN202111628161.1
申请日:2021-12-28
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开了一种目标检测的方法、装置以及存储介质。所述方法包括:获取待检测图像;对待检测图像进行边缘检测处理,得到第一图像;通过预设的特征提取网络对待检测图像进行处理,得到待检测图像的第二图像,使用第一图像对第二图像进行处理,增强第二图像的边缘特征;预设的特征提取网络包含特征降噪模块,使用特征降噪模块对增强边缘特征的第二图像进行降噪处理;使用预设的特征提取网络对降噪处理后的第二图像进行处理,得到图像特征,将图像特征输入预设的目标检测网络,得到目标类别和目标框。本发明提供的一种目标检测的方法和装置,能够提升基于深度学习神经网络的特征提取网络的特征提取能力,以及目标检测网络的目标检测能力。
-
公开(公告)号:CN108805789A
公开(公告)日:2018-11-13
申请号:CN201810532620.8
申请日:2018-05-29
Applicant: 厦门市美亚柏科信息股份有限公司
CPC classification number: G06T1/0021 , G06N3/0454 , G06N3/08
Abstract: 本发明提供了一种基于对抗神经网络去除水印的方法、装置、设备及可读介质,该方法包括:训练步骤,基于样本图像对对抗神经网络进行训练,获得对抗神经网络模型;去除步骤,将带有水印的图像输入对抗神经网络模型中去除水印,得到无水印的图像。本发明设计了具有残差块的对抗神经网络,对抗神经网络包括生成器网络和鉴别器网络,通过该对抗性神经网络中的生成器网络能够快速、高效、批量地去除图像中特定的水印,并通过鉴别器网络判断除去水印的效果是否达到要求,如果达到要求,则将图像输出。
-
公开(公告)号:CN116029366A
公开(公告)日:2023-04-28
申请号:CN202211692290.1
申请日:2022-12-28
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06N3/096 , G06V30/19 , G06N3/0455
Abstract: 本发明提出了一种基于重编码的文本识别模型压缩方法及系统,该方法包括以下步骤:S1、获取并整理原始样本,使用原始样本对第一文本识别模型进行训练;S2、对训练好的第一文本识别模型进行知识蒸馏,获得压缩后的第二文本识别模型;S3、保留第二文本识别模型的主干网络,重新搭建第二文本识别模型的分类层,获得第三文本识别模型;以及S4、对原始样本进行重新标注处理,获得待测样本,使用待测样本对第三文本识别模型进行训练,并且对训练好的第三文本识别模型进行网络性能验证。该方法能够对大字库模型进行充分压缩,避免对模型识别精度带来明显影响,提升模型推理速度,减小模型规模,使模型充分满足实际业务场景需求。
-
-
-
-
-
-
-
-
-