基于局部卷积与语义信息的活体检测装置与方法

    公开(公告)号:CN118470808A

    公开(公告)日:2024-08-09

    申请号:CN202410923964.7

    申请日:2024-07-11

    Abstract: 本发明公开了一种基于局部卷积与语义信息的活体检测装置与方法,利用深度神经网络结构的活体检测模型并进行模型推理,活体检测模型包括CNN分支、transformer分支、语义信息对齐模块及模型损失计算模块,带多尺度池化的多头自注意力模块作为transformer模块的一部分,通过压缩特征序列长度和增强特征表示能力,进一步提升了模型的性能。本发明利用局部卷积以显著降低模型参数量及内存访问次数,在保障模型原有判别性以及抗干扰能力的情况下,使活体检测模型能够在资源受限的设备或场景中运行,实现对图像中的真假人脸进行准确区分,具有较高的真人通过率和抵抗各类攻击的能力。

    提升毫米波安检仪违禁品检测能力的方法

    公开(公告)号:CN118470436A

    公开(公告)日:2024-08-09

    申请号:CN202410909764.6

    申请日:2024-07-09

    Abstract: 本发明公开了一种提升毫米波安检仪违禁品检测能力的方法,其从毫米波的本质出发,通过调节毫米波信号增益强度,生成多种不同DB的毫米波图片用于深度学习算法的训练,提升算法的准确率和鲁棒性。针对毫米波图像中不存在人体的空白区域,采用基于关键点外推的方法进行去除,使算法聚焦于有效区域,降低算法推理消耗。为了让检测算法能达到更高的准确率,本发明将去除空白区域的正、背面图像水平拼接起来,输入检测算法,让算法在推理时可以得到更多的有效信息。为了让检测算法充分注意到图像中正、背面图像的相关性,本发明对DETR算法进行了的修改,引导算法中的注意力机制,更好的发挥作用。

    基于可见光图像生成紫外光图像的方法、系统及应用

    公开(公告)号:CN117726701A

    公开(公告)日:2024-03-19

    申请号:CN202311586389.8

    申请日:2023-11-27

    Abstract: 本发明公开了基于可见光图像生成紫外光图像的方法、系统及应用,主要利用深度学习生成器网络,先通过精心设计的专用可见光和紫外光数据采集双目模组进行采集对齐的帧同步的图像数据,然后对可见光图像数据进行人脸区域检测,利用分割网络生成人脸区域掩码并用于模型训练损失函数计算,设计好相应的深度学习生成器网络,对模型进行训练,在模型效果收敛后,给生成器模型提供常规手机,相机拍摄的高清人脸图像作为输入,可推理预测出相应的紫外人脸图像。该紫外人脸图像可应用到生物识别、健康诊断、艺术创作和数字娱乐等领域。

    家庭成员关系绑定一起识别过闸的系统及方法

    公开(公告)号:CN117711100A

    公开(公告)日:2024-03-15

    申请号:CN202311672416.3

    申请日:2023-12-07

    Abstract: 本发明公开了一种家庭成员关系绑定一起识别过闸的系统及方法,预先对家庭成员的身份进行绑定,通过多摄像头采集人脸,当识别到多个人脸识别进行判断是否为家庭成员,若多个人脸为家庭成员一次开闸门识别的家庭成员可一起通行,提高闸机的通行效率,并且解决了无法独立过闸的家庭成员的过闸问题。本发明的多个摄像头安装在闸机的不同高度及不同角度,可进行多角度抓拍,且覆盖不同身高的旅客过闸。

    基于CLIP快速构建图像分类模型的方法

    公开(公告)号:CN117409262B

    公开(公告)日:2024-03-01

    申请号:CN202311719576.9

    申请日:2023-12-14

    Abstract: 本发明公开一种基于CLIP快速构建图像分类模型的方法,包括S1、搜集图像;S2、使用CLIP模型筛选特定标签图像;S3、制作分类数据集,将数据集划分为训练集和测试集;S4、使用DivideMix方法训练分类模型。本发明采用CLIP图文匹配技术,通过输入标签文本即可从海量数据中提取出符合标签要求的数据图像,构建出可以用学习分类模型的数据集,而无需人工标注。同时针对筛选出的图像中可能存在的噪声(即类别错误)的问题,本发明引入带噪声数据的学习方法DivideMix,以降低数据集中噪声带来的影响。用此方法训练图像分类模型,可以提升模型的训练效率,降低数据标注需求,成本低,同时还可以达到不错的模型效果。

    单目镜头的身高估计方法及小孩过闸装置与判断方法

    公开(公告)号:CN117218681A

    公开(公告)日:2023-12-12

    申请号:CN202311486914.9

    申请日:2023-11-09

    Abstract: 本发明公开了一种单目镜头的身高估计方法及小孩过闸装置与判断方法,通过对单目RGB镜头的安装做一些特定的限制和要求,利用几何关系即可直接算出目标行人的身高,且精度非常高,丝毫不差于带深度镜头的模组。本发明在闸机的出入口处设计了一个单目RGB镜头,利用该单目RGB镜头运行目标检测和多目标跟踪算法,其所需要的计算资源相较于双目镜头更少,对硬件的要求也更低,在原有闸机的基础上,以更小的成本、更简单的方案,更准确和更实用的效果,实现过闸小孩的智能识别,确保小孩安全、便利地通过,并提高整个闸机通行的效率和用户体验。

    一种低质量图跨镜头行人再识别方法和系统

    公开(公告)号:CN116704545A

    公开(公告)日:2023-09-05

    申请号:CN202210180944.6

    申请日:2022-02-25

    Abstract: 本发明提供一种低质量图跨镜头行人再识别方法,首先收集行人截图,组成脏数据集合,通过模型半监督数据标注方法,得到干净数据集;将得到的干净数据集中的图像进行第一数据增强和第二数据增强,得到增强后的数据集;将增强后的数据集输入REID卷积神经网络模型中,提取每张图的特征,进行REID loss训练和对抗loss训练,迭代直至完成模型训练,得到训练好的REID卷积神经网络模型;实时获取行人截图,输入训练好的REID卷积神经网络模型,进行行人识别;本发明提供的方法能大大减少人工标注成本,采用图像切块移动数据扩充和对抗训练,能够挖掘细粒度特征,且模型的鲁棒性强,能抵抗标注噪声干扰,对遮挡数据同样有较好的表现。

    一种基于目标感知的视频信息编解码方法和电子设备

    公开(公告)号:CN116170581A

    公开(公告)日:2023-05-26

    申请号:CN202310132397.9

    申请日:2023-02-17

    Abstract: 本申请涉及一种基于目标感知的视频信息编码方法和电子设备,该方法通过在编码前实现针对不同目标的感知能力,并可根据实际场景需求灵活选择不同的目标感知器以及编码模式,实现对特定目标进行感知并按需进行不同模式视频信息的编码操作,通过不同模式选择可实现对内存空间、网络带宽、存储介质空间和能源等方面大幅节省,也可确保视频流信息在其整个生命周期中除了摄像头采集阶段(包括编码、传输、存储、兼容式解码和呈现阶段)全程做到信息脱敏,做到视频信息全链路安全。在兼容标准解码模式数据呈现基础上,还可利用专用解码器进行完全解码,实现恢复摄像头采集的原始视频信息。

    一种边端多路视频流脱敏及逆转方法、系统和专用播放器

    公开(公告)号:CN115795507A

    公开(公告)日:2023-03-14

    申请号:CN202211530484.1

    申请日:2022-12-01

    Abstract: 本发明公开了一种边端多路视频流脱敏及逆转方法、系统和专用播放器,对边端获取的多路视频流原始数据进行整合及编码,对整合数据进行人脸检测,解析人脸位置及原始数据位置,复制人脸区域数据进行压缩和加密,将人脸位置、视频流ID、视频流起始帧时间、帧号等信息进行编码,对整合数据中人脸区域进行脱敏处理,存储脱敏后的整合数据及加密后的人脸数据,在显示终端显示出脱敏后的整合数据。采用专用播放器,对脱敏后整合数据、人脸加密进行逆向操作,恢复到原始视频数据进行播放,以满足对原始视频记录的要求,本申请能够在达到脱敏要求的情况下,降低对带宽与存储器的需求量,实现保密。

Patent Agency Ranking