-
公开(公告)号:CN118821853A
公开(公告)日:2024-10-22
申请号:CN202410923960.9
申请日:2024-07-11
Applicant: 厦门瑞为信息技术有限公司
IPC: G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种带多尺度池化的transformer模块处理方法,可用于基于深度神经网络的活体检测模型中,用以在训练阶段辅助训练CNN分支,能够为CNN分支提供全局上下文信息,增强模型对图像中的长距离依赖关系的建模能力。此外,通过将多尺度池化引入至transformer模块的多头自注意力模块中,能够有效压缩特征序列的长度,减少训练模型所需要的计算资源,同时获取极具判别性的特征表示,进一步提升了模型的性能。
-
公开(公告)号:CN118470808A
公开(公告)日:2024-08-09
申请号:CN202410923964.7
申请日:2024-07-11
Applicant: 厦门瑞为信息技术有限公司
IPC: G06V40/40 , G06V10/82 , G06N3/0464 , G06V10/774 , G06N3/096
Abstract: 本发明公开了一种基于局部卷积与语义信息的活体检测装置与方法,利用深度神经网络结构的活体检测模型并进行模型推理,活体检测模型包括CNN分支、transformer分支、语义信息对齐模块及模型损失计算模块,带多尺度池化的多头自注意力模块作为transformer模块的一部分,通过压缩特征序列长度和增强特征表示能力,进一步提升了模型的性能。本发明利用局部卷积以显著降低模型参数量及内存访问次数,在保障模型原有判别性以及抗干扰能力的情况下,使活体检测模型能够在资源受限的设备或场景中运行,实现对图像中的真假人脸进行准确区分,具有较高的真人通过率和抵抗各类攻击的能力。
-
公开(公告)号:CN118470436A
公开(公告)日:2024-08-09
申请号:CN202410909764.6
申请日:2024-07-09
Applicant: 厦门瑞为信息技术有限公司
IPC: G06V10/764 , G06V10/82 , G06V40/10 , G06V10/25 , G06V10/10 , G06N3/0455 , G01V8/00
Abstract: 本发明公开了一种提升毫米波安检仪违禁品检测能力的方法,其从毫米波的本质出发,通过调节毫米波信号增益强度,生成多种不同DB的毫米波图片用于深度学习算法的训练,提升算法的准确率和鲁棒性。针对毫米波图像中不存在人体的空白区域,采用基于关键点外推的方法进行去除,使算法聚焦于有效区域,降低算法推理消耗。为了让检测算法能达到更高的准确率,本发明将去除空白区域的正、背面图像水平拼接起来,输入检测算法,让算法在推理时可以得到更多的有效信息。为了让检测算法充分注意到图像中正、背面图像的相关性,本发明对DETR算法进行了的修改,引导算法中的注意力机制,更好的发挥作用。
-
公开(公告)号:CN117726701A
公开(公告)日:2024-03-19
申请号:CN202311586389.8
申请日:2023-11-27
Applicant: 厦门瑞为信息技术有限公司
IPC: G06T11/00 , G06V40/16 , G06N3/0475 , G06N3/08
Abstract: 本发明公开了基于可见光图像生成紫外光图像的方法、系统及应用,主要利用深度学习生成器网络,先通过精心设计的专用可见光和紫外光数据采集双目模组进行采集对齐的帧同步的图像数据,然后对可见光图像数据进行人脸区域检测,利用分割网络生成人脸区域掩码并用于模型训练损失函数计算,设计好相应的深度学习生成器网络,对模型进行训练,在模型效果收敛后,给生成器模型提供常规手机,相机拍摄的高清人脸图像作为输入,可推理预测出相应的紫外人脸图像。该紫外人脸图像可应用到生物识别、健康诊断、艺术创作和数字娱乐等领域。
-
公开(公告)号:CN117409262B
公开(公告)日:2024-03-01
申请号:CN202311719576.9
申请日:2023-12-14
Applicant: 厦门瑞为信息技术有限公司
IPC: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本发明公开一种基于CLIP快速构建图像分类模型的方法,包括S1、搜集图像;S2、使用CLIP模型筛选特定标签图像;S3、制作分类数据集,将数据集划分为训练集和测试集;S4、使用DivideMix方法训练分类模型。本发明采用CLIP图文匹配技术,通过输入标签文本即可从海量数据中提取出符合标签要求的数据图像,构建出可以用学习分类模型的数据集,而无需人工标注。同时针对筛选出的图像中可能存在的噪声(即类别错误)的问题,本发明引入带噪声数据的学习方法DivideMix,以降低数据集中噪声带来的影响。用此方法训练图像分类模型,可以提升模型的训练效率,降低数据标注需求,成本低,同时还可以达到不错的模型效果。
-
公开(公告)号:CN117218681A
公开(公告)日:2023-12-12
申请号:CN202311486914.9
申请日:2023-11-09
Applicant: 厦门瑞为信息技术有限公司
Abstract: 本发明公开了一种单目镜头的身高估计方法及小孩过闸装置与判断方法,通过对单目RGB镜头的安装做一些特定的限制和要求,利用几何关系即可直接算出目标行人的身高,且精度非常高,丝毫不差于带深度镜头的模组。本发明在闸机的出入口处设计了一个单目RGB镜头,利用该单目RGB镜头运行目标检测和多目标跟踪算法,其所需要的计算资源相较于双目镜头更少,对硬件的要求也更低,在原有闸机的基础上,以更小的成本、更简单的方案,更准确和更实用的效果,实现过闸小孩的智能识别,确保小孩安全、便利地通过,并提高整个闸机通行的效率和用户体验。
-
公开(公告)号:CN111222477B
公开(公告)日:2023-05-30
申请号:CN202010026699.4
申请日:2020-01-10
Applicant: 厦门瑞为信息技术有限公司
IPC: G06V20/59 , G06V10/25 , G06V10/764
-
公开(公告)号:CN116170581A
公开(公告)日:2023-05-26
申请号:CN202310132397.9
申请日:2023-02-17
Applicant: 厦门瑞为信息技术有限公司
IPC: H04N19/103 , H04L9/40 , H04L69/04
Abstract: 本申请涉及一种基于目标感知的视频信息编码方法和电子设备,该方法通过在编码前实现针对不同目标的感知能力,并可根据实际场景需求灵活选择不同的目标感知器以及编码模式,实现对特定目标进行感知并按需进行不同模式视频信息的编码操作,通过不同模式选择可实现对内存空间、网络带宽、存储介质空间和能源等方面大幅节省,也可确保视频流信息在其整个生命周期中除了摄像头采集阶段(包括编码、传输、存储、兼容式解码和呈现阶段)全程做到信息脱敏,做到视频信息全链路安全。在兼容标准解码模式数据呈现基础上,还可利用专用解码器进行完全解码,实现恢复摄像头采集的原始视频信息。
-
公开(公告)号:CN115795507A
公开(公告)日:2023-03-14
申请号:CN202211530484.1
申请日:2022-12-01
Applicant: 厦门瑞为信息技术有限公司
Abstract: 本发明公开了一种边端多路视频流脱敏及逆转方法、系统和专用播放器,对边端获取的多路视频流原始数据进行整合及编码,对整合数据进行人脸检测,解析人脸位置及原始数据位置,复制人脸区域数据进行压缩和加密,将人脸位置、视频流ID、视频流起始帧时间、帧号等信息进行编码,对整合数据中人脸区域进行脱敏处理,存储脱敏后的整合数据及加密后的人脸数据,在显示终端显示出脱敏后的整合数据。采用专用播放器,对脱敏后整合数据、人脸加密进行逆向操作,恢复到原始视频数据进行播放,以满足对原始视频记录的要求,本申请能够在达到脱敏要求的情况下,降低对带宽与存储器的需求量,实现保密。
-
公开(公告)号:CN114898140A
公开(公告)日:2022-08-12
申请号:CN202210325107.8
申请日:2022-03-30
Applicant: 厦门瑞为信息技术有限公司
Abstract: 本发明公开了一种基于PAA算法的行为检测方法、装置及可读介质,通过获取待检测图像,基于待检测图像确定感兴趣区域,感兴趣区域包括行为发生区域;将感兴趣区域输入到经训练的行为检测模型,输出检测结果,检测结果包括分类结果和检测框,其中,行为检测模型包括输入层、骨干网、特征金字塔网络和检测头,骨干网和特征金字塔网络中均包括跨级局部模块,检测头包括分类头和回归头,在行为检测模型的训练过程中采用PAA算法进行正负样本的分配;根据检测框确定检测结果是否为误检;响应于确定检测结果不是误检,基于分类结果进行分析,得到行为类型。在训练过程中采用PAA算法,能提升行为检测模型的检测精度。本发明误检率低,计算量低,模型鲁棒性好。
-
-
-
-
-
-
-
-
-