一种理发店员工工作内容智能识别方法

    公开(公告)号:CN115424347B

    公开(公告)日:2025-04-11

    申请号:CN202211072684.7

    申请日:2022-09-02

    Abstract: 本发明涉及一种理发店员工工作内容智能识别方法,属于机器视觉技术领域,包括以下步骤:S1:采集设备安装位置和安装条件的设置;S2:建立理发员工人脸、顾客人脸标签库,并训练人脸识别模型;S3:建立与物品、工具和人相关的动作标签库,并进行理发店动作行为识别模型训练;S4:利用训练好的人脸识别模型、理发店动作行为识别模型,用于实际理发服务场景进行动作行为识别。构建顾客、员工、动作几个要素的“动作对”行为时序;S5:建立工作内容识别标签,构建工作内容识别的深度神经网络模型,用以确定理发店员工对顾客的服务工作内容。本发明通过理发店员工工作内容智能识别方法,辅助实现理发店有效地智能化管理。

    基于跨模态融合的多模态人脸防伪检测方法、装置、设备及介质

    公开(公告)号:CN117437677A

    公开(公告)日:2024-01-23

    申请号:CN202311398873.8

    申请日:2023-10-26

    Abstract: 本发明涉及一种基于跨模态融合的多模态人脸防伪检测方法、装置、设备及介质,属于人脸防伪技术领域。该检测方法通过包括RGB、IR以及深度在内的多模态人脸图像进行处理,以获得融合特征的跨模态特征图,具体地,对RGB、IR、深度人脸图像进行多尺度特征提取得到多尺度特征图,再对不同模态的多尺度特征图进行跨模态特征融合处理得到跨模态特征图,基于跨模态特征图进行拼接处理得到目标跨模态特征图,即可根据目标跨模态特征图判断多模态人脸图像是否为真实人脸图像。本发明通过将不同模态间的人脸图像进行跨模态的特征融合处理,能够获得全面、多尺度、具有互补性的目标跨模态特征图,有利于提升人脸防伪技术的准确率。

    一种针对小样本场景的行为迁移学习识别方法

    公开(公告)号:CN116778570A

    公开(公告)日:2023-09-19

    申请号:CN202310508297.1

    申请日:2023-05-08

    Abstract: 本发明涉及一种针对小样本场景的行为迁移学习识别方法,属于机器视觉技术领域,包括以下步骤:S1:构建正样本数据集,其包括数据丰富的源域正样本数据集和小样本的目标域正样本数据集;S2:将正样本数据集进行空间信息变换和时序信息打乱,以构建负样本数据集;S3:构建基于SlowFast改进的行为识别迁移学习模型,增强视频的时序信息并实现从源域向目标域迁移的功能;S4:使用源域和目标域的正样本数据集与负样本数据集对所述基于SlowFast改进的行为识别迁移学习模型进行训练,以获得在目标域上泛化的行为识别模型;S5:利用训练完成行为识别模型在实际场景中进行行为识别。

    一种基于数据生成的小样本语音分离方法

    公开(公告)号:CN116092512A

    公开(公告)日:2023-05-09

    申请号:CN202211740126.3

    申请日:2022-12-30

    Abstract: 本发明涉及一种基于数据生成的小样本语音分离方法,属于语音分离领域,包括以下步骤:S1:采集并构建待分离语音数据集和目标说话人干净语音数据集;S2:对数据集进行预处理;S3:利用基于LSTM的语音匹配模型对预处理后的待分离语音数据集中的每段语音进行帧级别的目标说话人匹配,根据匹配结果,将语音段判断为:不含目标说话人、只包含一个目标说话人、包含多个目标说话人;S4:利用基于GAN的包含多个目标说话人的语音生成模型扩充待分离语音段;S5:构建并训练基于TCN的语音分离模型,将待分离的包含多个目标说话人的语音分离得到单一目标说话人的语音数据,最后拼接出单一说话人的完整语音。

    一种姿态驱动的遮挡行人重识别方法

    公开(公告)号:CN112800967B

    公开(公告)日:2022-05-17

    申请号:CN202110123640.1

    申请日:2021-01-29

    Abstract: 本发明涉及一种姿态驱动的遮挡行人重识别方法,属于计算机领域。本发明包括:输入待识别图像,经过预处理后调整为标准输入图像;利用行人重识别网络提取输入图像特征,得到全局特征;利用人体姿态估计网络提取输入图像特征,得到人体姿态特征;基于人体姿态特征,分别利用局部可见度预测器模块获取可见度评分,利用局部注意力生成器模块获取注意力掩膜;最后根据可见度评分选取输入图像可见部分的局部特征和图像库中的对应特征计算欧氏距离并按照升序排序,将排序结果作为行人重识别模型的输出。本发明帮助行人重识别网络定位遮挡区域,降低了相同身份的受遮挡行人与完整行人的特征差异,提高了行人重识别模型的泛化能力。

    一种复杂场景下实时视频多人行为识别方法及系统

    公开(公告)号:CN113963315A

    公开(公告)日:2022-01-21

    申请号:CN202111357367.5

    申请日:2021-11-16

    Abstract: 本发明涉及一种复杂场景下实时视频多人行为识别方法及系统,属于机器视觉技术领域。该方法包括:采集视频数据;建立场景人脸标签库,用于人脸识别模型训练;构建轻量化SlowFast模型用于复杂场景多人行为识别;建立不同人员类别异常行为动作标签库,建立训练行为动作标签库;将训练数据集经过预处理之后,输入到构建的轻量化SlowFast网络中进行训练;利用人脸识别模型和轻量化SlowFast网络模型进行实际场景行为动作检测、识别。本发明通过人脸识别,确定人员类别身份,建立人脸检测框与人员位置定位框的关联关系,对场景中目标人员的行为动作进行检测和识别,以实现在复杂场景中不同类别人员异常行为的监测和预警。

    基于Transformer网络模型的行人重识别方法、装置及计算机设备

    公开(公告)号:CN116311379B

    公开(公告)日:2025-04-29

    申请号:CN202310351000.5

    申请日:2023-04-04

    Abstract: 本发明属于计算机视觉领域,涉及一种基于Transformer网络模型的行人重识别方法、装置及计算机设备;所述方法包括获取目标行人图像并预处理,生成标准行人图像;将标准行人图像采用滑动窗口划分为多个具有重叠部分的方形子图像;对各方形子图像经过水平线性投影和垂直线性投影,得到水平特征矩阵和垂直特征矩阵;将其输入到预先训练好的改进Transformer网络模型中,预测得到目标行人图像的识别结果。本发明利用滑动窗口将输入图像划分为多个有重叠部分的正方形小块,突出了遮挡物与行人交界边缘处行人的特征;利用改进的Transformer网络结构,加强了行人特征在各个方向上的关联,提高了行人重识别准确度。

Patent Agency Ranking