-
公开(公告)号:CN115424347B
公开(公告)日:2025-04-11
申请号:CN202211072684.7
申请日:2022-09-02
Applicant: 重庆邮电大学
IPC: G06V40/20 , G06V40/16 , G06V20/40 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0455
Abstract: 本发明涉及一种理发店员工工作内容智能识别方法,属于机器视觉技术领域,包括以下步骤:S1:采集设备安装位置和安装条件的设置;S2:建立理发员工人脸、顾客人脸标签库,并训练人脸识别模型;S3:建立与物品、工具和人相关的动作标签库,并进行理发店动作行为识别模型训练;S4:利用训练好的人脸识别模型、理发店动作行为识别模型,用于实际理发服务场景进行动作行为识别。构建顾客、员工、动作几个要素的“动作对”行为时序;S5:建立工作内容识别标签,构建工作内容识别的深度神经网络模型,用以确定理发店员工对顾客的服务工作内容。本发明通过理发店员工工作内容智能识别方法,辅助实现理发店有效地智能化管理。
-
公开(公告)号:CN114677200B
公开(公告)日:2024-06-21
申请号:CN202210368272.1
申请日:2022-04-01
Applicant: 重庆邮电大学
IPC: G06Q30/0601 , G06F16/9535 , G06F16/958 , G06F21/60 , G06N20/10
Abstract: 本发明涉及一种基于多方高维数据纵向联邦学习的商业信息推荐方法及装置,属于大数据技术领域,包括以下步骤:S1:创建同态加密的密钥对。进行多方数据的预处理和加密样本对齐;S2:构建纵向联邦LightGBM模型;S3:将纵向联邦LightGBM模型转换成神经网络,作为纵向联邦ECA‑DeepGBM模型的GBDT2NN部分;S4:纵向联邦ECA‑DeepGBM模型CatNN部分前馈过程计算;S5:构建损失函数及模型整体训练,基于训练好的高维数据分类预测模型,实现基于多方高维数据的商业信息推荐。本发明通过多方数据增加特征维度的方式,以达到进行精准商业信息推荐的目的。
-
公开(公告)号:CN117437677A
公开(公告)日:2024-01-23
申请号:CN202311398873.8
申请日:2023-10-26
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于跨模态融合的多模态人脸防伪检测方法、装置、设备及介质,属于人脸防伪技术领域。该检测方法通过包括RGB、IR以及深度在内的多模态人脸图像进行处理,以获得融合特征的跨模态特征图,具体地,对RGB、IR、深度人脸图像进行多尺度特征提取得到多尺度特征图,再对不同模态的多尺度特征图进行跨模态特征融合处理得到跨模态特征图,基于跨模态特征图进行拼接处理得到目标跨模态特征图,即可根据目标跨模态特征图判断多模态人脸图像是否为真实人脸图像。本发明通过将不同模态间的人脸图像进行跨模态的特征融合处理,能够获得全面、多尺度、具有互补性的目标跨模态特征图,有利于提升人脸防伪技术的准确率。
-
公开(公告)号:CN116778570A
公开(公告)日:2023-09-19
申请号:CN202310508297.1
申请日:2023-05-08
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种针对小样本场景的行为迁移学习识别方法,属于机器视觉技术领域,包括以下步骤:S1:构建正样本数据集,其包括数据丰富的源域正样本数据集和小样本的目标域正样本数据集;S2:将正样本数据集进行空间信息变换和时序信息打乱,以构建负样本数据集;S3:构建基于SlowFast改进的行为识别迁移学习模型,增强视频的时序信息并实现从源域向目标域迁移的功能;S4:使用源域和目标域的正样本数据集与负样本数据集对所述基于SlowFast改进的行为识别迁移学习模型进行训练,以获得在目标域上泛化的行为识别模型;S5:利用训练完成行为识别模型在实际场景中进行行为识别。
-
公开(公告)号:CN116092512A
公开(公告)日:2023-05-09
申请号:CN202211740126.3
申请日:2022-12-30
Applicant: 重庆邮电大学
IPC: G10L21/0272 , G10L17/04 , G10L17/18
Abstract: 本发明涉及一种基于数据生成的小样本语音分离方法,属于语音分离领域,包括以下步骤:S1:采集并构建待分离语音数据集和目标说话人干净语音数据集;S2:对数据集进行预处理;S3:利用基于LSTM的语音匹配模型对预处理后的待分离语音数据集中的每段语音进行帧级别的目标说话人匹配,根据匹配结果,将语音段判断为:不含目标说话人、只包含一个目标说话人、包含多个目标说话人;S4:利用基于GAN的包含多个目标说话人的语音生成模型扩充待分离语音段;S5:构建并训练基于TCN的语音分离模型,将待分离的包含多个目标说话人的语音分离得到单一目标说话人的语音数据,最后拼接出单一说话人的完整语音。
-
公开(公告)号:CN115985340A
公开(公告)日:2023-04-18
申请号:CN202210997349.1
申请日:2022-08-19
Applicant: 重庆邮电大学
IPC: G10L25/48 , G10L25/51 , G10L25/30 , G10L25/24 , G10L25/63 , G10L13/04 , G10L13/047 , G10L13/08 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/0475 , G06N3/084
Abstract: 本发明属于网络安全‑‑合成语音检测领域,具体涉及一种基于生成对抗网络的合成语音检测方法及系统,该方法包括获取待检测的语音数据,对语音数据进行预处理;采用训练好的语音检测模型对预处理后的语音数据进行检测,得到检测结果,对检测结果进行分类标记,所述语音检测模型为生成对抗网络;本发明利用生成对抗网络模型的博弈学习思想最终达到良好的合成语音检测效果,结合了自然语言处理技术对期望文本进行分词处理以及情感分析,其次采用了编码器对注音字符进行特征提取得到隐藏特征,再将其送入多头注意力机制,最后将隐藏特征解码,重构出更贴近目标对象的合成语音向量,提高了检测的准确度。
-
公开(公告)号:CN114677200A
公开(公告)日:2022-06-28
申请号:CN202210368272.1
申请日:2022-04-01
IPC: G06Q30/06 , G06F16/9535 , G06F16/958 , G06F21/60 , G06N20/10
Abstract: 本发明涉及一种基于多方高维数据纵向联邦学习的商业信息推荐方法及装置,属于大数据技术领域,包括以下步骤:S1:创建同态加密的密钥对。进行多方数据的预处理和加密样本对齐;S2:构建纵向联邦LightGBM模型;S3:将纵向联邦LightGBM模型转换成神经网络,作为纵向联邦ECA‑DeepGBM模型的GBDT2NN部分;S4:纵向联邦ECA‑DeepGBM模型CatNN部分前馈过程计算;S5:构建损失函数及模型整体训练,基于训练好的高维数据分类预测模型,实现基于多方高维数据的商业信息推荐。本发明通过多方数据增加特征维度的方式,以达到进行精准商业信息推荐的目的。
-
公开(公告)号:CN112800967B
公开(公告)日:2022-05-17
申请号:CN202110123640.1
申请日:2021-01-29
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种姿态驱动的遮挡行人重识别方法,属于计算机领域。本发明包括:输入待识别图像,经过预处理后调整为标准输入图像;利用行人重识别网络提取输入图像特征,得到全局特征;利用人体姿态估计网络提取输入图像特征,得到人体姿态特征;基于人体姿态特征,分别利用局部可见度预测器模块获取可见度评分,利用局部注意力生成器模块获取注意力掩膜;最后根据可见度评分选取输入图像可见部分的局部特征和图像库中的对应特征计算欧氏距离并按照升序排序,将排序结果作为行人重识别模型的输出。本发明帮助行人重识别网络定位遮挡区域,降低了相同身份的受遮挡行人与完整行人的特征差异,提高了行人重识别模型的泛化能力。
-
公开(公告)号:CN113963315A
公开(公告)日:2022-01-21
申请号:CN202111357367.5
申请日:2021-11-16
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种复杂场景下实时视频多人行为识别方法及系统,属于机器视觉技术领域。该方法包括:采集视频数据;建立场景人脸标签库,用于人脸识别模型训练;构建轻量化SlowFast模型用于复杂场景多人行为识别;建立不同人员类别异常行为动作标签库,建立训练行为动作标签库;将训练数据集经过预处理之后,输入到构建的轻量化SlowFast网络中进行训练;利用人脸识别模型和轻量化SlowFast网络模型进行实际场景行为动作检测、识别。本发明通过人脸识别,确定人员类别身份,建立人脸检测框与人员位置定位框的关联关系,对场景中目标人员的行为动作进行检测和识别,以实现在复杂场景中不同类别人员异常行为的监测和预警。
-
公开(公告)号:CN116311379B
公开(公告)日:2025-04-29
申请号:CN202310351000.5
申请日:2023-04-04
Applicant: 重庆邮电大学
IPC: G06V40/10 , G06V10/80 , G06V10/774 , G06V10/764 , G06F17/16 , G06N3/04 , G06N3/08
Abstract: 本发明属于计算机视觉领域,涉及一种基于Transformer网络模型的行人重识别方法、装置及计算机设备;所述方法包括获取目标行人图像并预处理,生成标准行人图像;将标准行人图像采用滑动窗口划分为多个具有重叠部分的方形子图像;对各方形子图像经过水平线性投影和垂直线性投影,得到水平特征矩阵和垂直特征矩阵;将其输入到预先训练好的改进Transformer网络模型中,预测得到目标行人图像的识别结果。本发明利用滑动窗口将输入图像划分为多个有重叠部分的正方形小块,突出了遮挡物与行人交界边缘处行人的特征;利用改进的Transformer网络结构,加强了行人特征在各个方向上的关联,提高了行人重识别准确度。
-
-
-
-
-
-
-
-
-