-
公开(公告)号:CN119762610A
公开(公告)日:2025-04-04
申请号:CN202411894468.X
申请日:2024-12-20
Applicant: 东南大学
IPC: G06T11/00 , G06V40/16 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于关键点引导文生图扩散模型的人脸生成方法,首先收集数据信息,将人脸图像、文本描述信息和人脸关键点构成训练数据对,利用文本编码器对文本描述信息进行编码并转换为嵌入向量,利用隐空间编码器将人脸关键点图像信息映射到隐式空间;将高斯噪声图的隐式空间张量和人脸关键点图像信息的隐式空间张量进行拼接;建立隐式扩散模型并训练,对拼接的隐式空间张量不断迭代去噪,获取与关键点和文本描述信息对应的人脸图像,利用热力图引导下的去噪损失模块为关键点条件分配额外的训练注意力,使用隐空间解码器将隐式空间中的去噪结果映射到像素空间,最终重建出高生成质量和高图像与文本描述信息一致性的人脸图像。
-
公开(公告)号:CN114241457B
公开(公告)日:2024-12-17
申请号:CN202111564312.1
申请日:2021-12-20
Applicant: 东南大学
IPC: G06V20/59 , G06V40/20 , G06V10/44 , G06V10/82 , G06V10/80 , G06V10/764 , G06N3/045 , G06N3/0464 , G06N3/048
Abstract: 本发明公开了一种通过关键点条件网络监控机动车辆驾驶员的方法,显式地提取与动作相关的关键点特征。网络包含全局分支和关键点分支。在全局分支中利用改进的空洞金字塔池化层来捕获多尺度的全局上下文,在关键点分支中提出了一个关键点条件计算模块来增强特征的可分辨性。在分类过程中,每个输入图像并不共享相同的全连接层参数,而是在关键点特征的指导下,通过条件计算生成专家权值,使模型能够适应相应类别的驾驶图像。本发明通过生成关键点增强注意力以缩放分类特征,提高了分类准确率和鲁棒性,在交通安全领域有重要的应用价值。
-
公开(公告)号:CN117893409A
公开(公告)日:2024-04-16
申请号:CN202410031207.9
申请日:2024-01-09
Applicant: 东南大学
IPC: G06T3/4076 , G06T5/70 , G06N3/0464 , G06N3/048 , G06T5/50
Abstract: 本发明公开了基于光照条件约束扩散模型的人脸超分辨率重建方法,收集包含不同光照条件下的人脸图像,构建出低分辨率非均匀光照人脸图像和高分辨率均匀光照人脸图像训练数据对;然后将低分辨率非均匀光照人脸图像送入到光照估计网络进行粗略光照补偿预测,根据光照补偿信息构建局部光照和全局光照约束,分别嵌入到条件去噪网络中;再将粗略光照补偿后的人脸图像送入到噪声引导器中生成先验高斯噪声;使用对比扩散损失函数训练条件去噪网络;最后利用训练好的条件去噪网络不断迭代细化噪声图像,重建出均匀光照高分辨率人脸图像。本发明可以同时实现人脸超分辨重建和光照归一化,从低分辨率非均匀光照人脸图像中复原出真实的高分辨率均匀光照人脸图像。
-
公开(公告)号:CN117853803A
公开(公告)日:2024-04-09
申请号:CN202410031205.X
申请日:2024-01-09
Applicant: 东南大学
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06V10/774 , G06V10/74 , G06V10/44 , G06V10/42 , G06T5/90 , G06T5/40 , G06N3/08
Abstract: 本发明公开了一种基于特征增强和通信网络的小样本动车异常检测方法及系统,通过数据采集与整理标注、图像预处理、建立特征增强和通信网络模型,并进行模型训练,最终得到最优特征增强和通信网络模型,输出异常类别的预测结果。所述特征增强和通信网络模型包括特征相似度计算模块、互注意力特征增强模块、多方面特征融合模块以及相似性增强模块,将经过预处理后的支撑‑查询图像对输入到模型中,提取多层次support图像特征和query图像特征,对不同层次特征进行增强与通信,融合多种特征得到更具代表性的特征用于query图像的预测。本方法解决了每一类新的异常需要大量劳动力标注训练样本的问题,可以利用训练好的模型直接检测新的异常,大大提高了检测效率。
-
公开(公告)号:CN110309723B
公开(公告)日:2023-08-01
申请号:CN201910483030.5
申请日:2019-06-04
Applicant: 东南大学
IPC: G06V40/20 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/084 , G06N3/0464
Abstract: 本发明提供了一种基于人体特征细分类的驾驶员行为识别方法,包括:建立驾驶员行为识别的图像数据集;构建基于人体特征细分类的识别模型;训练基于人体特征细分类的识别模型;对基于人体特征细分类的识别模型进行测试。本发明能够对人体关键点部位进行正确的动作分类,结合局部特征和图像全局特征进行驾驶员行为细分类,在交通安全领域有重要的应用价值。本发明通过Stacked Hourglass Networks模型进行关键点定位,随后,对关键点区域进行学习,将人体部位的具体动作作为卷积分类的中层特征,显著地提升了模型的识别精度。
-
公开(公告)号:CN115457596A
公开(公告)日:2022-12-09
申请号:CN202211082601.2
申请日:2022-09-06
Applicant: 东南大学
IPC: G06V40/10 , G06V10/772 , G06V10/77 , G06V10/82 , G06V10/762 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于相机感知图学习的无监督行人重识别方法,首先提取行人图像特征,并用聚类算法得到伪标签,同时构造内存字典;将每个相机作为一个独立的图像域,并从每个图像域中抽取样本以形成小批量训练样本;随后将所有图像样本特征用于构建相机感知图,利用图卷积网络将图像样本融合到统一的特征空间中,通过特征聚合来生成理想的图像特征;再构造基于内存的非参数对比损失来训练特征提取器和图卷积网络,构造相机对抗损失生成更加鲁棒有效的图像特征;重复执行前述步骤,直至模型收敛;最后,用特征提取器将行人图像映射到特征空间中,并将待查询行人图像的特征向量与候选行人图像的特征向量进行欧式距离比较并排序,最终得到行人重识别结果。
-
公开(公告)号:CN112101103B
公开(公告)日:2022-08-09
申请号:CN202010790835.7
申请日:2020-08-07
Applicant: 东南大学
Abstract: 本发明涉及了一种基于深度集成网络的视频驾驶员疲劳检测方法,框架包含风格迁移模块、人脸关键点检测模块和分类模块,风格迁移模块由一个编解码生成网络构成,用于复原输入红外视频帧的颜色信息,输出彩色视频帧;人脸关键点检测模块采用全卷积神经网络结构,以红外视频帧和风格迁移模块生成的彩色视频帧作为输入,对人脸关键点进行定位并输出掩膜特征图;分类模块由一个3D卷积神经网络组成,集成红外视频序列的时空信息、彩色视频序列的颜色信息、和掩膜特征序列的显著性信息,判定驾驶员疲劳状态。相比现有的疲劳驾驶检测算法,本发明检测率高,误报率低,可用于红外监控视频下的驾驶员疲劳检测。发明在智能交通领域有重要的应用价值。
-
公开(公告)号:CN110717389B
公开(公告)日:2022-05-13
申请号:CN201910824620.X
申请日:2019-09-02
Applicant: 东南大学
Abstract: 本发明公开了基于生成对抗和长短期记忆网络的驾驶员疲劳检测方法,网络架构由3D条件生成对抗网络和双向长短期记忆网络组成,3D条件生成对抗网络用于从短期视频剪辑中提取疲劳相关特征,其中3D生成网络由一个编解码U‑NET网络作为骨架网络,以疲劳相关标签作为条件,生成视频剪辑;3D判别网络将真实剪辑和合成剪辑作为输入,提取带有疲劳相关信息的短期时空特征表示。双向长短期记忆网络用于长期时空特征融合,捕捉帧间的上下文信息,并最终输出每帧的疲劳检测结果。对比目前现有的驾驶员疲劳检测方法,本发明泛化性强,识别准确率高,可用于监控视频下的实时驾驶员疲劳识别。发明在交通安全领域有重要的应用价值。
-
公开(公告)号:CN114241457A
公开(公告)日:2022-03-25
申请号:CN202111564312.1
申请日:2021-12-20
Applicant: 东南大学
Abstract: 本发明公开了一种通过关键点条件网络监控机动车辆驾驶员的方法,显式地提取与动作相关的关键点特征。网络包含全局分支和关键点分支。在全局分支中利用改进的空洞金字塔池化层来捕获多尺度的全局上下文,在关键点分支中提出了一个关键点条件计算模块来增强特征的可分辨性。在分类过程中,每个输入图像并不共享相同的全连接层参数,而是在关键点特征的指导下,通过条件计算生成专家权值,使模型能够适应相应类别的驾驶图像。本发明通过生成关键点增强注意力以缩放分类特征,提高了分类准确率和鲁棒性,在交通安全领域有重要的应用价值。
-
公开(公告)号:CN114241455A
公开(公告)日:2022-03-25
申请号:CN202111564299.X
申请日:2021-12-20
Applicant: 东南大学
IPC: G06V20/59 , G06V40/20 , G06V10/44 , G06V10/764 , G06V10/82 , G06V10/80 , G06V10/774 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明公开了一种基于关键点增强的驾驶员动作分类方法,本发明提出了高效的频道注意力模块来生成具有区别性的全局表示。同时,利用姿态估计提取驾驶员的关键点特征。考虑关键点信息的多样性,设计了自适应加权残差瓶颈,使输入关键点特征的模型权值具有动态性。然后融合全局分支和关键点分支的输出作为分类结果。本发明可进一步提高驾驶员行为识别准确率,在交通安全领域有重要的应用价值。
-
-
-
-
-
-
-
-
-