-
公开(公告)号:CN116631019B
公开(公告)日:2024-02-27
申请号:CN202210302699.1
申请日:2022-03-24
申请人: 清华大学 , 首都医科大学附属北京佑安医院
摘要: 了口罩适合性检测的成本。本发明提供一种基于面部图像的口罩适合性检测方法及装置,其中方法包括:获取受试者的正面面部图像;将所述正面面部图像输入至适合性检测模型,获得所述适合性检测模型输出的一个或多个适合性因数,每个所述适合性因数与预设口罩型号一一对应;其中,所述适合性检测模型是基于图像样本以及所述图像样本对应的一个或多个适合性因数标签进行训练后得到的,每个所述适合性因数标签是根据所述图像样本
-
公开(公告)号:CN117373010A
公开(公告)日:2024-01-09
申请号:CN202311329890.6
申请日:2023-10-15
申请人: 清华大学
IPC分类号: G06V20/62 , G06V10/44 , G06V10/82 , G06N3/0464
摘要: 本发明公开了基于深度表征学习的车牌图像识别方法及系统,该方法,包括获取车牌图像样本数据送入车牌识别模型;其中,车牌识别模型,包括图像校正模块、特征提取模块、编码器和解码器;利用图像校正模块对车牌图像进行图像校正得到校正图像,并利用特征提取模块对校正图像进行特征提取得到最终特征图;将最终特征图输入至编码器得到隐含表征序列,并利用解码器对隐含表征序列进行解码得到车牌识别结果。本发明适用于识别开放场景中动态获取的车牌图像,可提高低质量车牌图像识别性能。
-
公开(公告)号:CN115497120B
公开(公告)日:2023-12-15
申请号:CN202211166187.3
申请日:2022-09-23
申请人: 清华大学 , 佛山市帆思科材料技术有限公司
IPC分类号: G06V40/10 , G06V10/762 , G06V10/44 , G06N3/0464 , G06N3/084
摘要: 本发明公开了基于Transformer的两步式领域自适应行人再识别方法,属于行人再识别技术领域,将所述源域图像和class token编码后输入Transformer识别模型,提取源域图像中的行人特征,并反向传播更新模型;获取目标域图像,将目标域图像编码后输入Transformer识别模型,提取目标域图像中的行人特征,并反向传播更新模型;开放模型中所有参数,将经过过滤的目标域图像输入Transformer识别模型,提取目标域图像的行人特征,并反向传播更新模型;本发明将Transformer应用到领域自适应行人再识别中,提升了识别模型的性能。
-
公开(公告)号:CN114083535B
公开(公告)日:2023-06-13
申请号:CN202111371166.0
申请日:2021-11-18
申请人: 清华大学
IPC分类号: B25J9/16
摘要: 本发明提供一种机器手抓取姿势质量的物理度量方法及装置。其中,该方法包括:确定机器手的候选抓取姿势与物体之间接触点的平坦度分数;确定所述候选抓取姿势夹持所述物体的重心分数;基于所述平坦度分数和所述重心分数评估候选抓取姿势的质量。本发明提供的机器手抓取姿势质量的物理度量方法,基于人类在生活中拿起物体时倾向于接触物体上更平坦的部位以及习惯于接触物体的中心部位的特性,通过两种物理度量分数分别从物体自身平坦度和重力分析上评价机器手抓取姿势的质量,使得候选抓取姿势的评价结果具有更强的鲁棒性,在对实际物体预测抓取姿势时,能够选择出更加优质的候选抓取姿势,从而提升了后续机器手抓取姿势控制的精确度和稳定性。
-
公开(公告)号:CN114723718A
公开(公告)日:2022-07-08
申请号:CN202210395710.3
申请日:2022-04-14
申请人: 清华大学
摘要: 本发明提供一种大场景图像的区域提取方法及装置,其中的区域提取方法包括:S1,获取目标图像;S2,将目标图像输入至骨干特征网络,得到目标图像的骨干特征图;S3,获取目标图像的区域记录特征图;S4,根据骨干特征图和区域记录特征图,得到目标图像的目标状态;S5,将目标状态输入至策略生成网络,获取目标图像的区域提取策略;S6,根据区域提取策略,确定待提取的目标区域,并从目标图像中提取目标区域,目标区域由一个或多个子目标区域构成。该方法解决了现有技术中大场景图像处理效率低且缺乏灵活性的缺陷,有效提高了大场景图像处理效率,并增加了对大场景图像区域提取的灵活性。
-
公开(公告)号:CN110765863B
公开(公告)日:2022-05-17
申请号:CN201910876163.9
申请日:2019-09-17
申请人: 清华大学 , 北京中盾安全技术开发公司
IPC分类号: G06V40/16 , G06V10/762 , G06V10/80
摘要: 本发明实施例提供一种基于时空约束的目标聚类方法及系统。该方法包括构建待聚类样本池,选取人脸样本集和行人样本集,对人脸样本集和行人样本集分别进行图卷积,得到人脸相似度和行人相似度,再进行融合卷积得到融合视觉相似度,进一步得到样本聚类结果,获取摄像机转移概率矩阵,得到更新的摄像机转移概率矩阵,对单个个体的路径合理性进行评估,得到合理性评估结果,对样本聚类结果进行优化,得到聚类优化结果,迭代将聚类优化结果存入已聚类样本池。本发明实施例通过对人员图像信息进行,采用加权图模型卷积对人脸和行人图像进行融合,并对人员在不同摄像机之间转移的概率进行分析,通过对整体概率进行全局优化,有效提升人员聚类的准确率。
-
公开(公告)号:CN113192185A
公开(公告)日:2021-07-30
申请号:CN202110540712.2
申请日:2021-05-18
申请人: 清华大学
IPC分类号: G06T17/00 , G06T7/557 , G06T7/80 , H04N19/597
摘要: 本发明公开了一种动态光场重建方法、装置及设备。方法包括:对多视角视频分别进行帧间的运动估计确定各视角的动态区域获得动态区域集;基于动态区域集对所述多视角视频的每一帧进行深度估计获得多视角视频中主视角视频每一帧的深度图;基于动态区域集对多视角视频的每一帧进行RGB压缩编码获得主视角视频每一帧的第一RGB信息;根据深度图和第一RGB信息确定空间体素每一帧的第二RGB信息和距离场SDF信息;基于第二RGB信息和SDF信息构建三维动态模型。利用该方法,能够根据第一RGB信息和深度图直接进行三维构建,无需对第一RGB信息和深度图进行解压,可以将压缩和三维构建一体化设计,减小三维构建过程中的数据通量,有效提高光场重建的效率。
-
公开(公告)号:CN112446379B
公开(公告)日:2021-04-20
申请号:CN202110134370.4
申请日:2021-02-01
申请人: 清华大学
摘要: 本发明实施例公开了一种动态大场景自适应智能处理方法。该方法包括:获取动态大场景下的原始图像,并将原始图像按预设比例缩小,获得待处理图像;将待处理图像输入预设的目标区域寻找网络模型,根据目标区域寻找网络模型的生成结果确定至少一个目标区域;将各目标区域输入目标识别检测器中进行位置检测,确定各目标区域中的目标位置框;按照各目标区域的尺度信息和预设比例,将相应的目标位置框关联至原始图像中。本发明实施例的技术方案,解决了难以对动态大场景下的高分辨率图像进行目标识别,识别速度慢且识别结果不够准确的问题,提升了对高分辨率图像视觉处理的处理效率,并提高了对高分辨率图像视觉处理的准确度。
-
公开(公告)号:CN107025435B
公开(公告)日:2020-06-23
申请号:CN201710139212.1
申请日:2017-03-09
申请人: 清华大学
IPC分类号: G06K9/00
摘要: 本发明实施例提供一种人脸识别处理方法及系统,涉及计算机视觉与图像处理领域,所述方法包括:获取待识别人的身份证人脸相片和实时人脸图像;提取所述身份证人脸相片中的人脸特征和所述实时人脸图像中的人脸特征;根据所述身份证人脸相片中的人脸特征,以及实时人脸图像中的人脸特征计算身份证人脸特征自相关系数、现场人脸特征自相关系数和身份证现场人脸特征互相关系数;识别所述待识别人身份。通过利用了高清证件照的细节特征、二代身份证芯片人脸图片分辨率较低但姿态正光照好的特点,以及现场采集的人脸照姿态表情变化大等特点,进行训练得到辅助参数,提升了人脸识别处理的准确率以及场景适应性。
-
公开(公告)号:CN110765863A
公开(公告)日:2020-02-07
申请号:CN201910876163.9
申请日:2019-09-17
申请人: 清华大学 , 北京中盾安全技术开发公司
IPC分类号: G06K9/00
摘要: 本发明实施例提供一种基于时空约束的目标聚类方法及系统。该方法包括构建待聚类样本池,选取人脸样本集和行人样本集,对人脸样本集和行人样本集分别进行图卷积,得到人脸相似度和行人相似度,再进行融合卷积得到融合视觉相似度,进一步得到样本聚类结果,获取摄像机转移概率矩阵,得到更新的摄像机转移概率矩阵,对单个个体的路径合理性进行评估,得到合理性评估结果,对样本聚类结果进行优化,得到聚类优化结果,迭代将聚类优化结果存入已聚类样本池。本发明实施例通过对人员图像信息进行,采用加权图模型卷积对人脸和行人图像进行融合,并对人员在不同摄像机之间转移的概率进行分析,通过对整体概率进行全局优化,有效提升人员聚类的准确率。
-
-
-
-
-
-
-
-
-