一种行人识别方法和装置
    31.
    发明公开

    公开(公告)号:CN106529442A

    公开(公告)日:2017-03-22

    申请号:CN201610949687.2

    申请日:2016-10-26

    Applicant: 清华大学

    Inventor: 王生进 田露

    Abstract: 本发明提供一种行人识别方法和装置,其中该方法包括:根据图像中的行人位置,标定行人区域,分离单独的行人图像;根据行人区域和单独的行人图像,标定行人数据集,将行人图像对应于行人体型;根据行人图像,基于卷积神经网络分析获取行人的属性特征。本发明通过行人图像的体型判断,利用基于深度学习的多任务卷积神经网络,在离线训练过程中针对不同性别、不同的行人视角训练一个统一的体型判断模型,有效的解决行人视角的问题,提高了算法准确度。

    基于路面标识识别违规驾驶行为的方法及系统

    公开(公告)号:CN103116748B

    公开(公告)日:2016-03-23

    申请号:CN201310077048.8

    申请日:2013-03-11

    Applicant: 清华大学

    Abstract: 本发明提出一种基于路面标识识别违规驾驶行为的方法及系统。其中,方法包括以下步骤:获取车辆行驶的道路图像,并对道路图像进行预处理以生成道路图像的二值化图像;根据二值化图像中的白像素点确定道路的边界以生成道路边界线;从道路图像中检测与道路边界线对应的道路线之间是否有引导标识,其中,引导标识包括公交专用标识和方向标识;以及当引导标识为方向标识时,根据方向标识和车辆状态信息判断车辆是否违规行驶。根据本发明实施例的方法,通过生成道路图像的二值化图像,并在该二值化图像中判别引导标识识别驾驶是否规范,提前预防了交通事故的发生,进而提高了驾驶的安全性。

    基于眼部信息的活体人脸检测方法及装置

    公开(公告)号:CN105243378A

    公开(公告)日:2016-01-13

    申请号:CN201510781590.0

    申请日:2015-11-13

    CPC classification number: G06K9/00228 G06K9/00906

    Abstract: 本发明提供基于眼部信息的活体人脸检测方法及装置,方法包括:获取待检测人脸图像序列,对其进行光流场估计并获取其中眼睛区域;确定序列中各帧眼睛区域各像素光流,判断各帧眼睛区域各像素光流是否一致,若否则确定检测第一结果为活体,若是则确定检测第一结果为假体;计算序列中各帧眼睛区域二值化图像间的汉明距离,根据其确定活体分数,若活体分数大于等于预设阈值则确定检测第二结果为活体,若活体分数小于预设阈值则确定检测第二结果为假体;判断序列中是否存在眨眼动作,若是则确定检测第三结果为活体,若否则确定检测第三结果为假体;将三种结果融合获取最终检测结果。该方法能检测人脸是否为活体,复杂度低、不需人主动配合、鲁棒性强。

    基于路面标识识别违规驾驶行为的方法及系统

    公开(公告)号:CN103116748A

    公开(公告)日:2013-05-22

    申请号:CN201310077048.8

    申请日:2013-03-11

    Applicant: 清华大学

    Abstract: 本发明提出一种基于路面标识识别违规驾驶行为的方法及系统。其中,方法包括以下步骤:获取车辆行驶的道路图像,并对道路图像进行预处理以生成道路图像的二值化图像;根据二值化图像中的白像素点确定道路的边界以生成道路边界线;从道路图像中检测与道路边界线对应的道路线之间是否有引导标识,其中,引导标识包括公交专用标识和方向标识;以及当引导标识为方向标识时,根据方向标识和车辆状态信息判断车辆是否违规行驶。根据本发明实施例的方法,通过生成道路图像的二值化图像,并在该二值化图像中判别引导标识识别驾驶是否规范,提前预防了交通事故的发生,进而提高了驾驶的安全性。

    图像采集分析方法
    35.
    发明授权

    公开(公告)号:CN102184405B

    公开(公告)日:2012-12-26

    申请号:CN201110098035.X

    申请日:2011-04-19

    Applicant: 清华大学

    Abstract: 本发明涉及图像处理技术领域,具体公开了一种图像采集分析方法,包括:步骤1.制作若干个标尺并将其摆放在每行超市货架上,所述标尺上具有若干组编码;步骤2.采集摆放有所述标尺的货架的图像;步骤3.对采集到的所述图像分离色彩通道,在分离后的各个通道上检测标尺的编码;步骤4.根据对所述编码的检测结果对图像进行校正;步骤5.根据对所述编码的检测结果在校正后的图像上分割出图像中包含商品的区域;步骤6.在所述区域上利用颜色特征和局部纹理特征对商品进行分类,进而得到商品摆放的相关信息。本发明能够高效、准确的得到商品在货架上的摆放位置、数量等信息。而且本方法简便易行,节省大量人力物力。

    视觉广告效果评估系统及方法

    公开(公告)号:CN102542492A

    公开(公告)日:2012-07-04

    申请号:CN201210006449.X

    申请日:2012-01-10

    Applicant: 清华大学

    Abstract: 本发明公开了一种视觉广告效果评估系统及方法,图像处理及计算机视觉技术领域。该系统包括:采集模块,用于按照设定的采集频率,实时采集设定范围内经过待评估的广告牌的行人的视频图像、以及设定范围内的背景图像;数据处理模块,用于根据计算机视觉方法及图像处理方法,对采集模块采集到的视频图像进行处理,获取经过待评估的广告牌的行人流量、行人观看比例以及行人观看时间数据,并将数据发送至评估模块;评估模块,用于根据所述行人流量、行人观看比例以及行人观看的时间数据评估所述待评估广告的设置方位和适度以及内容吸引度。可以有效地实现对视觉广告效果进行评估,并能进行广告优劣的评价,且评估精度高。

    一种泛化行人检索特征学习方法和装置

    公开(公告)号:CN118587735A

    公开(公告)日:2024-09-03

    申请号:CN202410490877.7

    申请日:2024-04-23

    Applicant: 清华大学

    Inventor: 王生进 豆朝鹏

    Abstract: 本发明提供一种泛化行人检索特征学习方法和装置,该方法包括:确定无标注的行人检索视频训练集;对训练集进行视频帧间隔采样,得到视频帧训练样本;将视频帧训练样本输入行人检索网络模型,确定行人检索网络模型输出的行人检索训练正样本对;根据训练正样本对调节行人检索网络模型的损失函数,以对行人检索网络模型进行无监督的特征学习训练;重复迭代执行采样的步骤、样本输入的步骤和调节的步骤,直至达到预设训练次数,完成对行人检索网络模型的泛化特征学习训练过程。本发明学习的特征具有身份鉴别性和泛化性,能够在任意场景中不经过微调直接使用,提升了行人检索特征学习的泛化性能。

    基于面部图像的口罩适合性检测方法及装置

    公开(公告)号:CN116631019B

    公开(公告)日:2024-02-27

    申请号:CN202210302699.1

    申请日:2022-03-24

    Abstract: 了口罩适合性检测的成本。本发明提供一种基于面部图像的口罩适合性检测方法及装置,其中方法包括:获取受试者的正面面部图像;将所述正面面部图像输入至适合性检测模型,获得所述适合性检测模型输出的一个或多个适合性因数,每个所述适合性因数与预设口罩型号一一对应;其中,所述适合性检测模型是基于图像样本以及所述图像样本对应的一个或多个适合性因数标签进行训练后得到的,每个所述适合性因数标签是根据所述图像样本

    基于深度表征学习的车牌图像识别方法及系统

    公开(公告)号:CN117373010A

    公开(公告)日:2024-01-09

    申请号:CN202311329890.6

    申请日:2023-10-15

    Applicant: 清华大学

    Abstract: 本发明公开了基于深度表征学习的车牌图像识别方法及系统,该方法,包括获取车牌图像样本数据送入车牌识别模型;其中,车牌识别模型,包括图像校正模块、特征提取模块、编码器和解码器;利用图像校正模块对车牌图像进行图像校正得到校正图像,并利用特征提取模块对校正图像进行特征提取得到最终特征图;将最终特征图输入至编码器得到隐含表征序列,并利用解码器对隐含表征序列进行解码得到车牌识别结果。本发明适用于识别开放场景中动态获取的车牌图像,可提高低质量车牌图像识别性能。

    基于Transformer的两步式领域自适应行人再识别方法

    公开(公告)号:CN115497120B

    公开(公告)日:2023-12-15

    申请号:CN202211166187.3

    申请日:2022-09-23

    Inventor: 余盛铭 王生进

    Abstract: 本发明公开了基于Transformer的两步式领域自适应行人再识别方法,属于行人再识别技术领域,将所述源域图像和class token编码后输入Transformer识别模型,提取源域图像中的行人特征,并反向传播更新模型;获取目标域图像,将目标域图像编码后输入Transformer识别模型,提取目标域图像中的行人特征,并反向传播更新模型;开放模型中所有参数,将经过过滤的目标域图像输入Transformer识别模型,提取目标域图像的行人特征,并反向传播更新模型;本发明将Transformer应用到领域自适应行人再识别中,提升了识别模型的性能。

Patent Agency Ranking