Patent search ap:("清华大学") AND inv:"王生进" Page 4

31.

发明授权
图像采集分析方法失效

公开(公告)号：CN102184405B

公开(公告)日：2012-12-26

申请号：CN201110098035.X

申请日：2011-04-19

Applicant: 清华大学

Inventor： 何飞 , 王生进 , 苏亚 , 陈晨 , 郑良 , 丁晓青

IPC: G06K9/60 , G06K7/10

Abstract: 本发明涉及图像处理技术领域，具体公开了一种图像采集分析方法，包括：步骤1.制作若干个标尺并将其摆放在每行超市货架上，所述标尺上具有若干组编码；步骤2.采集摆放有所述标尺的货架的图像；步骤3.对采集到的所述图像分离色彩通道，在分离后的各个通道上检测标尺的编码；步骤4.根据对所述编码的检测结果对图像进行校正；步骤5.根据对所述编码的检测结果在校正后的图像上分割出图像中包含商品的区域；步骤6.在所述区域上利用颜色特征和局部纹理特征对商品进行分类，进而得到商品摆放的相关信息。本发明能够高效、准确的得到商品在货架上的摆放位置、数量等信息。而且本方法简便易行，节省大量人力物力。

32.

发明公开
视觉广告效果评估系统及方法失效

公开(公告)号：CN102542492A

公开(公告)日：2012-07-04

申请号：CN201210006449.X

申请日：2012-01-10

Applicant: 清华大学

Inventor： 李亚利 , 王生进 , 方驰 , 丁晓青

IPC: G06Q30/02 , G06K9/00 , G06K9/62

Abstract: 本发明公开了一种视觉广告效果评估系统及方法，图像处理及计算机视觉技术领域。该系统包括：采集模块，用于按照设定的采集频率，实时采集设定范围内经过待评估的广告牌的行人的视频图像、以及设定范围内的背景图像；数据处理模块，用于根据计算机视觉方法及图像处理方法，对采集模块采集到的视频图像进行处理，获取经过待评估的广告牌的行人流量、行人观看比例以及行人观看时间数据，并将数据发送至评估模块；评估模块，用于根据所述行人流量、行人观看比例以及行人观看的时间数据评估所述待评估广告的设置方位和适度以及内容吸引度。可以有效地实现对视觉广告效果进行评估，并能进行广告优劣的评价，且评估精度高。

33.

发明公开
一种泛化行人检索特征学习方法和装置审中-实审

公开(公告)号：CN118587735A

公开(公告)日：2024-09-03

申请号：CN202410490877.7

申请日：2024-04-23

Applicant: 清华大学

Inventor： 王生进 , 豆朝鹏

IPC: G06V40/10 , G06N3/084 , G06N3/088 , G06V20/40 , G06V10/80

Abstract: 本发明提供一种泛化行人检索特征学习方法和装置，该方法包括：确定无标注的行人检索视频训练集；对训练集进行视频帧间隔采样，得到视频帧训练样本；将视频帧训练样本输入行人检索网络模型，确定行人检索网络模型输出的行人检索训练正样本对；根据训练正样本对调节行人检索网络模型的损失函数，以对行人检索网络模型进行无监督的特征学习训练；重复迭代执行采样的步骤、样本输入的步骤和调节的步骤，直至达到预设训练次数，完成对行人检索网络模型的泛化特征学习训练过程。本发明学习的特征具有身份鉴别性和泛化性，能够在任意场景中不经过微调直接使用，提升了行人检索特征学习的泛化性能。

34.

发明授权
基于多元注意力机制的多方向场景文字识别方法及系统有权

公开(公告)号：CN112215223B

公开(公告)日：2024-03-19

申请号：CN202011107999.1

申请日：2020-10-16

Applicant: 清华大学 , 现代自动车株式会社 , 起亚自动车株式会社

Inventor： 彭良瑞 , 闫睿劼 , 肖善誉 , 姚刚 , 王生进 , 闵载植 , 石宗烨

IPC: G06V20/62 , G06V30/18 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08

Abstract: 本发明公开了一种基于多元注意力机制的多方向场景文字识别方法及系统，所述方法包括：由特征提取器对从外接的文字检测模块输出的文本行/列图像I进行归一化处理，利用深层卷积神经网络对经归一化的图像提取特征，得到原始特征图F0，在原始特征图F0上叠加二维方向位置编码P输出多通道特征图F；由编码器将从特征提取器输出的多通道特征图F转换为隐含表示H；由解码器将从编码器输出的隐含表示H转换为识别文本作为输出结果。本发明提供的多方向场景文字识别方法及系统，适用于识别场景图像中的横排、竖排多种方向以及弯曲文本行，具有较强的适用性。

35.

发明授权
基于面部图像的口罩适合性检测方法及装置有权

公开(公告)号：CN116631019B

公开(公告)日：2024-02-27

申请号：CN202210302699.1

申请日：2022-03-24

Applicant: 清华大学 , 首都医科大学附属北京佑安医院

Inventor： 罗常伟 , 黄晶 , 王生进 , 王桂芳 , 蔡颖南

IPC: G06V40/16 , G06V20/64

Abstract: 了口罩适合性检测的成本。本发明提供一种基于面部图像的口罩适合性检测方法及装置，其中方法包括：获取受试者的正面面部图像；将所述正面面部图像输入至适合性检测模型，获得所述适合性检测模型输出的一个或多个适合性因数，每个所述适合性因数与预设口罩型号一一对应；其中，所述适合性检测模型是基于图像样本以及所述图像样本对应的一个或多个适合性因数标签进行训练后得到的，每个所述适合性因数标签是根据所述图像样本

36.

发明公开
基于深度表征学习的车牌图像识别方法及系统审中-实审

公开(公告)号：CN117373010A

公开(公告)日：2024-01-09

申请号：CN202311329890.6

申请日：2023-10-15

Applicant: 清华大学

Inventor： 彭良瑞 , 赵珂萌 , 姚刚 , 丁宁 , 唐沛 , 王生进

IPC: G06V20/62 , G06V10/44 , G06V10/82 , G06N3/0464

Abstract: 本发明公开了基于深度表征学习的车牌图像识别方法及系统，该方法，包括获取车牌图像样本数据送入车牌识别模型；其中，车牌识别模型，包括图像校正模块、特征提取模块、编码器和解码器；利用图像校正模块对车牌图像进行图像校正得到校正图像，并利用特征提取模块对校正图像进行特征提取得到最终特征图；将最终特征图输入至编码器得到隐含表征序列，并利用解码器对隐含表征序列进行解码得到车牌识别结果。本发明适用于识别开放场景中动态获取的车牌图像，可提高低质量车牌图像识别性能。

37.

发明授权
基于Transformer的两步式领域自适应行人再识别方法有权

公开(公告)号：CN115497120B

公开(公告)日：2023-12-15

申请号：CN202211166187.3

申请日：2022-09-23

Applicant: 清华大学 , 佛山市帆思科材料技术有限公司

Inventor： 余盛铭 , 王生进

IPC: G06V40/10 , G06V10/762 , G06V10/44 , G06N3/0464 , G06N3/084

Abstract: 本发明公开了基于Transformer的两步式领域自适应行人再识别方法，属于行人再识别技术领域，将所述源域图像和class token编码后输入Transformer识别模型，提取源域图像中的行人特征，并反向传播更新模型；获取目标域图像，将目标域图像编码后输入Transformer识别模型，提取目标域图像中的行人特征，并反向传播更新模型；开放模型中所有参数，将经过过滤的目标域图像输入Transformer识别模型，提取目标域图像的行人特征，并反向传播更新模型；本发明将Transformer应用到领域自适应行人再识别中，提升了识别模型的性能。

38.

发明授权
一种机器手抓取姿势质量的物理度量方法及装置有权

公开(公告)号：CN114083535B

公开(公告)日：2023-06-13

申请号：CN202111371166.0

申请日：2021-11-18

Applicant: 清华大学

Inventor： 王生进 , 鲁宇豪 , 李亚利

IPC: B25J9/16

Abstract: 本发明提供一种机器手抓取姿势质量的物理度量方法及装置。其中，该方法包括：确定机器手的候选抓取姿势与物体之间接触点的平坦度分数；确定所述候选抓取姿势夹持所述物体的重心分数；基于所述平坦度分数和所述重心分数评估候选抓取姿势的质量。本发明提供的机器手抓取姿势质量的物理度量方法，基于人类在生活中拿起物体时倾向于接触物体上更平坦的部位以及习惯于接触物体的中心部位的特性，通过两种物理度量分数分别从物体自身平坦度和重力分析上评价机器手抓取姿势的质量，使得候选抓取姿势的评价结果具有更强的鲁棒性，在对实际物体预测抓取姿势时，能够选择出更加优质的候选抓取姿势，从而提升了后续机器手抓取姿势控制的精确度和稳定性。

39.

发明公开
一种大场景图像的区域提取方法及装置无效

公开(公告)号：CN114723718A

公开(公告)日：2022-07-08

申请号：CN202210395710.3

申请日：2022-04-14

Applicant: 清华大学

Inventor： 许景焘 , 李亚利 , 王生进

IPC: G06T7/00 , G06T7/11 , G06N3/04 , G06N3/08

Abstract: 本发明提供一种大场景图像的区域提取方法及装置，其中的区域提取方法包括：S1，获取目标图像；S2，将目标图像输入至骨干特征网络，得到目标图像的骨干特征图；S3，获取目标图像的区域记录特征图；S4，根据骨干特征图和区域记录特征图，得到目标图像的目标状态；S5，将目标状态输入至策略生成网络，获取目标图像的区域提取策略；S6，根据区域提取策略，确定待提取的目标区域，并从目标图像中提取目标区域，目标区域由一个或多个子目标区域构成。该方法解决了现有技术中大场景图像处理效率低且缺乏灵活性的缺陷，有效提高了大场景图像处理效率，并增加了对大场景图像区域提取的灵活性。

40.

发明授权
一种基于时空约束的目标聚类方法及系统有权

公开(公告)号：CN110765863B

公开(公告)日：2022-05-17

申请号：CN201910876163.9

申请日：2019-09-17

Applicant: 清华大学 , 北京中盾安全技术开发公司

Inventor： 赵炫 , 王生进 , 李亚利

IPC: G06V40/16 , G06V10/762 , G06V10/80

Abstract: 本发明实施例提供一种基于时空约束的目标聚类方法及系统。该方法包括构建待聚类样本池，选取人脸样本集和行人样本集，对人脸样本集和行人样本集分别进行图卷积，得到人脸相似度和行人相似度，再进行融合卷积得到融合视觉相似度，进一步得到样本聚类结果，获取摄像机转移概率矩阵，得到更新的摄像机转移概率矩阵，对单个个体的路径合理性进行评估，得到合理性评估结果，对样本聚类结果进行优化，得到聚类优化结果，迭代将聚类优化结果存入已聚类样本池。本发明实施例通过对人员图像信息进行，采用加权图模型卷积对人脸和行人图像进行融合，并对人员在不同摄像机之间转移的概率进行分析，通过对整体概率进行全局优化，有效提升人员聚类的准确率。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification