-
公开(公告)号:CN119359986A
公开(公告)日:2025-01-24
申请号:CN202411249398.2
申请日:2024-09-06
Applicant: 清华大学
IPC: G06V10/25 , G06V10/82 , G06V10/44 , G06V10/74 , G06N3/0455 , G06N3/0464
Abstract: 本发明提供一种超高分辨率图像的开集目标检测方法、装置及电子设备,涉及计算机技术领域。其中,超高分辨率图像的开集目标检测方法,包括:获取超高分辨率图像;确定超高分辨率图像中目标的密度信息以及尺度信息;根据超高分辨率图像中目标的密度信息以及尺度信息,将超高分辨率图像切分为多个自适应图像区域;利用目标识别网络,识别每一个自适应图像区域中包含的目标,得到每一个自适应图像区域的目标检测结果;根据每一个自适应图像区域的目标检测结果,生成超高分辨率图像的目标检测结果。本发明可以在各种复杂多变的实际应用场景中,准确、高效地从超高分辨率图像中检测出各类目标。
-
公开(公告)号:CN118918605A
公开(公告)日:2024-11-08
申请号:CN202410821232.7
申请日:2024-06-24
Applicant: 清华大学 , 北京华成智云软件股份有限公司
Abstract: 本发明提供一种内场景下人员身份识别及持续定位方法和装置,包括:获取进入室内环境下的人员身份信息、第一人脸图像和第一人体图像,并建立人员档案;通过预设的多个摄像机采集室内人员视频图像,基于所述视频图像通过三维空间定位算法进行人员定位获取空间位置信息;基于所述视频图像进行第二人脸图像和第二人体图像的识别,确认人员身份信息;基于确认的人员身份信息将所述第二人脸图像、第二人体图像和空间位置信息更新所述人员档案并删除已经离开的室内的人员档案;基于更新后的人员档案进行可视化展示并持续进行人员定位。本发明解决了现有室内人员在脸部信息缺失情况下无法进行身份识别并且室内人员定位不精准、成本高的问题。
-
公开(公告)号:CN113192185B
公开(公告)日:2022-05-17
申请号:CN202110540712.2
申请日:2021-05-18
Applicant: 清华大学
IPC: G06T17/00 , G06T7/557 , G06T7/80 , H04N19/597
Abstract: 本发明公开了一种动态光场重建方法、装置及设备。方法包括:对多视角视频分别进行帧间的运动估计确定各视角的动态区域获得动态区域集;基于动态区域集对所述多视角视频的每一帧进行深度估计获得多视角视频中主视角视频每一帧的深度图;基于动态区域集对多视角视频的每一帧进行RGB压缩编码获得主视角视频每一帧的第一RGB信息;根据深度图和第一RGB信息确定空间体素每一帧的第二RGB信息和距离场SDF信息;基于第二RGB信息和SDF信息构建三维动态模型。利用该方法,能够根据第一RGB信息和深度图直接进行三维构建,无需对第一RGB信息和深度图进行解压,可以将压缩和三维构建一体化设计,减小三维构建过程中的数据通量,有效提高光场重建的效率。
-
公开(公告)号:CN113936308A
公开(公告)日:2022-01-14
申请号:CN202010653082.5
申请日:2020-07-08
Applicant: 清华大学
IPC: G06V40/16 , G06V10/82 , G06V10/764 , G06V10/771 , G06V10/80 , G06N3/04 , G06N3/08
Abstract: 本发明实施例提供人脸识别方法、装置及电子设备,所述方法包括:将待识别人脸图像和所述待识别人脸图像的人脸部件解析图输入训练好的低分辨率识别模型,输出所述待识别人脸图像的特征;根据所述待识别人脸图像的特征进行人脸识别。通过将待识别人脸图像的人脸部件解析图作为人脸先验信息输入训练好的低分辨率识别模型,提高了对于低分辨率人脸图像的识别成功率。
-
公开(公告)号:CN113326762A
公开(公告)日:2021-08-31
申请号:CN202110580830.6
申请日:2021-05-26
Applicant: 清华大学
Abstract: 本发明提供一种人脸图像的情绪确定方法、装置、电子设备及存储介质,其中所述方法包括:对待分析人脸图像进行卷积计算,提取所述待分析人脸图像的全图特征;对所述全图特征进行解耦,得到多个人脸部件的特征;基于动态融合依据状态,动态融合所述多个人脸部件的特征,形成高层次语义特征;基于所述高层次语义特征和语言生成模型,以逐词预测的方式生成情绪描述语句,提升了所生成的情绪描述语句的质量。
-
公开(公告)号:CN112926372A
公开(公告)日:2021-06-08
申请号:CN202010853196.4
申请日:2020-08-22
Abstract: 本发明公开一种基于序列变形的场景文字检测方法及系统。所述方法及系统包括:特征提取模块基于卷积神经网络对输入的场景图像提取第一特征图x,并发送至序列变形模块;序列变形模块通过对第一特征图x进行迭代采样,得到采样位置对应的特征图,并且通过将第一特征图x与采样得到的特征图沿通道维度进行深度学习中的拼接操作而得到第二特征图m,并发送至辅助字符计数网络;序列变形模块还通过对第二特征图m的通道维度上进行特征聚合操作而得到第三特征图,并发送至目标检测基准网络;目标检测基准网络通过对第三特征图进行文本区域候选框提取,并通过回归拟合得到文本区域预测结果作为场景文字检测结果。
-
公开(公告)号:CN112215223A
公开(公告)日:2021-01-12
申请号:CN202011107999.1
申请日:2020-10-16
Abstract: 本发明公开了一种基于多元注意力机制的多方向场景文字识别方法及系统,所述方法包括:由特征提取器对从外接的文字检测模块输出的文本行/列图像I进行归一化处理,利用深层卷积神经网络对经归一化的图像提取特征,得到原始特征图F0,在原始特征图F0上叠加二维方向位置编码P输出多通道特征图F;由编码器将从特征提取器输出的多通道特征图F转换为隐含表示H;由解码器将从编码器输出的隐含表示H转换为识别文本作为输出结果。本发明提供的多方向场景文字识别方法及系统,适用于识别场景图像中的横排、竖排多种方向以及弯曲文本行,具有较强的适用性。
-
公开(公告)号:CN111209878A
公开(公告)日:2020-05-29
申请号:CN202010028274.7
申请日:2020-01-10
Applicant: 公安部户政管理研究中心 , 清华大学
Abstract: 本发明实施例提供一种跨年龄人脸识别方法及装置。其中,方法包括:将待识别人脸图片输入至图片生成模型,获取待识别人脸图片对应的多个年龄段的生成图片;将待识别人脸图片和各生成图片分别输入至基本特征提取模型和各年龄段的特征提取模型,输出基本人脸特征和各年龄段人脸特征;根据基本人脸特征和各年龄段人脸特征,获取特征向量;根据特征向量和预先获取的人脸库,获取待识别人脸图片的识别结果。本发明实施例提供的跨年龄人脸识别方法及装置,通过生成不同年龄段的人脸,分别提取待识别人脸图片中的人脸和生成的不同年龄段的人脸的特征并进行融合,根据融合后的人脸特征进行人脸识别,能提高跨年龄人脸识别的识别准确率。
-
公开(公告)号:CN107066945B
公开(公告)日:2019-06-18
申请号:CN201710143006.8
申请日:2017-03-10
Applicant: 清华大学
Abstract: 本发明实施例涉及电子信息技术领域,提供一种大流量通关快速身份核验方法和系统,其中方法包括:获取预设摄像机实时采集的行人的第一监控图像,识别第一监控图像中人脸获取人脸图像,根据人脸图像确定行人的行人身份类型及人脸图像在第一监控图像中的图像坐标;根据图像坐标、预设深度摄像机采集的行人距离信息及深度摄像机的标定信息获取行人在行人通道中的地理坐标;控制地踩式多色LED阵列在行人的地理坐标区域显示与行人的行人身份类型对应的行进标识,以提示行人按照行进标识的指示行进。本发明实施例提供的大流量通关快速身份核验方法和系统,能够大幅提高核验效率和通行能力,且能够保证对所有通行人员无遗漏的身份核验。
-
公开(公告)号:CN107545263A
公开(公告)日:2018-01-05
申请号:CN201710652233.3
申请日:2017-08-02
Applicant: 清华大学
Abstract: 本发明实施例提供一种物体检测方法及装置,所述方法包括:接收样本图片,训练所述样本图片并标注所述样本图片中各个感兴趣物体的轴对齐矩形边框位置,获得所述样本图片的图片特征图;通过对所述图片特征图进行预设的卷积操作和预设的反卷积操作,获得与所述样本图片的尺寸大小一致的输出特征图;通过将图像复原L2损失函数、窗口分类Softmax损失函数和窗口校正平滑L1损失函数三种损失函数线性加和训练网络,获得目标训练网络;输入所述输出特征图到所述目标训练网络,获得初始检测结果,对所述初始检测结果进行非极大值抑制,获得所述样本图片中各个感兴趣物体的检测结果。本发明实施例实现了对图片中物体的检测识别率的提高,并尽可能地检测到图片中具有不同尺寸的目标,特别是小尺寸目标。
-
-
-
-
-
-
-
-
-