-
公开(公告)号:CN116071625B
公开(公告)日:2023-06-02
申请号:CN202310206397.9
申请日:2023-03-07
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/778 , G06V10/766 , G06V10/774
Abstract: 本申请提供了一种深度学习模型的训练方法、目标检测方法及装置,涉及计算机视觉、深度学习。该训练方法具体实现方案为:利用第一深度学习模型对样本图像进行处理,得到第一图像特征;并根据初始位置分布特征图和第一图像特征,得到第一特征图。利用第二深度学习模型对样本图像进行处理,得到第二图像特征;并根据初始位置分布特征图和第二图像特征,得到第二特征图。利用第一深度学习模型对样本图像进行目标检测,得到第一检测结果。基于目标损失函数,根据第一检测结果、第一特征图和第二特征图,调整第一深度学习模型的模型参数和初始位置分布特征图,得到与样本图像对应的目标位置分布特征图和经训练的第一深度学习模型。
-
公开(公告)号:CN115482390A
公开(公告)日:2022-12-16
申请号:CN202211219369.2
申请日:2022-09-30
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种深度学习模型的训练方法,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉等技术领域。具体实现方案为:将样本图像输入第一深度学习模型的第一特征提取网络,得到样本图像的第一特征;对第一特征进行特征提取,得到与样本图像的类别无关的噪声特征;对噪声特征进行转换,得到转换后的噪声特征,其中,转换后的噪声特征的维度与样本图像的第二特征的维度之间的维度差异小于或等于预设维度差异阈值;将转换后的噪声特征输入第二深度学习模型,得到噪声迁移后的分类结果;根据噪声迁移后的分类结果,训练第一深度学习模型。本公开还提供了一种图像分类方法、装置、电子设备和存储介质。
-
公开(公告)号:CN113705425B
公开(公告)日:2022-08-16
申请号:CN202110985438.X
申请日:2021-08-25
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/145 , G06V40/40 , G06V10/74 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开提供了一种活体检测模型的训练方法和活体检测方法、装置,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域,可应用于人脸识别等场景。具体实现方案为:将包括目标对象的多个样本图像输入活体检测模型的特征提取网络,得到各样本图像的图像特征;各样本图像具有指示目标对象为真实类别的实际概率的标签;将图像特征输入活体检测模型的分类网络,得到目标对象为真实类别的第一预测概率;基于图像特征与预定特征序列中每个特征之间的相似度,确定目标对象为非真实类别的第二预测概率,该每个特征为标签指示的实际概率为零的第一样本图像的图像特征;基于第一预测概率、第二预测概率和实际概率,对活体检测模型进行训练。
-
公开(公告)号:CN111645695B
公开(公告)日:2022-08-09
申请号:CN202010601635.2
申请日:2020-06-28
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种疲劳驾驶的检测方法、装置、计算机设备和存储介质,涉及图像处理领域和深度学习领域,该方法包括:实时获取与交通工具驾驶员匹配的人脸图像帧,并获取与所述人脸图像帧对应的至少一个疲劳检测器官的器官图像;获取与所述人脸图像帧的各器官图像分别对应的状态分类结果;根据与多张连续获取的人脸图像帧分别对应各器官图像的状态分类结果,计算与各疲劳检测器官分别对应的长时分类结果;根据与各疲劳检测器官分别对应的长时分类结果,对所述驾驶员进行疲劳检测。使用本申请的技术方案,可以实现快速、准确的检测驾驶员是否处于疲劳驾驶状态。
-
公开(公告)号:CN110147724B
公开(公告)日:2022-07-01
申请号:CN201910289541.3
申请日:2019-04-11
Applicant: 北京百度网讯科技有限公司
Abstract: 根据本公开的示例实施例,提供了一种用于检测视频中的文本区域的方法、装置、设备以及介质。方法包括基于第一图像帧中检测到的第一组文本区域来确定第一组文本区域的第一组跟踪特征,其中第一图像帧在视频的第一时刻被捕获,并且基于第一组跟踪特征来确定第一时刻之后的第二时刻的第二组预测特征。方法还包括基于第二图像帧中检测到的第二组文本区域来确定第二组文本区域的第二组跟踪特征,其中第二图像帧在视频的第二时刻被捕获,然后基于第二组预测特征和第二组跟踪特征来确定视频在第二时刻的一个或多个文本区域。本公开的实施例通过文本跟踪来辅助检测视频中的文本区域,能够建立视频图像帧间的时序联系,从而提高视频文本检测的准确率。
-
公开(公告)号:CN111595450B
公开(公告)日:2022-03-25
申请号:CN202010415405.7
申请日:2020-05-15
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开的实施例涉及一种用于测量温度方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及人工智能领域。该方法可以包括对输入图像中的对象的目标部位进行检测。该方法进一步包括基于目标部位的检测结果确定目标部位的关键点和关键点的权重信息,权重信息指示关键点被遮挡的概率。该方法还可以包括获取关键点的温度信息。此外,该方法可以进一步包括至少基于关键点的温度信息和权重信息,确定目标部位的温度。本公开的技术方案可以快速高效且低成本地获取行人的体温信息,从而降低温度测量的时间和人力成本。
-
公开(公告)号:CN113705425A
公开(公告)日:2021-11-26
申请号:CN202110985438.X
申请日:2021-08-25
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种活体检测模型的训练方法和活体检测方法、装置,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域,可应用于人脸识别等场景。具体实现方案为:将包括目标对象的多个样本图像输入活体检测模型的特征提取网络,得到各样本图像的图像特征;各样本图像具有指示目标对象为真实类别的实际概率的标签;将图像特征输入活体检测模型的分类网络,得到目标对象为真实类别的第一预测概率;基于图像特征与预定特征序列中每个特征之间的相似度,确定目标对象为非真实类别的第二预测概率,该每个特征为标签指示的实际概率为零的第一样本图像的图像特征;基于第一预测概率、第二预测概率和实际概率,对活体检测模型进行训练。
-
公开(公告)号:CN113642428A
公开(公告)日:2021-11-12
申请号:CN202110865025.8
申请日:2021-07-29
Applicant: 北京百度网讯科技有限公司
IPC: G06K9/00
Abstract: 本公开提供了一种人脸活体检测方法、装置、电子设备及存储介质,涉及图像处理技术领域,具体涉及计算机视觉和深度学习等人工智能技术领域。具体实施方案为,获取待检测的包含人脸的源图像;基于源图像,获取每个检测模型的检测图像,其中,检测模型包括活体检测主模型和至少一个因子检测辅模型,因子检测辅模型用于对活体检测中的一个防攻击因子进行检测;获取活体检测主模型的第一检测概率和因子检测辅模型的第二检测概率;根据第一检测概率和第二检测概率,确定活体检测结果。由此,能够提高人脸活体检测的准确度和泛化性。
-
公开(公告)号:CN112287795A
公开(公告)日:2021-01-29
申请号:CN202011141832.7
申请日:2020-10-22
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种异常驾驶姿态检测方法、装置、设备、车辆和介质,涉及计算机视觉、深度学习、智能交通等人工智能领域,具体可用于辅助驾驶场景下。具体实现方案为:根据驾驶用户驾驶时采集的原始图像,确定人体关键点;其中,所述人体关键点包括肩部关键点;根据所述肩部关键点,检测所述驾驶用户的异常驾驶姿态。本申请实施例提高了对驾驶用户异常驾驶姿态进行检测时的检测效率,并减少了数据运算量。
-
公开(公告)号:CN112052832A
公开(公告)日:2020-12-08
申请号:CN202011027038.X
申请日:2020-09-25
Applicant: 北京百度网讯科技有限公司
Abstract: 根据本公开的示例实施例,提供了人脸检测的方法、装置和计算机存储介质,涉及人工智能领域,具体为计算机视觉、深度学习技术,可用于人脸识别。人脸检测的方法,包括:基于包括人脸的彩色图像、红外图像和深度图像,确定彩色图像、红外图像和深度图像中的多个人脸关键点;基于多个人脸关键点,分别确定第一特征、第二特征和第三特征,第一特征与彩色图像相关联,第二特征与红外图像相关联,第三特征与深度图像相关联;基于第一特征、第二特征和第三特征,生成第四特征;以及基于第四特征,确定人脸的真实性。根据本公开的方案。可以准确地进行活体人脸检测。
-
-
-
-
-
-
-
-
-