-
公开(公告)号:CN110675426B
公开(公告)日:2022-11-22
申请号:CN201810710538.X
申请日:2018-07-02
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提供一种人体跟踪方法、装置、设备及存储介质。该方法包括:获取目标拍摄设备在当前时刻拍摄的当前帧图像;检测该当前帧图像中的所有人体,得到该当前帧图像中所有人体的第一位置信息;采用预设跟踪算法计算在该当前帧图像的前一帧图像中跟踪到的第一人体在该当前帧图像中的第二位置信息;根据该第一人体在该当前帧图像中的第二位置信息、当前帧图像中所有人体的第一位置信息、以及预设列表中存储的所有已跟踪到的行人特征,确定当前帧图像中所有人体在该当前帧图像中的目标位置信息;该预设列表中存储的所有已跟踪到的行人特征是根据多个拍摄设备拍摄的历史图像确定的。本发明实施例提高了在图像中进行人体跟踪的准确性。
-
公开(公告)号:CN106683680B
公开(公告)日:2022-03-25
申请号:CN201710142901.8
申请日:2017-03-10
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种说话人识别方法及装置、计算机设备及计算机可读介质。其所述方法包括:接收目标群体中的待识别用户的目标语音数据;根据目标语音数据、预先采集的语音数据库和预先训练的说话人识别模型,获取目标语音数据对应的语音输出特征以及语音数据库中每个语音数据对应的语音输出特征;说话人识别模型采用卷积神经网络模型;根据目标语音数据对应的语音输出特征以及语音数据库中每个语音数据对应的语音输出特征,识别目标语音数据对应的用户。本发明通过采用基于卷积神经网络模型的说话人识别模型,能够更加准确地获取各语音数据的语音输出特征,从而更加准确地对目标语音数据对应的用户进行识别,进而能够大大地提高对说话人的识别效率。
-
公开(公告)号:CN108985259B
公开(公告)日:2022-03-18
申请号:CN201810878634.5
申请日:2018-08-03
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了人体动作识别方法和装置。该方法的一具体实施方式包括:对输入的待识别视频进行采样,得到待识别视频的采样图像帧序列;采用已训练的人体关键点检测模型对采样图像帧序列进行关键点检测,得到采样图像帧序列中每个采样图像帧的人体关键点位置热图,人体关键点位置热图用于表征预设人体关键点所在位置的概率特征;将采样图像帧序列的人体关键点位置热图输入已训练的动作分类模型进行分类,得到待识别视频对应的人体动作。该实施方式实现了利用待识别视频中人体关键点的协调配合关系及人体动作的时间连续特性进行动作识别,有利于提升识别精度。
-
公开(公告)号:CN109035257B
公开(公告)日:2021-08-31
申请号:CN201810709464.8
申请日:2018-07-02
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提供一种人像分割方法、装置及设备,该方法包括:获取视频中第一图像与第二图像之间的差异值,第一图像为待进行人像分割处理的图像,第二图像为第一图像的前一帧图像,第二图像已进行人像分割处理;若差异值大于预设阈值,则根据预设模型对第一图像进行人像分割处理,得到第一图像的人像分割结果,预设模型为根据多组样本学习得到的,每组样本包括图像样本和对应的人像分割结果样本;若差异值小于或等于预设阈值,则根据第二图像的人像分割结果和运动估计算法,确定第一图像的人像分割结果。在保证对视频进行高精度的人像分割处理的基础上,提高了对视频进行高精度人像分割处理的实时性。
-
公开(公告)号:CN106960219B
公开(公告)日:2021-04-16
申请号:CN201710142614.7
申请日:2017-03-10
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种图片识别方法及装置、计算机设备及计算机可读介质。所述方法包括:获取待识别的图片;根据所述待识别的图片和预先训练的图片识别模型,获取待识别的图片的预测类别标签;所述预先训练的图片识别模型采用卷积神经网络模型,且所述卷积神经网络模型中包括至少一层将通道维度由一维升阶为多维的核池化层;根据所述待识别的图片的所述预测类别标签,识别所述待识别的图片的类别。本发明的技术方案,通过采用上述带有核池化层的图片识别模型,对待识别图片进行识别时,能够实现更加精细粒度的图片类别的识别,有效地提高图片识别的准确性和图片识别的效率。
-
公开(公告)号:CN107911753B
公开(公告)日:2021-01-22
申请号:CN201711215661.6
申请日:2017-11-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/8358 , H04N21/44
Abstract: 本申请实施例公开了用于在视频中添加数字水印的方法和装置。该方法的一具体实施方式包括:对目标视频中的各帧图像进行目标检测;根据目标检测结果确定所述目标视频中是否包括至少一个载体,其中,载体是指各帧图像中的、用于添加数字水印的对象;响应于确定所述目标视频中包括至少一个载体,从所述至少一个载体中确定目标载体,并将所述数字水印添加到所述目标视频中的、包括所述目标载体的各帧图像中的目标载体所在区域内。该实施方式使数字水印的位置随目标载体位置的变化而不断变化,使添加的数字水印不易被检测和去除,提高了视频的安全性。
-
公开(公告)号:CN107995536B
公开(公告)日:2020-01-21
申请号:CN201711214955.7
申请日:2017-11-28
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 于新卫 , 曾茜 , 李甫 , 文石磊 , 姜佳岐 , 张鑫 , 李峰 , 张宝玉 , 齐萌 , 宫礼星 , 韩蓉蓉 , 宋岳阳 , 孟凡天 , 王海平 , 刘霄 , 孙昊 , 李旭斌 , 常程浩
IPC: H04N21/485 , H04N21/472 , H04N21/488 , G06K9/62 , G06K9/00
Abstract: 本发明提供了一种提取视频预览的方法、装置、设备和计算机存储介质,其中方法包括:将视频输入预先训练得到的视频分类模型;获取所述视频分类模型中注意力模块输出的各视频帧的权重;提取总权重值满足预设要求的连续N个视频帧作为所述视频的视频预览,所述N为预设的正整数。本发明提供的方式能够从视频中自动提取出连续的视频帧作为视频预览,无需人工剪辑,降低了人工成本。
-
公开(公告)号:CN107995535B
公开(公告)日:2019-11-26
申请号:CN201711214152.1
申请日:2017-11-28
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 于新卫 , 曾茜 , 李甫 , 文石磊 , 姜佳岐 , 张鑫 , 李峰 , 张宝玉 , 齐萌 , 宫礼星 , 韩蓉蓉 , 宋岳阳 , 孟凡天 , 王海平 , 刘霄 , 孙昊 , 李旭斌 , 常程浩
IPC: H04N21/485 , H04N21/472 , H04N21/488 , H04N21/845 , G06K9/62 , G06K9/00
Abstract: 本发明提供了一种展示视频的方法、装置、设备和计算机存储介质,其中方法包括:定位目标视频;展示所述目标视频的视频预览,所述视频预览为从所述目标视频提取出的视频片段。这种展示方式对视频内容的表达能力更强,用户能够更好地获知该视频是否是其需要的内容,减小用户错过其需要的视频资源的概率,也减小用户观看视频内容后发现视频内容不符合预期的概率,从而帮助用户方便、有效地观看其需要的视频资源。
-
公开(公告)号:CN109711241A
公开(公告)日:2019-05-03
申请号:CN201811280331.X
申请日:2018-10-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了一种物体检测方法、装置与电子设备,该方法包括:将视频流中连续的N帧图像依次输入到检测模型中,获得每帧图像的M个特征图;针对每帧图像,将该帧图像的M个特征图的尺度缩放到统一尺度,并对尺度统一的M个特征图进行融合,输入到所述检测模型中的预测模块中,获得该帧图像的物体检测结果;将所述N帧图像的物体检测结果进行比较,确定目标物体。在实现对较大物体的准确检测的基础上,实现对小物体的准确检测。同时,将N帧图像的物体检测结果进行比较,进而对视频流中模糊图像的误检测结果进行过滤,实现目标物体的准确检测。
-
公开(公告)号:CN109660714A
公开(公告)日:2019-04-19
申请号:CN201811287526.7
申请日:2018-10-31
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种基于AR的图像处理方法、装置、设备及存储介质,该方法可包括:获取预览图像;确定所述预览图像对应的拍摄场景类型;根据所述拍摄场景类型,确定所述预览图像对应的AR信息;在所述预览图像上,显示所述AR信息。本发明可提高图像拍摄效果。
-
-
-
-
-
-
-
-
-