-
公开(公告)号:CN108228835A
公开(公告)日:2018-06-29
申请号:CN201810008174.0
申请日:2018-01-04
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F16/739 , G06T7/60 , G06T11/60 , G06T2207/10016 , G06T2207/20081 , G06T2207/20084
Abstract: 本申请实施例公开了用于处理视频的方法和装置。该方法的一具体实施方式包括:通过提取目标视频的帧序列中的关键帧,以便对该关键帧进行多边形检测,而后响应于检测到该关键帧中存在多边形,将满足预设条件的多边形确定为目标多边形,然后从该帧序列中选取包含该目标多边形的帧进行针对帧中的目标多边形的信息添加处理。该实施方式实现了将信息嵌入视频的帧序列中。
-
公开(公告)号:CN109117742B
公开(公告)日:2022-12-27
申请号:CN201810805273.1
申请日:2018-07-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V40/20 , G06V40/10 , G06V10/764
Abstract: 本发明提供一种手势检测模型处理方法、装置、设备及存储介质,本发明的方法,通过获取训练集合,所述训练集合包括至少一组包括训练图像及训练图像的标注数据的训练数据;根据训练集合中各训练图像和训练图像的标注数据,对卷积神经网络进行训练,得到手势检测模型;通过将待检测图像输入手势检测模型,即可检测出待检测图像中手势的手势类型和位置,实现了对于不包括深度信息的待检测图像的手势识别,无需使用包含深度信息的硬件单元,降低了成本,且相较于现有技术采用聚类方法进行手势检测,本实施例通过卷积神经网络模型进行手势检测提高了手势检测的精度和效率。
-
公开(公告)号:CN108171260B
公开(公告)日:2022-02-11
申请号:CN201711352429.7
申请日:2017-12-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06K9/62
Abstract: 本申请提供一种图片识别方法及系统,所述方法包括:获取待识别的图片;将所述待识别的图片输入预先训练的图片识别模型,获取待识别的图片的预测类别标签;所述预先训练的图片识别模型采用卷积神经网络模型,且所述卷积神经网络模型包括输入层、卷积层、注意力分支、按元素操作层、池化层、全连接层和输出层;其中,注意力分支根据所述待识别的图片各区域的全局特征确定图片各区域的权重;按元素操作层用于根据图片各区域的权重对卷积层输出的图片的局部特征进行加权处理;根据所述待识别的图片的预测类别标签,识别所述待识别的图片的类别。解决了特定类型,例如图片主体区域过小或嵌套/拼接类图片的识别率较低的问题。
-
公开(公告)号:CN109388721B
公开(公告)日:2021-05-28
申请号:CN201811217665.2
申请日:2018-10-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/44 , G06F16/435 , G06F16/43 , G06F16/957 , G06F16/958
Abstract: 本发明提出了一种封面视频帧的确定方法和装置,其中,方法包括:提取文章文本的关键词,获取与各关键词对应的第一向量;提取文章视频中预设时段内每个视频帧的主体词,获取与各主体词对应的第二向量;根据各主体词对应的第二向量和各关键词对应的第一向量,计算每个视频帧与文章文本的相似度;根据每个视频帧与文章文本的相似度确定目标视频帧为封面视频帧。由此,实现了作为封面的视频帧与文章内容的一致的图文相符的效果,实现作为封面的视频帧与文章内容自动适配,提高了封面确定效率以及用户的点击率和浏览体验。
-
公开(公告)号:CN109063567B
公开(公告)日:2021-04-13
申请号:CN201810719692.3
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种人体识别方法、装置及存储介质,该方法包括:根据至少2个摄像头采集的包含目标人物的图像,确定目标人物在三维空间中的坐标;根据所述目标人物在三维空间中的坐标分别计算所述目标人物在不同摄像头下的反投影误差;根据摄像头的反投影误差确定所述摄像头是否存在人体识别错误;当存在人体识别错误时,采用行人重识别技术ReID重新对所述摄像头下的目标人物进行重新识别处理,直到所有包含所述目标人物的摄像头的反投影误差不大于预设阈值。本发明可以在人体重识别技术中引入人体的三维空间坐标来对图像的识别结果进行预判处理,并对存在识别错误的图像进行重识别,从而有效提高人体识别结果的准确率。
-
公开(公告)号:CN109215372B
公开(公告)日:2021-04-06
申请号:CN201811196662.5
申请日:2018-10-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G08G1/0968 , G01C21/32
Abstract: 本申请公开了一种路网信息更新方法、装置及设备,其中方法包括:根据获取的多个车辆的行驶轨迹,确定目标路段当前对应的第一张量;根据目标路段对应的路网数据,确定目标路段对应的第二张量;将第一张量及第二张量输入预设的网络模型,以确定第一张量与第二张量是否匹配;若第一张量与第二张量未匹配,则根据第一张量,对目标路段的路网数据进行更新处理。本申请实现了通过采集车辆的行车轨迹,对路网信息是否发生变化进行自动检测,并当路网信息发生变化时,自动对发生变化的部分进行更新,从而能够提高路网信息的更新效率、且能缩短周期,为用户的出行带来了便利。
-
公开(公告)号:CN109359687B
公开(公告)日:2020-11-24
申请号:CN201811220100.X
申请日:2018-10-19
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请提出一种视频风格转换处理方法和装置,其中,方法包括:根据样本图片的风格属性信息设置反映风格属性特征网络层的第一目标输出向量,根据当前输入视频帧的内容信息设置反映内容特征网络层的第二目标输出向量,根据当前输入视频帧的光流场信息设置反映光流场特征网络层的第三目标输出向量,根据第一目标输出向量、第二目标输出向量、第三目标输出向量训练目标模型中每个网络层的网络参数,根据满足预设训练条件时对应的目标网络参数和目标模型生成与样本图片对应的视频风格转换模型,以根据视频风格转换模型对目标视频进行转换处理生成与样本图片匹配的视频风格。由此,在确保视频流畅性的同时提高了视频风格转换处理的效率。
-
公开(公告)号:CN108921098B
公开(公告)日:2020-08-18
申请号:CN201810720374.9
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提供一种人体运动分析方法、装置、设备及存储介质。该方法包括:获取多个拍摄设备拍摄的图像信息,所述多个拍摄设备中至少有一个拍摄设备设置在货架上方;根据所述多个拍摄设备拍摄的图像信息进行人体跟踪,确定至少一个人体在空间中的位置信息和所述至少一个人体的标识信息;根据所述至少一个人体中目标人体在空间中的位置信息,获取与所述位置信息对应的货架上方的拍摄设备拍摄的目标图像;根据所述目标图像以及与所述位置信息对应的非视觉传感器的检测数据,对所述目标人体的动作进行识别。本发明实施例提高了人体跟踪的准确度,提高了人体动作识别精度。
-
公开(公告)号:CN108985206B
公开(公告)日:2020-07-28
申请号:CN201810723901.1
申请日:2018-07-04
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提供一种模型训练方法、人体识别方法、装置、设备及存储介质。该方法包括:获取用于训练人体识别模型的样本图像;在该样本图像依次经过该多个第一卷积层处理时,根据该每个第一卷积层输出的第一特征图,确定该每个第一卷积层对应的第二特征图;根据所述每个第一卷积层对应的第二特征图,以及所述每个第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框,检测所述样本图像中的人体区域或人体部位区域;根据检测出的人体区域或人体部位区域,以及该样本图像中标注的人体区域或人体部位区域,确定该人体识别模型的参数。本发明实施例提高了人体区域或人体部位区域的检测精度。
-
公开(公告)号:CN108090916B
公开(公告)日:2019-05-07
申请号:CN201711397545.0
申请日:2017-12-21
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了用于跟踪视频中的目标图形的方法和装置。该方法的一具体实施方式包括:在目标视频的上一帧图像中确定目标图形的角点的位置信息和相邻的角点构成的第一边的参数信息;跟踪上一帧图像中的各角点获得当前帧图像中的目标图形的各角点的位置信息以确定第二边的参数信息;响应于确定第一边和第二边的相似度小于第一预设阈值,对各第一边的参数信息进行预测以获取预测的参数信息,并根据预测的参数信息生成多个候选目标图形;根据多个候选目标图形的图像特征确定目标图形在当前帧图像中的最终位置。该实施方式通过融合目标图形的角点和边的特征实现目标图形的追踪,并对追踪不准确的结果进行优化,提高了目标图形追踪的准确性。
-
-
-
-
-
-
-
-
-