-
公开(公告)号:CN112950672A
公开(公告)日:2021-06-11
申请号:CN202110237261.5
申请日:2021-03-03
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开公开了确定关键点的位置的方法、装置、电子设备和计算机可读存储介质,涉及计算机领域,尤其涉及人工智能领域。具体提供了一种确定关键点的位置的方法。该方法可以包括确定被检测对象的关键点在视频的当前帧中的当前位置信息。进而,可以基于所述视频的先前帧和所述当前帧确定与所述被检测对象的移速相关联的速度信息。此外,该方法可以包括基于所述速度信息、所述当前位置信息以及所述关键点在所述先前帧中的经低通滤波的先前位置信息,对所述当前位置信息进行低通滤波,以确定所述关键点的经低通滤波的所述当前位置信息。以此方式,本公开的技术方案可以解决关键点抖动问题,同时还可以减轻甚至避免“迟滞”跟踪的现象。
-
公开(公告)号:CN109558505A
公开(公告)日:2019-04-02
申请号:CN201811392516.X
申请日:2018-11-21
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/53
Abstract: 本申请提出一种视觉搜索方法、装置、计算机设备及存储介质,其中,方法包括:接收第i帧图像,其中,i为正整数;提取所述第i帧图像中主体的位置和类别,并生成所述主体对应的检测框;在所述第i帧图像的后续帧图像中根据所述第i帧图像中主体的位置对所述主体进行跟踪,并根据所述跟踪结果对所述检测框进行调整。通过本方法,能够实现视频流中主体的跟踪,提高视觉搜索的连贯性,解决现有技术中视觉搜索无法对实时视频流中的主体进行识别并跟踪的技术问题。
-
公开(公告)号:CN109344899A
公开(公告)日:2019-02-15
申请号:CN201811158003.2
申请日:2018-09-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06K9/62
Abstract: 本申请提出一种多目标检测方法、装置和电子设备,其中,多目标检测方法包括:根据目标生成多个检测框;获取所述多个检测框的分类概率;根据所述多个检测框的分类概率分别生成所述多个检测框的置信度,并获取所述多个检测框的稳定度;以及根据所述多个检测框的置信度和稳定度对所述多个检测框进行筛选。该方法能够有效利用电子设备的计算资源,通过检测框实时且稳定地检测出有意义的目标,从而可以降低服务器侧的资源占用,降低用户的流量消耗,提升用户在相关应用场景的使用体验。
-
公开(公告)号:CN112950672B
公开(公告)日:2023-09-19
申请号:CN202110237261.5
申请日:2021-03-03
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开公开了确定关键点的位置的方法、装置、电子设备和计算机可读存储介质,涉及计算机领域,尤其涉及人工智能领域。具体提供了一种确定关键点的位置的方法。该方法可以包括确定被检测对象的关键点在视频的当前帧中的当前位置信息。进而,可以基于所述视频的先前帧和所述当前帧确定与所述被检测对象的移速相关联的速度信息。此外,该方法可以包括基于所述速度信息、所述当前位置信息以及所述关键点在所述先前帧中的经低通滤波的先前位置信息,对所述当前位置信息进行低通滤波,以确定所述关键点的经低通滤波的所述当前位置信息。以此方式,本公开的技术方案可以解决关键点抖动问题,同时还可以减轻甚至避免“迟滞”跟踪的现象。
-
公开(公告)号:CN109344899B
公开(公告)日:2022-05-17
申请号:CN201811158003.2
申请日:2018-09-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V10/764 , G06V10/774 , G06K9/62
Abstract: 本申请提出一种多目标检测方法、装置和电子设备,其中,多目标检测方法包括:根据目标生成多个检测框;获取所述多个检测框的分类概率;根据所述多个检测框的分类概率分别生成所述多个检测框的置信度,并获取所述多个检测框的稳定度;以及根据所述多个检测框的置信度和稳定度对所述多个检测框进行筛选。该方法能够有效利用电子设备的计算资源,通过检测框实时且稳定地检测出有意义的目标,从而可以降低服务器侧的资源占用,降低用户的流量消耗,提升用户在相关应用场景的使用体验。
-
公开(公告)号:CN113793255A
公开(公告)日:2021-12-14
申请号:CN202111056671.6
申请日:2021-09-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T3/00
Abstract: 根据本公开的示例实施例,提供了用于图像处理的方法、装置、设备、存储介质和程序产品。用于图像处理的方法包括获取针对二维图像的输入信息,输入信息至少包括二维图像的深度信息;利用二维图像和输入信息,获取与二维图像的各像素相对应的三维点云;以及基于目标二维像素所对应的三维点云中的点、以及与目标二维像素相邻的一组像素的所对应的三维点云中的相邻点集合,生成针对二维图像的三维图像。以此方式,能够通过二维照片实现三维模型的构建,具有良好的普遍性和通用性,由此能够大幅提升用户的沉浸式和交互式体验。
-
公开(公告)号:CN112417208A
公开(公告)日:2021-02-26
申请号:CN202011312237.5
申请日:2020-11-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/738 , G06F16/783
Abstract: 根据本公开的示例实施例,提供了一种目标搜索方法、装置、电子设备和计算机可读存储介质,可以用于视觉搜索领域中。目标搜索方法包括:确定视频流中的搜索目标;基于视频流,确定搜索目标在三维坐标系中的三维坐标集合;确定与搜索目标相关联的搜索结果;以及基于三维坐标集合,在视频流中与搜索目标相关联地显示搜索结果。利用上述方法,可以实现搜索结果紧贴搜索目标表面、搜索结果呈现“近大远小”的效果。此外,搜索结果可以拥有固定的物理方向朝向,从而使得当视频采集设备移动时,搜索结果的物理朝向不随着视频采集设备的移动而发生改变。同时,可以通过移动来查看被遮挡的其它搜索结果。
-
公开(公告)号:CN111008305A
公开(公告)日:2020-04-14
申请号:CN201911204967.0
申请日:2019-11-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/783 , G06T7/246
Abstract: 本申请公开了一种视觉搜索方法、装置以及电子设备,涉及图像处理技术领域。具体实现方案为:确定视觉搜索流程中的第一对象,第一对象在视觉搜索流程中的功耗大于视觉搜索流程中的第二对象的功耗,第一对象包括程序和算法中的至少一项,第二对象包括程序和算法至少一项;采用第一对象的优化对象进行视觉搜索,优化对象运算速度高于第一对象运算速度,和/或,优化对象在单位时间内的总运算次数少于第一对象在单位时间内的总运算次数。由于优化对象运算速度高于第一对象运算速度,和/或,优化对象在单位时间内的总运算次数少于第一对象在单位时间内的总运算次数,可提高视觉搜索的运算速度或/和减少视觉搜索过程中的运算次数,从而可减少功耗。
-
公开(公告)号:CN112417208B
公开(公告)日:2024-08-13
申请号:CN202011312237.5
申请日:2020-11-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/738 , G06F16/783
Abstract: 根据本公开的示例实施例,提供了一种目标搜索方法、装置、电子设备、存储介质和程序产品,可以用于视觉搜索领域中。目标搜索方法包括:确定视频流中的搜索目标;基于视频流,确定搜索目标在三维坐标系中的三维坐标集合;确定与搜索目标相关联的搜索结果;以及基于三维坐标集合,在视频流中与搜索目标相关联地显示搜索结果。利用上述方法,可以实现搜索结果紧贴搜索目标表面、搜索结果呈现“近大远小”的效果。此外,搜索结果可以拥有固定的物理方向朝向,从而使得当视频采集设备移动时,搜索结果的物理朝向不随着视频采集设备的移动而发生改变。同时,可以通过移动来查看被遮挡的其它搜索结果。
-
公开(公告)号:CN110929093B
公开(公告)日:2023-08-11
申请号:CN201911142528.1
申请日:2019-11-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/73
Abstract: 本申请公开了搜索控制的方法、装置、设备和介质,涉及视觉搜索领域。一种用于搜索控制的方法包括从由电子设备采集到的视频中获取目标时刻的第一帧和与第一帧邻近的第二帧;确定第一帧与第二帧之间的位移幅度;以及基于位移幅度与第一预定阈值的比较来确定用户对第一帧的搜索意图。由此,可以从视频中准确、快速判断用户对位移程度较低、稳定性较好的帧的搜索意图,降低用户在具有搜索意图时的等待时间,并且可以在用户具有搜索意图时利用更稳定、图像质量更好的帧用于执行视觉搜索,提高搜索结果的质量。
-
-
-
-
-
-
-
-
-