-
公开(公告)号:CN111723235B
公开(公告)日:2023-09-26
申请号:CN201910208192.8
申请日:2019-03-19
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 王群
IPC: G06F16/638 , G06F16/61 , G06F16/635 , G06F16/9538
Abstract: 本发明提出了一种音乐内容识别方法、装置及设备,其中,方法包括:获取当前浏览页面的音频内容,并提取音频内容的特征信息;将特征信息与预设的音乐索引进行匹配,根据匹配结果获取与音频内容对应的音乐识别结果并展示。由此,实现了从浏览页面中识别音乐内容,使用户可以在浏览网页或观看视频时获取正在播放的音乐的信息。
-
公开(公告)号:CN110503725B
公开(公告)日:2023-07-14
申请号:CN201910799607.3
申请日:2019-08-27
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 王群
Abstract: 本申请公开了一种图像处理的方法、装置、电子设备及计算机可读存储介质,涉及计算机视觉领域。图像处理的方法的具体实现方案为:对待处理视频的帧图像进行目标检测,得到目标区域;获取目标区域外的颜色;根据目标区域外的颜色,提取出目标区域内的目标图像;将目标图像作为图层,叠加到真实场景图像所在的图层中。克服了现有技术需要对每一个显示场景进行单独制作技术问题,进而达到降低现有技术中制作需要进行逐个显示个体与显示场景的制作成本,可以快速的实现将图像人物与真实场景的结合技术效果。降低现有技术的制作成本。无需对每一个显示场景进行制作,可以快速的实现将图像人物与真实场景的结合。
-
公开(公告)号:CN111859874B
公开(公告)日:2023-06-13
申请号:CN201910309639.0
申请日:2019-04-17
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 王群
IPC: G06F40/174 , G06V20/40 , G06V30/413 , G06V30/414
Abstract: 本公开提供了一种表格生成方法,包括:根据用户在视频图像上的绘制操作生成相应的虚拟表格框架,所述虚拟表格框架具有多个虚拟单元格;对所述虚拟表格框架进行规范化处理,以生成规范表格框架,所述规范表格框架具有多个规范单元格,所述规范单元格与所述虚拟单元格一一对应;对视频图像中各所述虚拟单元格所处区域内的内容进行文字识别处理,以提取出各所述虚拟单元格内的数据信息;将各所述虚拟单元格内的数据信息填充至对应的所述规范单元格中,以得到完整表格。本公开的技术方案可实现从视频图像中提取出数据表格或其他重要数据,并将这些数据填充于用户所希望的表格框架中,方便于用户后续进行展示、浏览和研究。
-
公开(公告)号:CN108874360B
公开(公告)日:2023-04-07
申请号:CN201810679316.6
申请日:2018-06-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F3/16 , G06F3/04815 , G06V20/20
Abstract: 本发明实施例提出一种全景内容定位方法和装置。该方法包括:对输入的控制语音进行语义分析,以确定用户需求,用户需求包括用户需要操作的操作页面、操作对象和操作类型中的至少一项;如果用户需求为对全景内容的当前页面进行操作,则对所述当前页面进行图像识别,以在当前页面中查找是否有与操作对象匹配的实体;如果在当前页面中有与操作对象匹配的实体,则在当前页面中根据交互行为规则和操作类型操作匹配的实体。本发明实施例为给提供用户一种更自然、智能的交互体验,弥补了语音在全景浏览这一块的空白,节省用户的使用步长,更精准地满足用户需求。
-
公开(公告)号:CN108961422B
公开(公告)日:2023-02-14
申请号:CN201810677886.1
申请日:2018-06-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T19/00 , G06V10/74 , G06V10/774
Abstract: 本发明实施例提出一种三维模型的标记方法和装置。该方法包括:根据已标注的样本图像,采用机器学习算法进行训练得到标记定位规则;其中,已标注的样本图像中标注了各种三维模型的类别信息对应的标记信息,标记定位规则包括三维模型的类别信息、二维图像的场景特征信息和标记位置的对应关系;采用标记定位规则对待标记图像和待显示三维模型的类别信息进行匹配,得到待显示三维模型在待标记图像中的标记位置。本发明实施例针对不同类别的模型和图像场景准确地产生标记,有利于更加准确和自然地显示模型初始化位置,产生的标记也更加符合三维模型和待标记图像的特点。
-
公开(公告)号:CN110532415B
公开(公告)日:2022-08-30
申请号:CN201910812737.6
申请日:2019-08-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/583 , G06V10/74 , G06T7/11
Abstract: 本申请公开了图像搜索处理方法、装置、设备及存储介质,涉及图像处理技术领域。本方法的实现方案包括:响应于接收到的图像搜索指令,获取所述图像搜索指令中的待识别图像,所述待识别图像包括至少一个第一图像主体,所述第一图像主体是以下任意一种:文字、示意图和图片;对每一个所述第一图像主体进行定位处理,得到每一个所述第一图像主体在所述待识别图像中的第一位置信息,并对每一个所述第一图像主体进行内容识别处理,得到每一个所述第一图像主体的识别结果;根据每一个所述第一图像主体的第一位置信息和识别结果,确定并显示与所述待识别图像匹配的图像组。本方法具有图像搜索适用范围广泛,搜索方式灵活,图像搜索结果精度高的有益特点。
-
公开(公告)号:CN109522449B
公开(公告)日:2021-11-30
申请号:CN201811136192.3
申请日:2018-09-28
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 王群
IPC: G06F16/73 , G06F16/951
Abstract: 本发明提供一种搜索方法和装置。该方法包括:服务器接收终端发送的至少两个有效视频帧,所述至少两个有效视频帧是所述终端从获取到的视频流中提取的,所述至少两个有效视频帧中每个有效视频帧对应的拍摄角度不同;所述服务器对所述至少两个有效视频帧进行识别,得到至少两个识别结果,所述至少两个有效视频帧和所述至少两个识别结果一一对应;所述服务器根据所述至少两个识别结果,得到目标识别结果;所述服务器根据所述目标识别结果,获取搜索结果;所述服务器将所述搜索结果发送给所述终端。提高了识别准确度。
-
公开(公告)号:CN109525877B
公开(公告)日:2021-04-20
申请号:CN201811215133.5
申请日:2018-10-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/426 , H04N21/431 , H04N21/44 , H04N21/466 , H04N21/4722
Abstract: 本发明提供一种基于视频的信息获取方法和装置,所述方法包括:终端设备检测当前播放的视频画面中的主体,从视频画面中截取主体的图像,根据主体的图像获取主体的相关信息,同屏显示主体的相关信息和视频画面。终端设备通过主动检测视频画面中的主体,并触发获取主体的相关信息显示给用户,就能够主动为用户推荐视频中的主体的相关内容,不需要用户进行任何操作,提高了用户体验。
-
公开(公告)号:CN110489674B
公开(公告)日:2020-11-06
申请号:CN201910591159.8
申请日:2019-07-02
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 王群
IPC: G06F16/9538 , G06F16/958 , G06F16/957 , G06K9/00 , G10L13/00
Abstract: 本发明实施例提供一种页面处理方法、装置及设备,该方法包括:在当前页面中获取待处理的第一图像;获取所述第一图像的图像信息,并在所述第一图像中提取文本信息,所述图像信息包括所述第一图像所显示对象的对象类别;根据所述图像信息和所述文本信息,确定所述第一图像的介绍信息,并语音播放所述介绍信息。提高了页面处理的可靠性。
-
公开(公告)号:CN111859874A
公开(公告)日:2020-10-30
申请号:CN201910309639.0
申请日:2019-04-17
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 王群
IPC: G06F40/174 , G06K9/00
Abstract: 本公开提供了一种表格生成方法,包括:根据用户在视频图像上的绘制操作生成相应的虚拟表格框架,所述虚拟表格框架具有多个虚拟单元格;对所述虚拟表格框架进行规范化处理,以生成规范表格框架,所述规范表格框架具有多个规范单元格,所述规范单元格与所述虚拟单元格一一对应;对视频图像中各所述虚拟单元格所处区域内的内容进行文字识别处理,以提取出各所述虚拟单元格内的数据信息;将各所述虚拟单元格内的数据信息填充至对应的所述规范单元格中,以得到完整表格。本公开的技术方案可实现从视频图像中提取出数据表格或其他重要数据,并将这些数据填充于用户所希望的表格框架中,方便于用户后续进行展示、浏览和研究。
-
-
-
-
-
-
-
-
-