-
公开(公告)号:CN105677764B
公开(公告)日:2020-05-08
申请号:CN201511022937.X
申请日:2015-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/951 , G06F16/957
Abstract: 本申请公开了信息提取方法和装置。所述方法的一具体实施方式包括:将预先获取的网页文件解析为标签树结构,并从所述标签树的节点中识别出所述网页文件中的网页正文所在的至少一个正文节点;将所述至少一个正文节点包含的内容进行段落划分,生成各个段落块,并根据各个段落块关联的标签的属性为各个段落块设定标签属性;基于各个段落块的标签属性将各个段落块包含的文本内容进行分类;基于分类结果从段落块包含的文本内容中提取包含问题和答案的信息。该实施方式实现了信息自动、精确的提取。
-
公开(公告)号:CN104537072B
公开(公告)日:2019-03-12
申请号:CN201410843836.8
申请日:2014-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/35 , G06F16/332
Abstract: 本发明提出一种搜索方法和装置,该搜索方法包括接收客户端发送的当前搜索词;获取与所述当前搜索词对应的图片可表词集合,并根据所述图片可表词集合获取对应的图片结果;将所述图片结果发送给所述客户端。该方法能够提高搜索结果的信息表达效果。
-
公开(公告)号:CN108399167B
公开(公告)日:2022-04-29
申请号:CN201710064455.3
申请日:2017-02-04
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/957 , G06F16/951 , G06F16/955 , G06K9/62
Abstract: 本申请提出一种网页信息提取方法和装置,该方法包括:获取待提取网页的源代码和视觉信息;根据所述源代码和视觉信息,确定所述待提取网页中的区块信息;对所述区块信息进行聚类,提取所述待提取网页中的结构化信息。该方法能够提取到更有效的信息,进而可以在有限空间上展示更有效的信息,提高展示效率,降低成本。
-
公开(公告)号:CN104504110B
公开(公告)日:2019-05-03
申请号:CN201410843805.2
申请日:2014-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/953
Abstract: 本发明提出一种搜索方法和装置,该搜索方法包括接收客户端发送的当前搜索词;获取所述当前搜索词中包括的图片可表词,并根据所述图片可表词获取对应的图片结果;将所述图片结果发送给所述客户端。该方法能够提高搜索结果的信息表达效果。
-
公开(公告)号:CN104504108B
公开(公告)日:2018-07-13
申请号:CN201410843273.2
申请日:2014-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30253 , G06F17/30247 , G06F17/30265 , G06F17/30268 , G06F17/30274 , G06F17/3028 , G06F17/30864 , G06F17/30899
Abstract: 本发明公开了一种信息搜索方法及装置,其中,信息搜索方法包括:获得当前关键词;获得与当前关键词相关的物料信息,物料信息包括图片片段、文字片段和/或图像实体;以及将物料信息合成为图片,以用于在搜索结果页中展现图片。上述信息搜索方法及装置,通过获得与当前关键词相关的物料信息,使得获得的物料信息与当前关键词的相关性较高,通过将获得的物料信息进行合成,可以提高图片的质量和信息量,从而可以大大提升用户浏览信息的速度,以方便用户尽快地从众多信息中获取到自己所需的信息。
-
-
公开(公告)号:CN104537072A
公开(公告)日:2015-04-22
申请号:CN201410843836.8
申请日:2014-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明提出一种搜索方法和装置,该搜索方法包括接收客户端发送的当前搜索词;获取与所述当前搜索词对应的图片可表词集合,并根据所述图片可表词集合获取对应的图片结果;将所述图片结果发送给所述客户端。该方法能够提高搜索结果的信息表达效果。
-
公开(公告)号:CN104504104A
公开(公告)日:2015-04-08
申请号:CN201410841895.1
申请日:2014-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30899
Abstract: 本发明提出一种用于搜索引擎的图片物料处理方法、装置和搜索引擎,其中,该用于搜索引擎的图片物料处理方法,包括以下步骤:获取源图片物料;对源图片物料进行过滤以生成待处理图片物料;对待处理图片物料进行特征提取以生成待处理图片物料对应的信息特征;根据待处理图片物料对应的信息特征确定待处理图片物料的目标区域;以及根据目标区域对待处理图片物料进行处理以生成图片。本发明的用于搜索引擎的图片物料处理方法,通过利用深度学习处理技术对待处理图片进行处理后可为搜索引擎提供充足、丰富且高质量的图片物料,能够适应不同的搜索引擎产品规范和要求、满足网民对高质量的图片的需求。
-
公开(公告)号:CN119132319A
公开(公告)日:2024-12-13
申请号:CN202411237858.X
申请日:2024-09-04
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L21/007 , G10L17/04 , G10L25/63
Abstract: 本公开提供了一种克隆音生成方法,涉及语音处理技术领域,尤其涉及声音克隆技术领域。具体实现方案为:响应于应用客户端发送的克隆音合成请求,获取克隆音合成请求携带的克隆音标识和待合成内容,并根据克隆音标识确定对应的声音克隆模型;基于待合成内容和声音克隆模型得到待合成内容对应的克隆音合成数据,并将克隆音合成数据返回给应用客户端,其中,应用客户端被配置为接收并应用克隆音合成数据;声音克隆模型根据以下方式得到:将采集客户端采集并发送的用户的声音样本作为训练数据,输入初始声音克隆模型进行训练,得到与用户的声音样本对应的声音克隆模型,其中,声音克隆模型用于输出与用户的声音样本的音色相近的克隆音合成数据。
-
公开(公告)号:CN104504104B
公开(公告)日:2018-09-07
申请号:CN201410841895.1
申请日:2014-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提出一种用于搜索引擎的图片物料处理方法、装置和搜索引擎,其中,该用于搜索引擎的图片物料处理方法,包括以下步骤:获取源图片物料;对源图片物料进行过滤以生成待处理图片物料;对待处理图片物料进行特征提取以生成待处理图片物料对应的信息特征;根据待处理图片物料对应的信息特征确定待处理图片物料的目标区域;以及根据目标区域对待处理图片物料进行处理以生成图片。本发明的用于搜索引擎的图片物料处理方法,通过利用深度学习处理技术对待处理图片进行处理后可为搜索引擎提供充足、丰富且高质量的图片物料,能够适应不同的搜索引擎产品规范和要求、满足网民对高质量的图片的需求。
-
-
-
-
-
-
-
-
-