-
公开(公告)号:CN105677764B
公开(公告)日:2020-05-08
申请号:CN201511022937.X
申请日:2015-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/951 , G06F16/957
Abstract: 本申请公开了信息提取方法和装置。所述方法的一具体实施方式包括:将预先获取的网页文件解析为标签树结构,并从所述标签树的节点中识别出所述网页文件中的网页正文所在的至少一个正文节点;将所述至少一个正文节点包含的内容进行段落划分,生成各个段落块,并根据各个段落块关联的标签的属性为各个段落块设定标签属性;基于各个段落块的标签属性将各个段落块包含的文本内容进行分类;基于分类结果从段落块包含的文本内容中提取包含问题和答案的信息。该实施方式实现了信息自动、精确的提取。
-
公开(公告)号:CN105677927B
公开(公告)日:2019-04-12
申请号:CN201610200781.8
申请日:2016-03-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535
Abstract: 本申请公开了用于提供搜索结果的方法和装置。所述方法的一具体实施方式包括:获取用户输入的查询关键词以及用户的特征信息;根据所述查询关键词和所述特征信息确定所述用户的需求信息;基于所述查询关键词和所述需求信息进行搜索,得出至少一个待展示网页;以及根据所述至少一个待展示网页生成交互式对话。该实施方式能够为用户提供包含关键内容的个性化搜索结果,减少了搜索结果中的冗余信息,缩短了用户获取信息的时间。
-
公开(公告)号:CN104537072B
公开(公告)日:2019-03-12
申请号:CN201410843836.8
申请日:2014-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/35 , G06F16/332
Abstract: 本发明提出一种搜索方法和装置,该搜索方法包括接收客户端发送的当前搜索词;获取与所述当前搜索词对应的图片可表词集合,并根据所述图片可表词集合获取对应的图片结果;将所述图片结果发送给所述客户端。该方法能够提高搜索结果的信息表达效果。
-
公开(公告)号:CN108540508A
公开(公告)日:2018-09-14
申请号:CN201710119807.0
申请日:2017-03-02
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了用于推送信息的方法、装置和设备。该方法的一具体实施方式包括:接收用户通过终端输入的搜索信息;获取与搜索信息匹配的自然搜索结果集合和自然搜索结果集合的历史点击记录;根据历史点击记录确定是否向终端推送待推送信息;若确定向终端推送待推送信息,则获取与搜索信息匹配的待推送信息集合,并向终端推送自然搜索结果集合和待推送信息集合。该实施方式实现了有针对性地信息推送,提高推送的信息的点击率。
-
公开(公告)号:CN107742128A
公开(公告)日:2018-02-27
申请号:CN201710984693.6
申请日:2017-10-20
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06K9/6268 , G06F17/30268 , G06F17/30705 , G06K9/46
Abstract: 本申请实施例公开了用于输出信息的方法和装置。该方法的一具体实施方式包括:获取待分类图像;提取所述待分类图像的特征信息;将所述特征信息导入预先建立的图像分类模型,得到所述待分类图像的行业标签信息,并输出得到的行业标签信息,其中,所述图像分类模型用于表征图像的特征信息与行业标签信息之间的对应关系,所述图像分类模型为包括残差神经网络的深度神经网络模型。该实施方式通过使用图像分类模型,提高了所生成的、待分类图像的行业标签信息的准确性。
-
公开(公告)号:CN104504712B
公开(公告)日:2017-08-18
申请号:CN201410842993.7
申请日:2014-12-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种图片处理方法和装置,该图片处理方法包括获取待处理的图片;识别所述图片是否是拼接图;如果所述图片是拼接图,根据预设的拼接图分割算法,对所述图片进行分割,得到组成所述图片的子图片。该图片处理方法能够识别出拼接图,并按照拼接图的处理方式处理拼接图,从而实现根据图片类别的不同选择对应的处理方式,提高处理效果。
-
公开(公告)号:CN106326386A
公开(公告)日:2017-01-11
申请号:CN201610677187.8
申请日:2016-08-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F16/9038 , G06F16/951
Abstract: 本申请提出一种搜索结果的展示方法和装置,该搜索结果的展示方法包括:接收查询词;获取与所述查询词对应的搜索结果;根据所述查询词识别用户意图;根据所述用户意图和所述搜索结果,得到更新后的搜索结果;展示所述更新后的搜索结果。该方法能够实现搜索结果中内容的动态更新,更好的满足用户需求。
-
公开(公告)号:CN104504109A
公开(公告)日:2015-04-08
申请号:CN201410843496.9
申请日:2014-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30 , G06F17/3025
Abstract: 本发明提出一种图片搜索方法和装置,该图片搜索方法包括:接收用户输入的搜索关键词;根据所述搜索关键词在预先建立的图片文本信息的索引中进行搜索,获得与所述搜索关键词匹配的索引;所述图片文本信息包括对搜索引擎抓取的图片进行内容分析获得的文本信息;获得与所述搜索关键词匹配的索引对应的图片,并将所述图片显示给所述用户。本发明可以通过对图片进行内容分析,增加图片文本信息的描述,从而可以在用户搜索时返回更多更相关的图片,进而可以更好地满足用户的需求,提高用户体验度。
-
公开(公告)号:CN111737954B
公开(公告)日:2023-07-28
申请号:CN202010537008.7
申请日:2020-06-12
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/126 , G06F40/194 , G06F18/22 , G06N3/048 , G06N3/08
Abstract: 本申请公开了一种文本相似度确定方法、装置、设备和介质,涉及自然语言处理技术。具体实现方案为:利用孪生网络结构中的两个特征提取网络,分别对第一输入文本和第二输入文本进行编码,得到第一输入文本和第二输入文本的句嵌入,其中,特征提取网络是利用词在网络中各层表征并通过区分词在文本中的重要性对文本进行编码;通过计算第一输入文本和第二输入文本的句嵌入之间的相似度,确定第一输入文本和第二输入文本的相似度。本申请实施例利用孪生网络架构确定文本相似度,并且利用词在网络中各层表征并通过区分词在文本中的重要性对文本进行编码,使得编码后得到的句嵌入更加符合文本的语义信息,准确性更高,从而提高文本相似度判断的准确性。
-
公开(公告)号:CN108572971B
公开(公告)日:2022-11-01
申请号:CN201710138638.5
申请日:2017-03-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06F16/9538
Abstract: 本发明提供了一种用于挖掘与检索词相关的关键词的方法和装置,该方法包括:根据搜索引擎中的搜索日志信息,获得与检索词query具有高相关性的历史展现结果,其中,所述历史展现结果包括历史展现页面中所展现的针对query的历史搜索结果和/或与query相关的辅助展现结果;根据所述历史展现结果,生成与query相对应的至少一个聚合结果;从所述至少一个聚合结果中提取与query相关的关键词。根据本发明的方案,引入了用户历史搜索行为指导,且借鉴了海量历史搜索结果,较大程度地弥补了检索词本身的信息量不足的问题,从而利于挖掘出能够反映用户搜索意图的真正关键词。
-
-
-
-
-
-
-
-
-