-
公开(公告)号:CN101984435B
公开(公告)日:2012-10-10
申请号:CN201010549183.4
申请日:2010-11-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种对文本进行分发的方法和装置,应用于包含至少两级栏目的栏目框架,其中方法包括:A、针对抓取的各文本分别执行下述分发步骤,分发步骤:将当前待分发文本的关键词与各栏目的中心向量进行相似度匹配,根据匹配结果,将当前待分发文本分发至满足分发匹配策略的栏目下;其中,所述栏目的中心向量基于预先为该栏目设置的种子词生成;B、按照各栏目之间的层级关系,将设定栏目下文本的全部或部分分发至上一级父栏目或下一级子栏目。通过本发明能够减小文本分发的工作量和代价,缩短文本分发的时长,以方便栏目的灵活增减。
-
公开(公告)号:CN104978368A
公开(公告)日:2015-10-14
申请号:CN201410148403.0
申请日:2014-04-14
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明的目的是提供一种用于提供推荐信息的方法和装置。根据本发明的方法包括以下步骤:根据一个或多个网页中的一项或多项内容信息,分别确定所述一项或多项内容信息是否可作为推荐信息;当所述内容信息为推荐信息时,获取所述推荐信息的特征信息的装置;根据各个推荐信息的特征信息,确定所述各个推荐信息的排序信息;其中,所述方法还包括以下步骤:当用户对网页的浏览操作对应至少一个推荐信息时,展现所述至少一个推荐信息。
-
公开(公告)号:CN101984435A
公开(公告)日:2011-03-09
申请号:CN201010549183.4
申请日:2010-11-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种对文本进行分发的方法和装置,应用于包含至少两级栏目的栏目框架,其中方法包括:A、针对抓取的各文本分别执行下述分发步骤,分发步骤:将当前待分发文本的关键词与各栏目的中心向量进行相似度匹配,根据匹配结果,将当前待分发文本分发至满足分发匹配策略的栏目下;其中,所述栏目的中心向量基于预先为该栏目设置的种子词生成;B、按照各栏目之间的层级关系,将设定栏目下文本的全部或部分分发至上一级父栏目或下一级子栏目。通过本发明能够减小文本分发的工作量和代价,缩短文本分发的时长,以方便栏目的灵活增减。
-
公开(公告)号:CN101984423A
公开(公告)日:2011-03-09
申请号:CN201010514487.7
申请日:2010-10-21
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种热搜词生成方法及系统,涉及信息处理领域,用以解决现有技术未将搜索请求Query热搜词与垂直门户网页关联,用户的搜索体验有待提升的问题。方法包括:对用户向搜索引擎发起的搜索请求进行存储;对搜索请求进行聚类运算,得出搜索请求簇;确定搜索请求簇中最热门的搜索请求;在垂直门户网页中搜索上述最热门的搜索请求,得出与该搜索请求相匹配的网页数量;取上述网页数量大于第一阈值时所关联的搜索请求簇,并从该搜索请求簇中挑选热搜词。系统包括:搜索请求存储模块,聚类模块,验证模块,页面搜索模块和挑选模块。本发明将搜索请求热搜词和垂直门户网页进行验证,可辨别出新闻或事件相关的搜索请求热搜词。
-
公开(公告)号:CN105354286A
公开(公告)日:2016-02-24
申请号:CN201510729112.5
申请日:2015-10-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明提出一种规章类问题的查询方法和装置,该规章类问题的查询方法包括:获取可供选择的数据,所述可供选择的数据包括如下项中的一项或多项:规章知识库提供的数据、客服系统提供的数据;接收用户输入的规章类问题,根据所述规章类问题和所述可供选择的数据,进行如下处理中的一项或多项:查询、推理、服务匹配,得到查询结果或多轮交互信息;通过用户界面将所述查询结果或多轮交互信息展示给用户。该方法能够更好的满足用户对规章类问题的查询需求。
-
公开(公告)号:CN104915399A
公开(公告)日:2015-09-16
申请号:CN201510290279.6
申请日:2015-05-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F16/9535 , G06F16/951
Abstract: 本发明公开了一种基于新闻标题的推荐数据处理方法,所述方法包括:从网页中识别与实体对相关的新闻标题;计算所述实体对的关键词集合;从所述新闻标题中截取文本片段,得到带时间信息的文本片段集合,提取所述文本片段集合中各文本片段的第一特征值;计算所述文本片段集合中各个文本片段的语义向量,根据所述语义向量提取得到所述各个文本片段的第二特征值;根据用户的点击数据,将所述第一特征值和所述第二特征值拟合得到推荐理由排序。通过采用本发明,可解决现有技术中网页智能推荐理由缺乏趣味性的问题,同时使推荐理由兼顾准确性和吸引力。
-
公开(公告)号:CN102004792B
公开(公告)日:2012-10-10
申请号:CN201010585538.5
申请日:2010-12-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种热搜词的生成方法和装置,其中方法包括:对抓取到的新闻页面进行聚类,形成各新闻簇;确定所述新闻簇中的热点新闻簇;从所述热点新闻簇的新闻页面中提取核心词;按照提取的核心词对应的搜索效果确定出热搜词,其中所述热搜词覆盖所述提取出的核心词中的一个或多个。本发明能够实现热搜词的自动生成,无需人工干预,降低了人为工作量,并且不再依赖编辑人员对热点事件的敏感度,提高了热搜词的准确性。
-
公开(公告)号:CN101984423B
公开(公告)日:2012-07-04
申请号:CN201010514487.7
申请日:2010-10-21
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种热搜词生成方法及系统,涉及信息处理领域,用以解决现有技术未将搜索请求Query热搜词与垂直门户网页关联,用户的搜索体验有待提升的问题。方法包括:对用户向搜索引擎发起的搜索请求进行存储;对搜索请求进行聚类运算,得出搜索请求簇;确定搜索请求簇中最热门的搜索请求;在垂直门户网页中搜索上述最热门的搜索请求,得出与该搜索请求相匹配的网页数量;取上述网页数量大于第一阈值时所关联的搜索请求簇,并从该搜索请求簇中挑选热搜词。系统包括:搜索请求存储模块,聚类模块,验证模块,页面搜索模块和挑选模块。本发明将搜索请求热搜词和垂直门户网页进行验证,可辨别出新闻或事件相关的搜索请求热搜词。
-
公开(公告)号:CN102004792A
公开(公告)日:2011-04-06
申请号:CN201010585538.5
申请日:2010-12-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种热搜词的生成方法和装置,其中方法包括:对抓取到的新闻页面进行聚类,形成各新闻簇;确定所述新闻簇中的热点新闻簇;从所述热点新闻簇的新闻页面中提取核心词;按照提取的核心词对应的搜索效果确定出热搜词,其中所述热搜词覆盖所述提取出的核心词中的一个或多个。本发明能够实现热搜词的自动生成,无需人工干预,降低了人为工作量,并且不再依赖编辑人员对热点事件的敏感度,提高了热搜词的准确性。
-
公开(公告)号:CN105095433B
公开(公告)日:2019-07-05
申请号:CN201510434989.1
申请日:2015-07-22
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535
Abstract: 本发明实施例公开了一种实体推荐方法及装置。其中,所述方法包括:接收用户通过文字输入方式或语音输入方式输入的搜索语句,识别所述搜索语句中包含的搜索实体;根据预先创建的实体关联关系网,获取所述搜索实体的N阶相关实体,其中所述N阶相关实体中的第一阶相关实体为同所述搜索实体具有直接关联关系的实体,第i阶相关实体为同第i‑1阶相关实体具有直接关联关系的实体,所述N为大于1的自然数,所述i大于2小于或等于N;将获取的各阶相关实体进行展现。本发明实施例提供的技术方案,可以提高推荐实体与搜索语句中包含的实体之间的相关度,增强推荐实体的可解释性。
-
-
-
-
-
-
-
-
-