-
公开(公告)号:CN101984435B
公开(公告)日:2012-10-10
申请号:CN201010549183.4
申请日:2010-11-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种对文本进行分发的方法和装置,应用于包含至少两级栏目的栏目框架,其中方法包括:A、针对抓取的各文本分别执行下述分发步骤,分发步骤:将当前待分发文本的关键词与各栏目的中心向量进行相似度匹配,根据匹配结果,将当前待分发文本分发至满足分发匹配策略的栏目下;其中,所述栏目的中心向量基于预先为该栏目设置的种子词生成;B、按照各栏目之间的层级关系,将设定栏目下文本的全部或部分分发至上一级父栏目或下一级子栏目。通过本发明能够减小文本分发的工作量和代价,缩短文本分发的时长,以方便栏目的灵活增减。
-
公开(公告)号:CN101984435A
公开(公告)日:2011-03-09
申请号:CN201010549183.4
申请日:2010-11-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种对文本进行分发的方法和装置,应用于包含至少两级栏目的栏目框架,其中方法包括:A、针对抓取的各文本分别执行下述分发步骤,分发步骤:将当前待分发文本的关键词与各栏目的中心向量进行相似度匹配,根据匹配结果,将当前待分发文本分发至满足分发匹配策略的栏目下;其中,所述栏目的中心向量基于预先为该栏目设置的种子词生成;B、按照各栏目之间的层级关系,将设定栏目下文本的全部或部分分发至上一级父栏目或下一级子栏目。通过本发明能够减小文本分发的工作量和代价,缩短文本分发的时长,以方便栏目的灵活增减。
-