-
公开(公告)号:CN103559264B
公开(公告)日:2017-02-08
申请号:CN201310538080.1
申请日:2013-11-04
Applicant: 北京中搜网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种微件数据及时更新的方法和装置,该方法包括以下步骤:注册微件源至微件数据更新系统;微件数据更新系统检索索引检索系统;数据分发模块分发更新文档至索引检索系统和微件数据更新系统;微件数据更新系统分析更新文档;微件数据更新系统传输数据至微件显示;该装置包括分别与微件数据更新系统输入端连接的数据分发模块和源操作模块,所述微件数据更新系统的输出端连接微件。本发明无需预测数据更新周期,及时更新数据,节省网络资源。
-
公开(公告)号:CN103064842B
公开(公告)日:2016-01-20
申请号:CN201110319550.6
申请日:2011-10-20
Applicant: 北京中搜网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明提供一种信息订阅处理装置和一种信息订阅处理方法,其中,信息订阅处理装置300包括:分词处理模块302,对来自用户的关键词订阅信息进行分词,得到所述关键词订阅信息中的关键词,对更新的信息内容进行分词,得到所述信息内容中的关键词;索引管理模块304,为关键词订阅信息建立倒排索引,其中,所述倒排索引包括所述关键词订阅信息中的关键词;匹配处理模块306,将所述倒排索引中的关键词与所述信息内容中的关键词进行匹配,并根据匹配结果,判断是否将所述信息内容推送给所述用户。通过本发明,对关键词订阅信息建立倒排索引,并进行倒排索引关键词与新增内容关键词的匹配,以获取用户所需的内容,该方式结果准确,效率极高。
-
-
公开(公告)号:CN103064842A
公开(公告)日:2013-04-24
申请号:CN201110319550.6
申请日:2011-10-20
Applicant: 北京中搜网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明提供一种信息订阅处理装置和一种信息订阅处理方法,其中,信息订阅处理装置300包括:分词处理模块302,对来自用户的关键词订阅信息进行分词,得到所述关键词订阅信息中的关键词,对更新的信息内容进行分词,得到所述信息内容中的关键词;索引管理模块304,为关键词订阅信息建立倒排索引,其中,所述倒排索引包括所述关键词订阅信息中的关键词;匹配处理模块306,将所述倒排索引中的关键词与所述信息内容中的关键词进行匹配,并根据匹配结果,判断是否将所述信息内容推送给所述用户。通过本发明,对关键词订阅信息建立倒排索引,并进行倒排索引关键词与新增内容关键词的匹配,以获取用户所需的内容,该方式结果准确,效率极高。
-
公开(公告)号:CN103064840A
公开(公告)日:2013-04-24
申请号:CN201110319548.9
申请日:2011-10-20
Applicant: 北京中搜网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明提出一种索引装置,包括:高频词处理模块,在文档中的当前词为高频词时,根据所述当前词邻接的前侧词和/或后侧词,对所述当前词进行扩展;索引建立模块,根据扩展得到的新词和所述文档建立索引。在该技术方案中,通过对文档关键词中的高频词进行扩展处理,降低了关键词中高频词的数量,避免了利用大量高频词建立索引而导致过高的检索量和过长的检索时间。本发明还提供索引方法、检索装置、检索方法和检索系统。
-
公开(公告)号:CN104361009B
公开(公告)日:2017-10-31
申请号:CN201410536018.3
申请日:2014-10-11
Applicant: 北京中搜网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明提供一种基于倒排索引的实时索引方法,包括以下步骤:对数据进行预处理;更新内存索引库;更新磁盘索引库。本发明提供的基于倒排索引的实时索引方法,在保持尽量不影响检索性能的前提下,消减用于更新的索引库数量,同时去除内存库对数据量的限制,针对性的对多路处理器进行优化,更好的支持多路并发多线程的数据更新,提供更灵活的数据更新方式以及高效的数据更新效率,增强数据的及时性,给用户以良好的检索体验。
-
公开(公告)号:CN103064846B
公开(公告)日:2016-08-31
申请号:CN201110319565.2
申请日:2011-10-20
Applicant: 北京中搜网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明提供检索装置和检索方法,其中一种检索装置,用于信息检索及搜索引擎系统,包括:最小命中窗口获取模块,获取查询所用的多个关键词在文档中的最小命中窗口;全局邻近度计算模块,根据最小命中窗口的命中窗口长度,以及最小命中窗口中多个关键词的逆序对数,计算出最小命中窗口的扩展命中窗口长度,作为多个关键词的全局邻近度;位置相关性计算模块,根据全局邻近度,计算出多个关键词在文档中的位置相关性;结果生成模块,根据位置相关性,对文档进行排序,并生成检索结果。通过本发明,实现了对全局邻近度的改进,基于该改进的全局邻近度,可以计算出合理的位置相关性,以更精确以及高效地进行检索。
-
公开(公告)号:CN103064847A
公开(公告)日:2013-04-24
申请号:CN201110319568.6
申请日:2011-10-20
Applicant: 北京中搜网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明提出了一种索引装置,包括:数字串切分模块,对文档中的数字串进行切分;索引建立模块,根据切分后得到的新数字串和所述文档建立索引。在该技术方案中,提出对文档中的数字串进行切分,将切分后的新数字串作为关键词建立索引,可以合理地控制索引结构中的关键词指向的文件链表的长度,以及关键词列表的长度,即能够控制数字串建立的索引大小在计算机内存可接受的范围内,可以提高数字串检索速度。本发明还提出索引方法、检索装置、检索方法和检索系统。
-
公开(公告)号:CN103064846A
公开(公告)日:2013-04-24
申请号:CN201110319565.2
申请日:2011-10-20
Applicant: 北京中搜网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明提供检索装置和检索方法,其中一种检索装置,用于信息检索及搜索引擎系统,包括:最小命中窗口获取模块,获取查询所用的多个关键词在文档中的最小命中窗口;全局邻近度计算模块,根据最小命中窗口的命中窗口长度,以及最小命中窗口中多个关键词的逆序对数,计算出最小命中窗口的扩展命中窗口长度,作为多个关键词的全局邻近度;位置相关性计算模块,根据全局邻近度,计算出多个关键词在文档中的位置相关性;结果生成模块,根据位置相关性,对文档进行排序,并生成检索结果。通过本发明,实现了对全局邻近度的改进,基于该改进的全局邻近度,可以计算出合理的位置相关性,以更精确以及高效地进行检索。
-
公开(公告)号:CN105989056A
公开(公告)日:2016-10-05
申请号:CN201510063902.4
申请日:2015-02-06
Applicant: 北京中搜网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种汉语新闻推荐系统,所述系统包括用于收集数据、记录用户偏好并更新推荐模块的学习层、用于存储系统数据的数据层及用于生成新闻推荐列表的推荐层;所述推荐层包括根据用户请求返回推荐新闻列表的候选生成器及调用偏好模块对所述推荐新闻列表进行排序的聚集器。该系统可行的融合了基于内容、基于记忆和基于模型三类推荐方法的汉语新闻推荐系统,在避免了上述三种模型的缺陷的基础上,发扬了各自的优点,且并没有增加系统负担。
-
-
-
-
-
-
-
-
-