-
公开(公告)号:CN103782296A
公开(公告)日:2014-05-07
申请号:CN201280043901.8
申请日:2012-09-04
申请人: 阿克塞尔斯普林格数字电视指导有限责任公司
IPC分类号: G06F17/30 , H04N21/482 , H04N21/466
CPC分类号: G06F17/30554 , G06F17/30058 , G06F17/3053 , G06F17/3084 , H04N21/466 , H04N21/4668 , H04N21/4755 , H04N21/482 , H04N21/4826 , H04N21/8133 , H04N21/84
摘要: 本发明涉及一种用于自动生成与种子项目有关的项目的排序列表的电子设备和方法。该电子设备包括相关性确定器,被配置为将所述种子项目与多个其它的项目进行比较,并由此相对于所述种子项目确定每个其它项目的相关性值。该设备还包括聚类引擎,被配置为通过确定所述其它项目之间的相对相关性来对所述其它项目进行聚类。因此,每个其它项目被分配给一个聚类。该设备还包括列表生成器,被配置为通过根据它们的相关性值和它们对于聚类的从属(或成员关系)两者对其它项目排序来生成排序的结果列表,由于一旦一个项目被添加到排序列表,取决于在该聚类中的其它项目的排名的相关性值至少是相对于其它聚类瞬时降低的,以便促进添加其它聚类的项目,从而实现取决于排序列表的顶部的排名的更高的瞬时相关性值。
-
公开(公告)号:CN102236663B
公开(公告)日:2014-04-09
申请号:CN201010160535.7
申请日:2010-04-30
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/3053 , G06F17/30554 , G06F17/30867 , G06Q30/02
摘要: 本申请公开了一种基于垂直搜索的查询方法、系统和装置,该方法包括:获取用户的查询信息;根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;对所述第一查询结果和所述第二查询结果合并,生成最终查询结果。通过本申请,提高了用户查询结果与用户查询意图的相关度,提高用户体验感。
-
公开(公告)号:CN102402605B
公开(公告)日:2014-04-02
申请号:CN201110373397.5
申请日:2011-11-22
申请人: 微软公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30864 , G06F17/30194 , G06F17/30442 , G06F17/3053
摘要: 本发明提供了用于搜索引擎索引的混合分布模型,并且还提供了基于搜索查询使用混合分布系统来识别相关文档的方法和系统。为特定片段指定文档群组。所述文档群组由原子和文档索引,从而形成倒排索引和正排索引。全部两项索引被划分在该片段中的每一个节点当中,从而使得每一个节点负责存储及访问倒排索引和正排索引二者的不同部分。在第一节点集合当中的每一个节点上访问倒排索引部分,以便识别出与特定搜索查询相关的第一文档集合。使用与第一文档集合相关联的文档标识来识别出第二节点集合,所述第二节点集合访问其正排索引部分以便把相关文档的数目限制到第二文档集合。
-
公开(公告)号:CN102375810B
公开(公告)日:2014-03-19
申请号:CN201010247942.1
申请日:2010-08-04
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/3053 , G06Q30/02 , G06Q30/0247 , G06Q30/0254 , G06Q30/0273 , G06Q30/0275 , G06Q30/0283
摘要: 本申请公开了一种整体帐户搜索关键词的估计值反馈方法及搜索引擎服务器,该方法包括:获取一个整体帐户所选择的多个搜索关键词、预测周期、每个搜索关键词的设置参数;预测每个搜索关键词在预测周期内的估计值;根据已保存的每个搜索关键词的历史数据和设置参数对搜索关键词的估计值进行修正,得到修正估计值;对每个搜索关键词的修正估计值进行加和,生成整体帐户的估计值;将整体帐户的估计值返回整体帐户所登录的客户端。本申请对每个搜索关键词的估计值进行修正,使得整体帐户的估计值能够满足用户的预期值,提升了用户体验;并且,搜索引擎服务器与用户之间也无需对估计值进行多次通信返回和重复计算,节约了网络资源和服务器的工作量。
-
公开(公告)号:CN103621105A
公开(公告)日:2014-03-05
申请号:CN201180072025.7
申请日:2011-06-30
申请人: 汤姆逊许可公司
发明人: 塞韦里尼·沃纳·恩格尔恩 , 罗杰·多米尼克·博齐尼
IPC分类号: H04N21/472 , H04N21/433 , H04N21/45 , H04N21/4147 , H04N21/475 , H04N21/454 , H04N21/466
CPC分类号: H04N21/4828 , G06F17/3053 , H04N21/4147 , H04N21/4334 , H04N21/4532 , H04N21/454 , H04N21/4668 , H04N21/472 , H04N21/4755
摘要: 一种方法和装置根据用户喜好搜索节目以便自动录制,其中包括由用户键入的频道名称或流派(905),以及由用户键入的关键字(910)。所述方法和装置允许用户键入录制分数阈值,在电子节目指南中搜索与所键入关键字、频道名称及流派之一匹配的节目,以及针对每个匹配节目,计算匹配分数,且如果匹配分数大于阈值,则自动选择该匹配节目以便自动录制。
-
公开(公告)号:CN103620583A
公开(公告)日:2014-03-05
申请号:CN201280029455.5
申请日:2012-06-15
申请人: 微软公司
CPC分类号: G06F17/3053 , G06F8/61 , G06F17/30554 , G06F17/30867 , G06F17/30876 , G06F17/30899 , G06Q30/0251 , G06Q30/0277
摘要: 应用在浏览期间被显现给用户,而不需要由用户进行特定的搜索。应用可以根据被输入到浏览器地址栏中的网络地址、对应于网络地址的页面内容或它们的组合而被选择来显现给用户。可以根据被输入到地址栏中的部分地址和/或根据在浏览器显示器上当前可见的网页内容,选择应用以供显现。
-
公开(公告)号:CN103577413A
公开(公告)日:2014-02-12
申请号:CN201210254425.6
申请日:2012-07-20
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/3053 , G06F17/30867 , G06F17/30864
摘要: 本申请提供了一种搜索结果排序方法,包括获取原始特征集合;基于历史交易数据从原始特征集合提取有效特征,有效特征指能够对搜索结果的排序产生影响的特征;基于历史交易数据确定各有效特征的初始权重,并利用历史交易数据和预定训练模型对初始权重进行训练得到最终权重;基于最终权重对搜索结果进行排序。本申请还提供了一种实现前述方法的搜索结果排序系统,以及对前述方法进行优化的搜索结果排序优化方法及系统。本申请的搜索结果排序方法及系统、搜索结果排序优化方法及系统,能够保证排序结果的客观性和准确性,避免用户因为排序结果不准确而额外的向服务器发送新搜索请求,从而可以减少服务器的负担以及减少数据的传输量。
-
公开(公告)号:CN103544259A
公开(公告)日:2014-01-29
申请号:CN201310484629.3
申请日:2013-10-16
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC分类号: G06F17/30
CPC分类号: G06F17/3053
摘要: 本发明涉及一种分组聚集排序TopK查询处理方法及系统。分组聚集排序TopK查询处理方法包括:接收分组聚集排序TopK查询请求;各分布式数据节点根据所述查询请求,进行本地数据分组聚集,并将自身的分组聚集数据异步传输到集中处理节点;所述集中处理节点采用哈希表结合二叉平衡树的数据结构对各分布式数据节点的分组聚集数据进行数据合并,并采用近似高频项统计算法进行统计,得到聚集排序后的高频项列表;输出所述高频项列表。本发明的分组聚集排序TopK查询处理方法及系统灵活性好,查询效率高,分布式适应性好。
-
公开(公告)号:CN103514178A
公开(公告)日:2014-01-15
申请号:CN201210206502.0
申请日:2012-06-18
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/3053 , G06F17/30536 , G06F17/30693 , G06F17/30864 , G06Q30/02 , G06F17/30867
摘要: 本申请提供了一种基于点击率的搜索排序方法及装置,以解决在应用排序规则对搜索结果进行排序时,复用性比较低并且方法繁琐的问题。所述的方法包括:搜索排序前,获取预设时间内用户的点击数据,并依据所述点击数据确定每个特征的权重;搜索排序包括以下步骤:获取查询词和与所述查询词匹配的查询目标,并且分别提取所述查询词和查询目标的特征;针对每个查询目标,根据所述查询词和查询目标的特征,以及每个特征对应的权重,采用回归模型预测所述查询目标的点击率;根据所述点击率,对所述查询目标进行排序并显示给用户。本申请适用于各种应用场景,复用性较高。并且,可以根据用户的点击数据准实时的调整所述权重,不需要重新配置。
-
公开(公告)号:CN103282903A
公开(公告)日:2013-09-04
申请号:CN201280004293.X
申请日:2012-03-08
申请人: 株式会社东芝 , 东芝解决方案株式会社
IPC分类号: G06F17/30
CPC分类号: G06F17/3053 , G06F17/2775
摘要: 根据实施方式,话题提取装置具备话题提取单元、话题提示单元。上述话题提取单元具备单词提取单元和话题词提取单元。上述单词提取单元从对象文书集合中提取各单词,计算该各单词的出现频度和该各单词出现的文书频度。上述话题词提取单元针对上述提取的各单词,取得上述对象期间中的出现文书的文书集合,计算表示与话题词的接近性的尺度即话题度,提取上述话题度为预定值以上的单词作为话题词,并且针对该提取的话题词,根据该对象期间中的出现日期时间计算新鲜度。上述话题提示单元按照上述新鲜度的顺序提示上述提取的话题词,并且针对该提示的各话题词提示每个单位期间的出现文书数。
-
-
-
-
-
-
-
-
-