-
公开(公告)号:CN105393263B
公开(公告)日:2018-01-09
申请号:CN201480039790.2
申请日:2014-07-11
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据集合很难进行搜索和/或分析。可以通过将查询和网页自动地分类成有用的类型,并使用这些分类评分作为相关特征,来显著地提高相关性。一种彻底的方法可能需要构建很大数量的分类器,它们对应于各种类型的信息、活动和产品。关于较大的数据集,提供分类器和架构器的生成。分类器和架构器关于数以亿计的项目进行练习,可以通过增加可使用的元数据来揭示该数据固有的值。一些方面包括主动标注探索、自动正则化和冷启动、随着项目数量和分类器数量进行扩充、主动特征化、以及分割和架构化。
-
公开(公告)号:CN105393263A
公开(公告)日:2016-03-09
申请号:CN201480039790.2
申请日:2014-07-11
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据集合很难进行搜索和/或分析。可以通过将查询和网页自动地分类成有用的类型,并使用这些分类评分作为相关特征,来显著地提高相关性。一种彻底的方法可能需要构建很大数量的分类器,它们对应于各种类型的信息、活动和产品。关于较大的数据集,提供分类器和架构器的生成。分类器和架构器关于数以亿计的项目进行练习,可以通过增加可使用的元数据来揭示该数据固有的值。一些方面包括主动标注探索、自动正则化和冷启动、随着项目数量和分类器数量进行扩充、主动特征化、以及分割和架构化。
-