-
公开(公告)号:CN107004163A
公开(公告)日:2017-08-01
申请号:CN201580066655.1
申请日:2015-11-28
Applicant: 微软技术许可有限责任公司
Abstract: 这里公开了涉及特征构思器的技术。特征构思器可以启动在分类过程中分析数据的训练集合的分类器。特征构思器可以生成与在分类过程期间被生成的错误有关的一个或者多个建议的特征。特征构思器可以生成输出以使得错误按照提供与用户的交互的格式被渲染。用户可以回顾错误的概要或者个体错误并且选择一个或者多个特征以增加分类器的准确度。
-
公开(公告)号:CN105393263A
公开(公告)日:2016-03-09
申请号:CN201480039790.2
申请日:2014-07-11
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据集合很难进行搜索和/或分析。可以通过将查询和网页自动地分类成有用的类型,并使用这些分类评分作为相关特征,来显著地提高相关性。一种彻底的方法可能需要构建很大数量的分类器,它们对应于各种类型的信息、活动和产品。关于较大的数据集,提供分类器和架构器的生成。分类器和架构器关于数以亿计的项目进行练习,可以通过增加可使用的元数据来揭示该数据固有的值。一些方面包括主动标注探索、自动正则化和冷启动、随着项目数量和分类器数量进行扩充、主动特征化、以及分割和架构化。
-
公开(公告)号:CN105378764A
公开(公告)日:2016-03-02
申请号:CN201480039782.8
申请日:2014-07-11
Applicant: 微软技术许可有限责任公司
IPC: G06N99/00
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据集合很难进行搜索和/或分析。可以通过将查询和网页自动地分类成有用的类型,并使用这些分类评分作为相关性特征,来显著地提高相关性。一种彻底的方法可能需要构建很大数量的分类器,它们对应于各种类型的信息、活动和产品。关于较大的数据集,提供分类器和概要器的生成。在数以亿计的条目上训练分类器和概要器,可以通过增加可用的元数据来揭露该数据固有的值。一些方面包括主动标注探索、自动正则化和冷启动、随着条目数量和分类器数量进行的扩展、主动特征化、以及分段和概要化。
-
-