-
公开(公告)号:CN105393265B
公开(公告)日:2018-01-05
申请号:CN201480039813.X
申请日:2014-07-08
Applicant: 微软技术许可有限责任公司
IPC: G06N99/00
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据的集合可能难以搜索和/或分析。通过在有用的类别中自动分类查询和网页,以及利用这些分类得分作为相关性特征,可能显著提升相关性。完整的方法可能需要构建大量的分类器,对应于各种类型的信息、活动和产品。在大的数据集上提供分类器和概要器的创建。在数亿条目上练习分类器和概要器可以通过添加可用的元数据来显露数据所固有的价值。一些方面包括主动标记探索、自动正则化和冷启动、通过条目数量和分类器数量缩放、主动特征化、以及分割和概要化。
-
公开(公告)号:CN105393264A
公开(公告)日:2016-03-09
申请号:CN201480039808.9
申请日:2014-07-08
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据的集合可能难以搜索和/或分析。通过在有用的类别中自动对查询和网页进行分类,以及利用这些分类得分作为相关性特征,能够显著提升相关性。完整的方法可能需要构建大量的分类器,对应于各种类型的信息、活动和产品。在大的数据集上提供分类器和图式器的创建。在数十亿条目上练习分类器和图式器可以通过添加可用的元数据来显露数据所固有的价值。一些方面包括主动标注探索、自动正则化和冷启动,通过条目数量和分类器数量来进行缩放、主动特征化以及分割和图式化。
-
公开(公告)号:CN105393264B
公开(公告)日:2019-03-08
申请号:CN201480039808.9
申请日:2014-07-08
Applicant: 微软技术许可有限责任公司
Abstract: 非常大的数据的集合可能难以搜索和/或分析。通过在有用的类别中自动对查询和网页进行分类,以及利用这些分类得分作为相关性特征,能够显著提升相关性。完整的方法可能需要构建大量的分类器,对应于各种类型的信息、活动和产品。在大的数据集上提供分类器和图式器的创建。在数十亿条目上练习分类器和图式器可以通过添加可用的元数据来显露数据所固有的价值。一些方面包括主动标注探索、自动正则化和冷启动,通过条目数量和分类器数量来进行缩放、主动特征化以及分割和图式化。
-
公开(公告)号:CN105378764B
公开(公告)日:2018-08-17
申请号:CN201480039782.8
申请日:2014-07-11
Applicant: 微软技术许可有限责任公司
IPC: G06N99/00
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据集合很难进行搜索和/或分析。可以通过将查询和网页自动地分类成有用的类型,并使用这些分类评分作为相关性特征,来显著地提高相关性。一种彻底的方法可能需要构建很大数量的分类器,它们对应于各种类型的信息、活动和产品。关于较大的数据集,提供分类器和概要器的生成。在数以亿计的条目上训练分类器和概要器,可以通过增加可用的元数据来揭露该数据固有的值。一些方面包括主动标注探索、自动正则化和冷启动、随着条目数量和分类器数量进行的扩展、主动特征化、以及分段和概要化。
-
公开(公告)号:CN105393265A
公开(公告)日:2016-03-09
申请号:CN201480039813.X
申请日:2014-07-08
Applicant: 微软技术许可有限责任公司
IPC: G06N99/00
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据的集合可能难以搜索和/或分析。通过在有用的类别中自动分类查询和网页,以及利用这些分类得分作为相关性特征,可能显著提升相关性。完整的方法可能需要构建大量的分类器,对应于各种类型的信息、活动和产品。在大的数据集上提供分类器和概要器的创建。在数亿条目上练习分类器和概要器可以通过添加可用的元数据来显露数据所固有的价值。一些方面包括主动标记探索、自动正则化和冷启动、通过条目数量和分类器数量缩放、主动特征化、以及分割和概要化。
-
公开(公告)号:CN105393263B
公开(公告)日:2018-01-09
申请号:CN201480039790.2
申请日:2014-07-11
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据集合很难进行搜索和/或分析。可以通过将查询和网页自动地分类成有用的类型,并使用这些分类评分作为相关特征,来显著地提高相关性。一种彻底的方法可能需要构建很大数量的分类器,它们对应于各种类型的信息、活动和产品。关于较大的数据集,提供分类器和架构器的生成。分类器和架构器关于数以亿计的项目进行练习,可以通过增加可使用的元数据来揭示该数据固有的值。一些方面包括主动标注探索、自动正则化和冷启动、随着项目数量和分类器数量进行扩充、主动特征化、以及分割和架构化。
-
公开(公告)号:CN105393263A
公开(公告)日:2016-03-09
申请号:CN201480039790.2
申请日:2014-07-11
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据集合很难进行搜索和/或分析。可以通过将查询和网页自动地分类成有用的类型,并使用这些分类评分作为相关特征,来显著地提高相关性。一种彻底的方法可能需要构建很大数量的分类器,它们对应于各种类型的信息、活动和产品。关于较大的数据集,提供分类器和架构器的生成。分类器和架构器关于数以亿计的项目进行练习,可以通过增加可使用的元数据来揭示该数据固有的值。一些方面包括主动标注探索、自动正则化和冷启动、随着项目数量和分类器数量进行扩充、主动特征化、以及分割和架构化。
-
公开(公告)号:CN105378764A
公开(公告)日:2016-03-02
申请号:CN201480039782.8
申请日:2014-07-11
Applicant: 微软技术许可有限责任公司
IPC: G06N99/00
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据集合很难进行搜索和/或分析。可以通过将查询和网页自动地分类成有用的类型,并使用这些分类评分作为相关性特征,来显著地提高相关性。一种彻底的方法可能需要构建很大数量的分类器,它们对应于各种类型的信息、活动和产品。关于较大的数据集,提供分类器和概要器的生成。在数以亿计的条目上训练分类器和概要器,可以通过增加可用的元数据来揭露该数据固有的值。一些方面包括主动标注探索、自动正则化和冷启动、随着条目数量和分类器数量进行的扩展、主动特征化、以及分段和概要化。
-
-
-
-
-
-
-