-
公开(公告)号:CN105393265B
公开(公告)日:2018-01-05
申请号:CN201480039813.X
申请日:2014-07-08
Applicant: 微软技术许可有限责任公司
IPC: G06N99/00
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据的集合可能难以搜索和/或分析。通过在有用的类别中自动分类查询和网页,以及利用这些分类得分作为相关性特征,可能显著提升相关性。完整的方法可能需要构建大量的分类器,对应于各种类型的信息、活动和产品。在大的数据集上提供分类器和概要器的创建。在数亿条目上练习分类器和概要器可以通过添加可用的元数据来显露数据所固有的价值。一些方面包括主动标记探索、自动正则化和冷启动、通过条目数量和分类器数量缩放、主动特征化、以及分割和概要化。
-
公开(公告)号:CN105393264B
公开(公告)日:2019-03-08
申请号:CN201480039808.9
申请日:2014-07-08
Applicant: 微软技术许可有限责任公司
Abstract: 非常大的数据的集合可能难以搜索和/或分析。通过在有用的类别中自动对查询和网页进行分类,以及利用这些分类得分作为相关性特征,能够显著提升相关性。完整的方法可能需要构建大量的分类器,对应于各种类型的信息、活动和产品。在大的数据集上提供分类器和图式器的创建。在数十亿条目上练习分类器和图式器可以通过添加可用的元数据来显露数据所固有的价值。一些方面包括主动标注探索、自动正则化和冷启动,通过条目数量和分类器数量来进行缩放、主动特征化以及分割和图式化。
-
公开(公告)号:CN105378764B
公开(公告)日:2018-08-17
申请号:CN201480039782.8
申请日:2014-07-11
Applicant: 微软技术许可有限责任公司
IPC: G06N99/00
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据集合很难进行搜索和/或分析。可以通过将查询和网页自动地分类成有用的类型,并使用这些分类评分作为相关性特征,来显著地提高相关性。一种彻底的方法可能需要构建很大数量的分类器,它们对应于各种类型的信息、活动和产品。关于较大的数据集,提供分类器和概要器的生成。在数以亿计的条目上训练分类器和概要器,可以通过增加可用的元数据来揭露该数据固有的值。一些方面包括主动标注探索、自动正则化和冷启动、随着条目数量和分类器数量进行的扩展、主动特征化、以及分段和概要化。
-
公开(公告)号:CN102201097B
公开(公告)日:2017-05-03
申请号:CN201110081527.8
申请日:2011-03-25
Applicant: 微软技术许可有限责任公司
CPC classification number: G06K9/6224 , G06F17/30958 , G06Q30/02 , G06Q30/08
Abstract: 各种实施例提供了用于图群集的技术。在一个或多个实施例中,获得表示实体间关系的参与图。基于参与图来构造辅助图。构造辅助图使得辅助图没有参与图密集,从而在计算上较不复杂以便于分析。通过对为辅助图定义的目标函数求解来确定辅助图中的集群。为辅助图确定的集群然后可用于确定参与图中的集群,参与图中的集群对为参与图定义的相关目标函数求解。
-
公开(公告)号:CN105393265A
公开(公告)日:2016-03-09
申请号:CN201480039813.X
申请日:2014-07-08
Applicant: 微软技术许可有限责任公司
IPC: G06N99/00
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据的集合可能难以搜索和/或分析。通过在有用的类别中自动分类查询和网页,以及利用这些分类得分作为相关性特征,可能显著提升相关性。完整的方法可能需要构建大量的分类器,对应于各种类型的信息、活动和产品。在大的数据集上提供分类器和概要器的创建。在数亿条目上练习分类器和概要器可以通过添加可用的元数据来显露数据所固有的价值。一些方面包括主动标记探索、自动正则化和冷启动、通过条目数量和分类器数量缩放、主动特征化、以及分割和概要化。
-
公开(公告)号:CN107004163B
公开(公告)日:2021-02-26
申请号:CN201580066655.1
申请日:2015-11-28
Applicant: 微软技术许可有限责任公司
Abstract: 这里公开了涉及特征构思器的技术。特征构思器可以启动在分类过程中分析数据的训练集合的分类器。特征构思器可以生成与在分类过程期间被生成的错误有关的一个或者多个建议的特征。特征构思器可以生成输出以使得错误按照提供与用户的交互的格式被渲染。用户可以回顾错误的概要或者个体错误并且选择一个或者多个特征以增加分类器的准确度。
-
公开(公告)号:CN105393264A
公开(公告)日:2016-03-09
申请号:CN201480039808.9
申请日:2014-07-08
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据的集合可能难以搜索和/或分析。通过在有用的类别中自动对查询和网页进行分类,以及利用这些分类得分作为相关性特征,能够显著提升相关性。完整的方法可能需要构建大量的分类器,对应于各种类型的信息、活动和产品。在大的数据集上提供分类器和图式器的创建。在数十亿条目上练习分类器和图式器可以通过添加可用的元数据来显露数据所固有的价值。一些方面包括主动标注探索、自动正则化和冷启动,通过条目数量和分类器数量来进行缩放、主动特征化以及分割和图式化。
-
公开(公告)号:CN105393263B
公开(公告)日:2018-01-09
申请号:CN201480039790.2
申请日:2014-07-11
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据集合很难进行搜索和/或分析。可以通过将查询和网页自动地分类成有用的类型,并使用这些分类评分作为相关特征,来显著地提高相关性。一种彻底的方法可能需要构建很大数量的分类器,它们对应于各种类型的信息、活动和产品。关于较大的数据集,提供分类器和架构器的生成。分类器和架构器关于数以亿计的项目进行练习,可以通过增加可使用的元数据来揭示该数据固有的值。一些方面包括主动标注探索、自动正则化和冷启动、随着项目数量和分类器数量进行扩充、主动特征化、以及分割和架构化。
-
公开(公告)号:CN107004163A
公开(公告)日:2017-08-01
申请号:CN201580066655.1
申请日:2015-11-28
Applicant: 微软技术许可有限责任公司
Abstract: 这里公开了涉及特征构思器的技术。特征构思器可以启动在分类过程中分析数据的训练集合的分类器。特征构思器可以生成与在分类过程期间被生成的错误有关的一个或者多个建议的特征。特征构思器可以生成输出以使得错误按照提供与用户的交互的格式被渲染。用户可以回顾错误的概要或者个体错误并且选择一个或者多个特征以增加分类器的准确度。
-
公开(公告)号:CN105393263A
公开(公告)日:2016-03-09
申请号:CN201480039790.2
申请日:2014-07-11
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/2735 , G06F3/0482 , G06F17/2785 , G06F17/30864 , G06N7/005 , G06N99/005 , H04L1/0072 , H04L1/0079
Abstract: 非常大的数据集合很难进行搜索和/或分析。可以通过将查询和网页自动地分类成有用的类型,并使用这些分类评分作为相关特征,来显著地提高相关性。一种彻底的方法可能需要构建很大数量的分类器,它们对应于各种类型的信息、活动和产品。关于较大的数据集,提供分类器和架构器的生成。分类器和架构器关于数以亿计的项目进行练习,可以通过增加可使用的元数据来揭示该数据固有的值。一些方面包括主动标注探索、自动正则化和冷启动、随着项目数量和分类器数量进行扩充、主动特征化、以及分割和架构化。
-
-
-
-
-
-
-
-
-