-
公开(公告)号:CN112639769A
公开(公告)日:2021-04-09
申请号:CN201980038901.0
申请日:2019-05-30
Applicant: 微软技术许可有限责任公司
IPC: G06F16/903
Abstract: 提出了利用概率谓词(PP)来加快需要机器学习推理的搜索的实现。一种方法包括接收搜索查询,该搜索查询包括用于利用用户定义函数(UDF)来过滤数据库中的二进制大对象的谓词。过滤要求UDF对二进制大对象进行分析,以确定通过过滤的二进制大对象。此外,该方法包括基于该谓词来确定PP的PP序列。每个PP是分类器,该分类器计算满足PP子句的PP‑二进制大对象概率。PP序列定义表达式以组合PP。此外,该方法包括如下操作:该操作执行PP序列以确定该二进制大对象满足表达式的二进制大对象概率,确定哪些二进制大对象满足准确性阈值,丢弃具有小于该准确性阈值的二进制大对象概率的二进制大对象,以及对尚未被丢弃的二进制大对象执行数据库查询。然后呈现结果。