用于高性能在线推断的自动特征准备

    公开(公告)号:CN115146784A

    公开(公告)日:2022-10-04

    申请号:CN202210348141.7

    申请日:2022-03-30

    IPC分类号: G06N20/00 G06N5/04

    摘要: 提供了一种方法、系统和程序产品,其在训练机器学习模型时分析第一数据准备流水线中的第一数据变换运算符的集合,第一数据准备流水线根据训练数据集生成多个构造特征。该方法、系统和程序产品从第一数据准备流水线创建多个第二数据准备流水线,其中,第一数据变换运算符的集合被转换为第二数据变换运算符的集合,并且每个数据变换运算符被分配给多个第二数据准备流水线之一。该方法、系统和程序产品将多个第二数据准备流水线部署到运行时系统。

    用于生成数据库的测试工作负载的系统和方法

    公开(公告)号:CN103176973A

    公开(公告)日:2013-06-26

    申请号:CN201110429529.1

    申请日:2011-12-20

    IPC分类号: G06F17/30

    摘要: 公开了一种用于生成数据库的测试工作负载的系统和方法,该系统包括:工作负载捕获模块,被配置为捕获源系统上包含针对源数据库发出的原数据库语句的工作负载;元信息收集模块,被配置为收集源数据库中的数据模式和数据分布统计特性;数据生成模块,被配置为根据所述收集的源数据库中的数据模式在目标数据库中创建具有相同数据模式的数据对象,以及根据所述收集的数据分布统计特性在目标数据库中生成具有相似数据分布统计特性的数据;以及语句修改模块,被配置为修改所捕获的工作负载中的至少部分原数据库语句,以使得修改后的数据库语句在目标数据库上的执行具有所述原数据库语句在源数据库上的执行的相似的性能特征,从而获得测试工作负载。

    用于生成数据库的测试工作负载的系统和方法

    公开(公告)号:CN103176973B

    公开(公告)日:2016-04-20

    申请号:CN201110429529.1

    申请日:2011-12-20

    IPC分类号: G06F17/30

    摘要: 公开了一种用于生成数据库的测试工作负载的系统和方法,该系统包括:工作负载捕获模块,被配置为捕获源系统上包含针对源数据库发出的原数据库语句的工作负载;元信息收集模块,被配置为收集源数据库中的数据模式和数据分布统计特性;数据生成模块,被配置为根据所述收集的源数据库中的数据模式在目标数据库中创建具有相同数据模式的数据对象,以及根据所述收集的数据分布统计特性在目标数据库中生成具有相似数据分布统计特性的数据;以及语句修改模块,被配置为修改所捕获的工作负载中的至少部分原数据库语句,以使得修改后的数据库语句在目标数据库上的执行具有所述原数据库语句在源数据库上的执行的相似的性能特征,从而获得测试工作负载。