用于机器学习模型的并行化坐标下降法

    公开(公告)号:CN109978175A

    公开(公告)日:2019-07-05

    申请号:CN201811570862.2

    申请日:2018-12-21

    Abstract: 执行机器学习模型训练过程的迭代直到发生收敛为止。使用第一机器学习算法来训练固定效应机器学习模型。通过将所训练的固定效应机器学习模型的结果与第一组目标结果进行比较来确定固定效应机器学习模型的训练残差。使用第二机器学习算法和固定效应机器学习模型的训练残差来训练第一随机效应机器学习模型。通过将所训练的第一随机效应机器学习模型的结果与第二组目标结果进行比较来确定第一随机效应机器学习模型的训练残差。在每次后续迭代中,对固定效应机器学习模型的训练使用在先前迭代中训练的最后机器学习模型的训练残差。

    热启动广义加性混合效应(GAME)框架

    公开(公告)号:CN110858235B

    公开(公告)日:2023-10-31

    申请号:CN201910772576.2

    申请日:2019-08-21

    Abstract: 在示例实施例中,使用热启动训练解决方案来极大地降低当对广义加性混合效应(GAME)模型进行再训练时所需要的计算资源。再训练时间的问题特别适用于GAME模型,这是由于这些模型花费了太多的时间随着数据的增长进行训练。过去,用于在再训练期间降低计算资源的策略是使用较少的训练数据,但这会影响模型质量,尤其是对于依赖于在例如成员或项目等级的精细粒度的子模型的GAME模型而言。本解决方案在不牺牲GAME模型精确度的情况下解决了计算资源问题。

    用于模型探索的数据采样
    4.
    发明公开

    公开(公告)号:CN113939829A

    公开(公告)日:2022-01-14

    申请号:CN202080043172.0

    申请日:2020-05-11

    Abstract: 所公开的实施例提供了用于处理数据的系统。在操作期间,所述系统获得包含与第一标识符(ID)值集合相关联的第一记录集合的训练数据集和包含与第二ID值集合相关联的第二记录集合的评估数据集。接下来,所述系统从所述第二ID值集合中选择随机ID值子集。所述系统然后生成经采样的评估数据集,所述经采样的评估数据集包括所述第二记录集合中的与所述随机ID值子集相关联的第一记录子集。所述系统还生成经采样的训练数据集,所述经采样的训练数据集包括所述第一记录集合中的与所述随机ID值子集相关联的第二记录子集。最后,所述系统输出所述经采样的训练数据集和所述经采样的评估数据集,以用于训练和评估机器学习模型。

    热启动广义加性混合效应(GAME)框架

    公开(公告)号:CN110858235A

    公开(公告)日:2020-03-03

    申请号:CN201910772576.2

    申请日:2019-08-21

    Abstract: 在示例实施例中,使用热启动训练解决方案来极大地降低当对广义加性混合效应(GAME)模型进行再训练时所需要的计算资源。再训练时间的问题特别适用于GAME模型,这是由于这些模型花费了太多的时间随着数据的增长进行训练。过去,用于在再训练期间降低计算资源的策略是使用较少的训练数据,但这会影响模型质量,尤其是对于依赖于在例如成员或项目等级的精细粒度的子模型的GAME模型而言。本解决方案在不牺牲GAME模型精确度的情况下解决了计算资源问题。

Patent Agency Ranking