计算资源控制模型的训练方法、计算资源控制方法及装置

    公开(公告)号:CN114896061B

    公开(公告)日:2023-05-02

    申请号:CN202210494647.9

    申请日:2022-05-07

    Abstract: 本公开提供了一种计算资源控制模型的训练方法、计算资源控制方法及装置,涉及人工智能技术领域,尤其涉及智能推荐技术领域。实现方案为:响应于第一用户的第一推荐请求,生成与计算资源控制模型的参数相对应的参数扰动;基于计算资源控制模型的参数和参数扰动,生成临时控制模型;将第一推荐请求的请求特征输入临时控制模型,以得到临时控制模型输出的第一控制值,第一控制值用于控制处理第一推荐请求的计算资源的数量;基于第一控制值,处理第一推荐请求,以得到第一推荐请求的第一推荐结果;获取第一用户对第一推荐结果的第一行为数据;以及基于参数扰动和第一行为数据,调整计算资源控制模型的参数。

    计算资源控制模型的训练方法、计算资源控制方法及装置

    公开(公告)号:CN114896061A

    公开(公告)日:2022-08-12

    申请号:CN202210494647.9

    申请日:2022-05-07

    Abstract: 本公开提供了一种计算资源控制模型的训练方法、计算资源控制方法及装置,涉及人工智能技术领域,尤其涉及智能推荐技术领域。实现方案为:响应于第一用户的第一推荐请求,生成与计算资源控制模型的参数相对应的参数扰动;基于计算资源控制模型的参数和参数扰动,生成临时控制模型;将第一推荐请求的请求特征输入临时控制模型,以得到临时控制模型输出的第一控制值,第一控制值用于控制处理第一推荐请求的计算资源的数量;基于第一控制值,处理第一推荐请求,以得到第一推荐请求的第一推荐结果;获取第一用户对第一推荐结果的第一行为数据;以及基于参数扰动和第一行为数据,调整计算资源控制模型的参数。

    内容推荐方法、装置、电子设备以及存储介质

    公开(公告)号:CN116955817A

    公开(公告)日:2023-10-27

    申请号:CN202310913033.4

    申请日:2023-07-24

    Inventor: 颜林 李航

    Abstract: 本公开提供了内容推荐方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及大模型、LLM(Large Language Model,大语言模型)、智能搜索、信息流、计算机视觉等领域。具体实现方案为:根据针对对象的推荐场景信息、推荐候选集信息以及对象的对象相关信息其中至少一种信息,生成提示信息;将提示信息输入大语言模型,得到与提示信息相对应的输出信息;以及根据输出信息,生成针对对象展示的推荐内容。

    在线服务算力优化方法和装置
    4.
    发明公开

    公开(公告)号:CN116382907A

    公开(公告)日:2023-07-04

    申请号:CN202310347405.1

    申请日:2023-04-03

    Abstract: 本公开提供了在线服务算力优化方法和装置,涉及云计算领域,尤其涉及人工智能领域。具体实现方案为:响应于接收到用户的在线服务请求,获取所述用户在当前场景的上下文信息,并获取集群的扩容比例;基于所述扩容比例计算出在线服务所需的算力上限;根据所述在线服务请求和所述上下文信息预测在线服务所需的算力额度,并根据所述算力额度和所述算力上限确定出所述在线服务请求的候选集大小;基于所述候选集大小召回所述在线服务请求的候选推荐结果,并对所述候选推荐结果进行排序输出。该实施方式能够优化在线服务的算力并提高产品效果的转换效率。

Patent Agency Ranking