-
公开(公告)号:CN120068976A
公开(公告)日:2025-05-30
申请号:CN202411012733.7
申请日:2024-07-26
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: G06N3/082 , G06N3/0464
Abstract: 本发明提供一种卷积神经网络权重压缩方法及装置,涉及数据处理技术领域,包括:将原始卷积神经网络的卷积层的权重由原始四维张量转换为二维权重矩阵;将所述二维权重矩阵通过改进的正交变换转换为分块反三角形式,其中,所述改进的正交变换包括以下至少一项:Givens变换及Householder变换;基于分块反三角算法所需的浮点操作数量,计算得到各个转换过程的运算量,针对运算量超过预设阈值的对称不定矩阵进行一阶修正,得到修正后的分块反三角形式;通过所述修正后的分块反三角形式的下三角分块矩阵重塑回四维张量,得到新的四维张量,根据新的四维张量替换原始的四维张量,以得到压缩后的卷积神经网络。
-
公开(公告)号:CN118656207A
公开(公告)日:2024-09-17
申请号:CN202410712617.X
申请日:2024-06-04
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
Abstract: 本发明提供一种业务分级方法、装置、设备、介质及产品,属于云计算技术领域,方法包括:获取多个用户在第一预设时间段内的第一业务使用信息;基于第一业务使用信息,构建每个用户的用户画像;基于第一业务使用信息进行时间序列预测,得到每个用户在未来的第二预设时间段内对于多个目标业务的业务使用预测序列;基于每个用户的业务使用预测序列,对多个目标业务进行分级,得到每个用户的个体业务分级序列;基于每个用户的用户画像和个体业务分级序列,确定目标云资源池内的区域业务分级序列。本发明提供的业务分级方法,能够更好地贴合用户的特定需求,在保障用户体验感的同时,对业务的特征与差异性进行更好地反映,从而提高业务分级的精准性。
-
公开(公告)号:CN119292776A
公开(公告)日:2025-01-10
申请号:CN202411360703.5
申请日:2024-09-27
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: G06F9/50 , G06F18/2415
Abstract: 本发明提供一种服务器资源利用率提升方法、系统、设备、介质及产品,涉及数据处理技术领域,根据服务器的历史资源使用数据,对机器学习模型进行训练,建立资源预测模型;根据所述资源预测模型,预测服务器在目标时间段内的资源需求,并根据所述资源需求动态调整所述服务器的约束变量;其中,所述约束变量包括以下至少一项:CPU使用率约束、内存使用率约束根据动态调整后的所述约束变量,重新评估各个服务器资源切片的资源需求,以根据重新评估的所述资源需求动态调整各个所述服务器资源切片的资源分配;其中,所述服务器资源切片是基于资源分配策略对服务器资源划分得到的。
-
-