-
公开(公告)号:CN119312846A
公开(公告)日:2025-01-14
申请号:CN202411459812.2
申请日:2024-10-18
Applicant: 科大讯飞股份有限公司
IPC: G06N3/0455 , G06N5/04
Abstract: 本申请公开了一种模型量化方法、装置、相关设备及计算机程序产品,本申请考虑到模型内部不同层级对量化的敏感度可能不同,为了实现更优的量化策略,并非以整个目标模型作为量化粒度,而是以目标模型的每一层作为量化粒度,根据每一层的权重和激活的数值大小,确定每一层的量化目标,进而可以按照每一层的量化目标,分别对目标模型中的每一层进行量化处理。本申请对于目标模型的每一层均确定与之匹配的量化目标,使得每一层能够按照更加匹配的量化目标进行量化处理,相比于传统方案对整个模型采用同一量化目标进行处理,本申请方案的量化策略更加优异,能够更好的平衡量化后模型的参数量及计算精度,提升模型量化的效果。
-
公开(公告)号:CN112350894A
公开(公告)日:2021-02-09
申请号:CN202011222190.3
申请日:2020-11-05
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种服务节点的性能测试方法、装置、设备及存储介质,方法包括:获取服务集群中负载均衡节点的配置文件,以及为服务集群中的指定服务节点预设的阶梯测试目标,其中,配置文件中包含各服务节点分别对应的权重,阶梯测试目标包含由低至高的多级测试目标;按由低至高的顺序,从阶梯测试目标中逐个获取测试目标;针对当前获取的测试目标,基于该测试目标更新配置文件中指定服务节点对应的权重,确定指定服务节点在更新后权重下的服务健康度,基于服务健康度判断是否继续获取下一测试目标,若否,则确定指定服务节点的处理性能在该测试目标和低一级测试目标之间。本申请提供的测试方法具有较高的测试效率和较好的测试效果。
-