-
公开(公告)号:CN115168039A
公开(公告)日:2022-10-11
申请号:CN202210801018.6
申请日:2022-07-08
Applicant: 北京交通大学
Abstract: 一种在多核CPU服务器上的卷积神经网络推断任务调度优化方法,其特征在于:该方法包括初始化设置模块、缓冲区数据存储模块、缓冲区数据探测模块和若干卷积神经网络计算层模块;所述初始化设置模块用于关键变量初始化计算设置;所述缓冲区数据存储模块用于接收存储CNN推断任务;所述缓冲区数据探测模块用于探测所述缓冲区数据存储模块内的待处理CNN推断任务,运行CNN推断时间预测方法,评估是否进行优化调度处理;每个所述卷积神经网络计算层模块用于执行部分CNN推断计算操作。本发明通过利用多核CPU服务器多线程资源,一边接收新到达任务数据,一边处理推断任务,利用动态批量计算优化单个样本的推断时间,提高服务器单位时间CNN推断任务吞吐量。