-
公开(公告)号:CN111475304A
公开(公告)日:2020-07-31
申请号:CN202010278588.2
申请日:2020-04-10
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明涉及一种特征提取加速方法及系统,Python语言是广泛用于深度学习领域的一门编程语言,在神经网络训练的程序中,当出现generator语句及类函数嵌套结构语句时,Python的多进程包不能直接对训练程序进行并行优化。本发明对串行代码进行重构,使代码中不再含有generator语句及类函数嵌套语句,但是程序的输出结果与串行程序结果一致。对文件进行分块,多个进程并行读取文件块,在进程内部,串行读取文件块,串行进行特征提取操作,进程之间并行读取文件块,并行进行特征提取操作,从而提升并行程序性能。将本发明的方法用于具体的神经网络训练程序中,结果表明,性能提升15倍。