-
公开(公告)号:CN107710237A
公开(公告)日:2018-02-16
申请号:CN201680039131.8
申请日:2016-06-24
Applicant: 微软技术许可有限责任公司
CPC classification number: G06N3/04 , G06N3/0454 , G06N3/063
Abstract: 提供了一种用于在服务器部件上实现深度神经网络的方法,该服务器部件包括主机部件和耦合到主机部件的硬件加速部件,主机部件包括CPU。深度神经网络包括多个层。该方法包括将深度神经网络划分成第一片段和第二片段,第一片段包括多个层的第一子集,第二片段包括多个层的第二子集,配置主机部件来实现第一片段,并配置硬件加速部件来实现第二片段。
-
公开(公告)号:CN108431831B
公开(公告)日:2023-03-31
申请号:CN201680077401.4
申请日:2016-12-22
Applicant: 微软技术许可有限责任公司
Abstract: 循环代码处理器优化被实现为处理器流水线的循环优化器扩展。循环优化器生成与包括至少一个零可优化指令的代码循环相关联的优化代码。循环优化器可以生成与特定代码循环相关联的多个版本的优化代码,其中多个版本的优化代码中的每个具有不同的相关联的条件,优化代码能够在该不同的相关联的条件下被安全地执行。
-
公开(公告)号:CN108431831A
公开(公告)日:2018-08-21
申请号:CN201680077401.4
申请日:2016-12-22
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F9/30181 , G06F9/3017 , G06F9/30196 , G06F9/325 , G06F9/3802 , G06F9/3812 , G06F9/3826 , G06F9/3867 , G06F12/0875 , G06F2212/452 , G06N3/02
Abstract: 循环代码处理器优化被实现为处理器流水线的循环优化器扩展。循环优化器生成与包括至少一个零可优化指令的代码循环相关联的优化代码。循环优化器可以生成与特定代码循环相关联的多个版本的优化代码,其中多个版本的优化代码中的每个具有不同的相关联的条件,优化代码能够在该不同的相关联的条件下被安全地执行。
-
公开(公告)号:CN107710237B
公开(公告)日:2021-08-06
申请号:CN201680039131.8
申请日:2016-06-24
Applicant: 微软技术许可有限责任公司
Abstract: 提供了一种用于在服务器部件上实现深度神经网络的方法,该服务器部件包括主机部件和耦合到主机部件的硬件加速部件,主机部件包括CPU。深度神经网络包括多个层。该方法包括将深度神经网络划分成第一片段和第二片段,第一片段包括多个层的第一子集,第二片段包括多个层的第二子集,配置主机部件来实现第一片段,并配置硬件加速部件来实现第二片段。
-
公开(公告)号:CN107836001A
公开(公告)日:2018-03-23
申请号:CN201680039028.3
申请日:2016-06-27
Applicant: 微软技术许可有限责任公司
CPC classification number: G06N3/063 , G06F15/7803 , G06N3/04 , G06N3/0454 , G06F15/76
Abstract: 提供一种用于实现卷积神经网络的硬件加速部件。该硬件加速部件包括N行功能单元和M列功能单元的阵列、存储输入数据的N个输入数据缓冲器以及存储权重数据的M个权重数据缓冲器。N个输入数据缓冲器中的每个输入数据缓冲器被耦合到N行功能单元中对应的一行功能单元。M个权重数据缓冲器中的每个权重数据缓冲器被耦合到M个功能单元列中对应的功能单元列。行中的每个功能单元接收相同的输入数据集合。列中的每个功能单元从耦合到该行的权重数据缓冲器接收相同的权重数据集合。功能单元中的每个功能单元对接收到的输入数据和接收到的权重数据执行卷积,并且M个功能单元列提供M个输出数据平面。
-
-
-
-