原生张量处理器
摘要:
原生张量处理器使用外积之和计算张量缩并。在一种实现中,原生张量处理器优选地被实现为单一集成电路,并且包括输入缓冲器和缩并引擎。输入缓冲器缓冲从片外检索的张量元素,并根据需要将元素传输到缩并引擎。缩并引擎通过执行来自等价矩阵乘法的计算来计算张量缩并,就好像张量被展开成矩阵一样,但避免了明确展开张量的开销。缩并引擎包括多个外积单元,多个外积单元通过外积之和计算矩阵乘法。通过使用外积,等价矩阵乘法可以被分割成更小的矩阵乘法,这些更小的矩阵乘法在所需的局部张量间进行。
公开/授权文献
0/0