-
公开(公告)号:CN113254871B
公开(公告)日:2024-09-03
申请号:CN202110566425.9
申请日:2017-01-13
申请人: 谷歌有限责任公司
发明人: 拉维·纳拉亚纳斯瓦米 , 拉胡尔·纳加拉扬 , 禹同爀 , 克里斯多佛·丹尼尔·利里
摘要: 本公开涉及矩阵处理装置。提供了方法、系统、和装置,其包括用于将稀疏元素变换为稠密矩阵的系统。所述系统包括数据提取单元,其包括多个处理器,所述数据提取单元被配置为基于对特定稀疏元素的子集的识别,确定用于提取所述特定稀疏元素的所述子集的处理器指定。所述系统包括串接单元,所述串接单元被配置为基于被应用于由所述数据提取单元提取的稀疏元素的变换来生成输出稠密矩阵。
-
公开(公告)号:CN114270319A
公开(公告)日:2022-04-01
申请号:CN202080058657.7
申请日:2020-10-07
申请人: 谷歌有限责任公司
发明人: 戴维·亚历山大·迈内默 , 拉维·纳拉亚纳斯瓦米 , 禹同爀 , 卡雷尔·丹尼尔·基勒布鲁
摘要: 描述了包括用于在计算单元之间重新分配张量元素的装置的方法、系统和装置。在一个方面,一种方法包括:在计算系统的多个计算单元之间分配N维张量的张量元素。每个计算单元将先前分配到计算单元的张量元素的子集重新分配到计算单元。每个计算单元访问重新分配分割数据,该重新分配分割数据针对每个计算单元指定在重新分配张量元素之后将由计算单元所存储的张量元素。针对先前分配到特定计算单元的每个张量元素,计算单元基于张量元素的多维索引来确定张量元素的全局线性化索引值。计算单元使用重新分配分割数据和全局线性化索引值来确定目的地计算单元并且将张量元素发送到目的地计算单元。
-
公开(公告)号:CN107045492B
公开(公告)日:2021-06-11
申请号:CN201710025656.2
申请日:2017-01-13
申请人: 谷歌有限责任公司
发明人: 拉维·纳拉亚纳斯瓦米 , 拉胡尔·纳加拉扬 , 禹同爀 , 克里斯多佛·丹尼尔·利里
IPC分类号: G06F17/16
摘要: 本申请涉及矩阵处理装置。提供了方法、系统、和装置,其包括用于将稀疏元素变换为稠密矩阵的系统。所述系统包括数据提取单元,其包括多个处理器,所述数据提取单元被配置为基于对特定稀疏元素的子集的识别,确定用于提取所述特定稀疏元素的所述子集的处理器指定。所述系统包括串接单元,所述串接单元被配置为基于被应用于由所述数据提取单元提取的稀疏元素的变换来生成输出稠密矩阵。
-
公开(公告)号:CN112000919A
公开(公告)日:2020-11-27
申请号:CN202010713206.4
申请日:2017-01-13
申请人: 谷歌有限责任公司
发明人: 拉维·纳拉亚纳斯瓦米 , 拉胡尔·纳加拉扬 , 禹同爀 , 克里斯多佛·丹尼尔·利里
IPC分类号: G06F17/16
摘要: 本申请涉及矩阵处理装置。提供了方法、系统、和装置,其包括用于将稀疏元素变换为稠密矩阵的系统。所述系统被配置为:接收对于输出稠密矩阵的请求,所述输出稠密矩阵基于包括与第一稠密矩阵相关联的稀疏元素和与第二稠密矩阵相关联的稀疏元素的稀疏元素;获得由所述第一稀疏元素访问单元群组提取的与所述第一稠密矩阵相关联的稀疏元素;获得由所述第二稀疏元素访问单元群组提取的与所述第二稠密矩阵相关联的稀疏元素;以及对与所述第一稠密矩阵相关联的稀疏元素和与所述第二稠密矩阵相关联的稀疏元素进行变换以生成包括与所述第一稠密矩阵相关联的稀疏元素和与所述第二稠密矩阵相关联的稀疏元素的所述输出稠密矩阵。
-
公开(公告)号:CN110462641A
公开(公告)日:2019-11-15
申请号:CN201880019410.7
申请日:2018-05-11
申请人: 谷歌有限责任公司
发明人: 安德烈亚斯·格奥尔格·诺瓦特济克 , 奥利维尔·泰马姆 , 拉维·纳拉亚纳斯瓦米 , 乌代·库马尔·达萨里
摘要: 一种三维神经网络加速器,包括:第一神经网络加速器瓦片,其包括第一传输线圈;以及第二神经网络加速器瓦片,其包括第二传输线圈,其中,第一神经网络加速器瓦片与第二神经网络加速器瓦片相邻并垂直对齐,并且其中第一传输线圈被配置为经由电感耦合与第二传输线圈无线通信。
-
公开(公告)号:CN112204517B
公开(公告)日:2024-11-19
申请号:CN201980036125.0
申请日:2019-08-07
申请人: 谷歌有限责任公司
发明人: 拉维·纳拉亚纳斯瓦米
-
公开(公告)号:CN118626045A
公开(公告)日:2024-09-10
申请号:CN202410824175.8
申请日:2019-10-11
申请人: 谷歌有限责任公司
发明人: 阿南德·苏雷什·卡纳 , 拉维·纳拉亚纳斯瓦米
摘要: 本发明涉及低功率加法器电路。该电路包括第一加法器部分,该第一加法器部分接收第一输入和第二输入并且将所述输入相加以生成第一和。该电路也包括第二加法器部分,该第二加法器部分接收第一输入和第二输入并且将所述输入相加以生成第二和。该电路的输入处理器接收第一输入和第二输入,确定在第一输入与第二输入之间的关系是否满足条件集,并且使用所确定的在第一输入与第二输入之间的关系来选择所述加法器电路的高功率模式或所述加法器电路的低功率模式。当所述关系满足所述条件集时,所述高功率模式被选择并且将所述第一输入和第二输入路由到第二加法器部分。
-
公开(公告)号:CN113632068A
公开(公告)日:2021-11-09
申请号:CN201980094598.6
申请日:2019-11-26
申请人: 谷歌有限责任公司
发明人: 劳伦斯·J·马达尔三世 , 特米塔约·法德鲁 , 哈西特·哈伊坦 , 拉维·纳拉亚纳斯瓦米
IPC分类号: G06F12/1027 , G06N3/063
摘要: 方法、系统和装置,包括在计算机存储介质上编码的计算机程序,以用于将外部存储器虚拟化为对机器学习加速器本地的。一种环境计算系统包括:环境机器学习引擎;低功率CPU;以及SRAM,其至少在所述环境机器学习引擎和所述低功率CPU当中被共享;其中所述环境机器学习引擎包括用以从所述环境机器学习引擎所生成的虚拟地址转换为所述SRAM内的物理地址的虚拟地址逻辑。
-
公开(公告)号:CN107045493B
公开(公告)日:2020-08-18
申请号:CN201710025742.3
申请日:2017-01-13
申请人: 谷歌有限责任公司
发明人: 拉维·纳拉亚纳斯瓦米 , 拉胡尔·纳加拉扬 , 禹同爀 , 克里斯多佛·丹尼尔·利里
IPC分类号: G06F17/16
摘要: 本申请涉及矩阵处理装置。提供了方法、系统、和装置,其包括用于将稀疏元素变换为稠密矩阵的系统。所述系统被配置为:接收对于输出稠密矩阵的请求,所述输出稠密矩阵基于包括与第一稠密矩阵相关联的稀疏元素和与第二稠密矩阵相关联的稀疏元素的稀疏元素;获得由所述第一稀疏元素访问单元群组提取的与所述第一稠密矩阵相关联的稀疏元素;获得由所述第二稀疏元素访问单元群组提取的与所述第二稠密矩阵相关联的稀疏元素;以及对与所述第一稠密矩阵相关联的稀疏元素和与所述第二稠密矩阵相关联的稀疏元素进行变换以生成包括与所述第一稠密矩阵相关联的稀疏元素和与所述第二稠密矩阵相关联的稀疏元素的所述输出稠密矩阵。
-
公开(公告)号:CN118152305A
公开(公告)日:2024-06-07
申请号:CN202410200725.9
申请日:2019-11-26
申请人: 谷歌有限责任公司
发明人: 劳伦斯·J·马达尔三世 , 特米塔约·法德鲁 , 哈西特·哈伊坦 , 拉维·纳拉亚纳斯瓦米
IPC分类号: G06F12/1027 , G06N3/063
摘要: 本申请公开了在环境计算系统上虚拟化存储器的方法和系统。方法、系统和装置,包括在计算机存储介质上编码的计算机程序,以用于将外部存储器虚拟化为对机器学习加速器本地的。一种环境计算系统包括:环境机器学习引擎;低功率CPU;以及SRAM,其至少在所述环境机器学习引擎和所述低功率CPU当中被共享;其中所述环境机器学习引擎包括用以从所述环境机器学习引擎所生成的虚拟地址转换为所述SRAM内的物理地址的虚拟地址逻辑。
-
-
-
-
-
-
-
-
-