-
公开(公告)号:CN115658147A
公开(公告)日:2023-01-31
申请号:CN202211365794.2
申请日:2018-04-20
Applicant: 英特尔公司
Inventor: R·巴瑞克 , E·乌尔德-阿迈德-瓦尔 , 陈晓明 , D·斯里瓦斯塔瓦 , 姚安邦 , K·尼利斯 , E·努维塔蒂 , S·S·巴格索克希 , B·韦布 , T·史佩斯曼 , P·T·唐
Abstract: 本申请公开了用于高效卷积的专用固定功能硬件。一个实施例提供一种用于执行机器学习操作的计算设备,所述设备包括用于将单指令解码为已解码指令的解码单元,所述已解码指令用于执行一个或多个机器学习操作,其中,所述解码单元用于基于所述一个或多个机器学习操作的参数来请求调度器将所述一个或多个机器学习操作调度给可编程计算单元阵列和固定功能计算单元中的一个。
-
公开(公告)号:CN108734636A
公开(公告)日:2018-11-02
申请号:CN201810360463.7
申请日:2018-04-20
Applicant: 英特尔公司
Inventor: R·巴瑞克 , E·乌尔德-阿迈德-瓦尔 , 陈晓明 , D·斯里瓦斯塔瓦 , 姚安邦 , K·尼利斯 , E·努维塔蒂 , S·S·巴格索克希 , B·韦布 , T·史佩斯曼 , P·T·唐
IPC: G06T1/20
CPC classification number: G06N3/063 , G06F9/3001 , G06F9/3017 , G06F9/3851 , G06F9/3887 , G06F9/3895 , G06N3/0445 , G06N3/0454 , G06N3/084 , G06T1/20
Abstract: 一个实施例提供一种用于执行机器学习操作的计算设备,所述设备包括用于将单指令解码为已解码指令的解码单元,所述已解码指令用于执行一个或多个机器学习操作,其中,所述解码单元用于基于所述一个或多个机器学习操作的参数来请求调度器将所述一个或多个机器学习操作调度给可编程计算单元阵列和固定功能计算单元中的一个。
-
-
公开(公告)号:CN108734285A
公开(公告)日:2018-11-02
申请号:CN201810367363.7
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: K·尼利斯 , 姚安邦 , 陈晓明 , E·乌尔德-阿迈德-瓦尔 , S·S·巴格索克希 , E·努维塔蒂 , B·文布 , N·C·加洛泊凡博列斯 , R·巴瑞克 , T-H·林 , K·辛哈
Abstract: 一个实施例提供了用于执行机器学习操作的计算装置,该装置包括:解码单元,用于将单个指令解码成经解码的指令,该经解码的指令指定包括输入值和与神经网络相关联的量化权重值在内的多个操作数;算术逻辑单元,该算术逻辑单元包括桶形移位器、加法器和累加器寄存器,其中为了执行经解码的指令,桶形移位器将输入值移位量化的权重值以生成经移位的输入值,并且加法器将经移位的输入值加到被存储在累加器寄存器中的值,并更新被存储在累加器寄存器中的值。
-
公开(公告)号:CN108734282A
公开(公告)日:2018-11-02
申请号:CN201810233635.4
申请日:2018-03-21
Applicant: 英特尔公司
IPC: G06N3/063
CPC classification number: G06N3/063 , G06F7/523 , G06F7/5443 , G06F2207/3828 , G06F2207/4824 , G06N3/08
Abstract: 系统和方法涉及通过将值组合在操作数中以提高计算密度来改进集成电路中的神经网络的吞吐量。系统包括具有乘法器电路的集成电路(IC)。IC接收第一操作数中的第一值和第二值。IC经由乘法器电路对第一操作数和第二操作数执行乘法运算以产生至少部分地基于第一值的第一相乘的乘积以及至少部分地基于第二值的第二相乘的乘积。
-
公开(公告)号:CN114626973A
公开(公告)日:2022-06-14
申请号:CN202210278133.X
申请日:2018-04-20
Applicant: 英特尔公司
Inventor: R·巴瑞克 , E·乌尔德-阿迈德-瓦尔 , 陈晓明 , D·斯里瓦斯塔瓦 , 姚安邦 , K·尼利斯 , E·努维塔蒂 , S·S·巴格索克希 , B·韦布 , T·史佩斯曼 , P·T·唐
Abstract: 本申请公开了用于高效卷积的专用固定功能硬件。一个实施例提供一种用于执行机器学习操作的计算设备,所述设备包括用于将单指令解码为已解码指令的解码单元,所述已解码指令用于执行一个或多个机器学习操作,其中,所述解码单元用于基于所述一个或多个机器学习操作的参数来请求调度器将所述一个或多个机器学习操作调度给可编程计算单元阵列和固定功能计算单元中的一个。
-
公开(公告)号:CN112330523A
公开(公告)日:2021-02-05
申请号:CN202010848468.1
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: A·科克 , M·麦克弗森 , J·雷 , 姚安邦 , L·马 , L·赫德 , S·巴格索尔基 , J·维斯特 , A·阿普 , B·阿什鲍格 , D·金 , E·奥尔德-艾哈迈德-瓦尔 , P·唐 , X·陈 , B·拉克什马南 , K·尼利斯 , M·斯特里克兰
IPC: G06T1/20 , G06T1/60 , G06F3/14 , G06F7/483 , G06F9/30 , G06F9/38 , G06F9/50 , G06N3/04 , G06N3/08 , G06N3/063 , G06N20/00 , G06T15/00
Abstract: 本发明标题为“低精度机器学习操作的计算优化”。一个实施例提供了一种包括动态精度浮点单元的通用图形处理单元,所述动态精度浮点单元包括控制单元,所述控制单元具有精度跟踪硬件逻辑以跟踪与目标精度相关的计算数据的精度位的可用数量,其中动态精度浮点单元包括计算逻辑来以多个精度输出数据。
-
公开(公告)号:CN108734642A
公开(公告)日:2018-11-02
申请号:CN201810367099.7
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: A·考克 , A·R·阿普 , K·辛哈 , J·雷 , B·文布 , E·乌尔德-阿迈德-瓦尔 , S·S·巴格索克希 , 姚安邦 , K·尼利斯 , 陈晓明 , J·C·韦斯特 , J·E·高茨克里奇 , P·萨蒂 , C·萨科斯维尔 , F·阿赫巴里 , N·R·萨蒂什 , 马立伟 , J·波特森 , E·努维塔蒂 , T·T·施吕斯列尔 , A·N·沙阿 , J·肯尼迪 , V·兰甘纳坦 , S·加哈吉达
CPC classification number: G06N3/08 , G06N3/0445 , G06N3/0454 , G06N3/0481 , G06N3/063 , G06N20/00 , G06T1/20 , G06F9/5027 , G06F9/5066
Abstract: 本申请公开了对机器学习模型的动态分布训练。在示例中,一种装置包括:多个执行单元,包括至少第一类型的执行单元和第二类型的执行单元,以及逻辑,该逻辑至少部分地包括硬件逻辑,用于对工作负荷进行分析并且将工作负荷分配给第一类型的执行单元或第二类型的执行单元中的一个。还公开并要求保护其他实施例。
-
公开(公告)号:CN113496457B
公开(公告)日:2025-03-28
申请号:CN202110725327.5
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: A·科克 , M·麦克弗森 , J·雷 , 姚安邦 , L·马 , L·赫德 , S·巴格索尔基 , J·维斯特 , A·阿普 , B·阿什鲍格 , D·金 , E·奥尔德-艾哈迈德-瓦尔 , P·唐 , X·陈 , B·拉克什马南 , K·尼利斯 , M·斯特里克兰
IPC: G06T1/20 , G06T1/60 , G06F7/57 , G06F9/38 , G06F15/167 , G06F15/17 , G06N3/0464 , G06N3/044 , G06N3/0442 , G06N3/088 , G06N3/098
Abstract: 本申请发明名称为:低精度机器学习操作的计算优化。一个实施例提供了一种包括动态精度浮点单元的通用图形处理单元,所述动态精度浮点单元包括控制单元,所述控制单元具有精度跟踪硬件逻辑以跟踪与目标精度相关的计算数据的精度位的可用数量,其中动态精度浮点单元包括计算逻辑来以多个精度输出数据。
-
公开(公告)号:CN119440633A
公开(公告)日:2025-02-14
申请号:CN202411472207.9
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: A·科克 , M·麦克弗森 , J·雷 , 姚安邦 , L·马 , L·赫德 , S·巴格索尔基 , J·维斯特 , A·阿普 , B·阿什鲍格 , D·金 , E·奥尔德-艾哈迈德-瓦尔 , P·唐 , X·陈 , B·拉克什马南 , K·尼利斯 , M·斯特里克兰
Abstract: 一个实施例提供了一种包括动态精度浮点单元的通用图形处理单元,所述动态精度浮点单元包括控制单元,所述控制单元具有精度跟踪硬件逻辑以跟踪与目标精度相关的计算数据的精度位的可用数量,其中动态精度浮点单元包括计算逻辑来以多个精度输出数据。
-
-
-
-
-
-
-
-
-