-
公开(公告)号:CN112241291A
公开(公告)日:2021-01-19
申请号:CN202010690694.1
申请日:2020-07-17
Applicant: 国际商业机器公司
Abstract: 一种计算机实施的方法、系统和计算机程序产品,用于在包括估计块的浮点单元中仅使用两个完全流水线指令来执行指数计算。该方法包括通过将输入操作数与预定常数值相乘来计算中间值y’。输入操作数以浮点表示形式被接收。该方法还包括通过运行融合指令来计算输入操作数的指数结果。该融合指令包括将中间值y’转换为由v个最高有效位(MSB)和w个最低有效位(LSB)表示的整数表示z。该融合指令还包括基于整数表示z中的v个MSB来确定指数结果的指数位。该方法还包括基于整数表示z中的w个LSB,使用预定数量的段,根据分段线性映射函数来确定指数结果的尾数位。
-
公开(公告)号:CN112204516A
公开(公告)日:2021-01-08
申请号:CN201980036712.X
申请日:2019-05-30
Applicant: 国际商业机器公司
IPC: G06F7/00
Abstract: 提出使用增强浮点数格式对二进制浮点数进行操作和计算的技术。增强格式可以包括单个符号位、指数的六位和小数的九位。使用指数的六位可提供增强的指数范围,其便于计算密集型算法的期望的快速收敛和用于计算密集型应用的低错误率。增强格式可以采用最低二进制码的指定定义,该定义使得最低二进制码能够用于零和正规数;以及最高二进制代码的指定定义,该定义使其能够被构造为具有用于合并的非数(NaN)/无穷大符号的一个数据点和用于有限数的剩余数据点。零与合并的NaN/无穷大的符号可以是“无关紧要”项。增强格式仅采用一种舍入模式,其用于向最近舍入(rounding toward nearest up)。
-
公开(公告)号:CN112241291B
公开(公告)日:2024-11-08
申请号:CN202010690694.1
申请日:2020-07-17
Applicant: 国际商业机器公司
IPC: G06F9/38 , G06N3/0464 , G06N3/08
Abstract: 一种计算机实施的方法、系统和计算机程序产品,用于在包括估计块的浮点单元中仅使用两个完全流水线指令来执行指数计算。该方法包括通过将输入操作数与预定常数值相乘来计算中间值y’。输入操作数以浮点表示形式被接收。该方法还包括通过运行融合指令来计算输入操作数的指数结果。该融合指令包括将中间值y’转换为由v个最高有效位(MSB)和w个最低有效位(LSB)表示的整数表示z。该融合指令还包括基于整数表示z中的v个MSB来确定指数结果的指数位。该方法还包括基于整数表示z中的w个LSB,使用预定数量的段,根据分段线性映射函数来确定指数结果的尾数位。
-
公开(公告)号:CN111538532A
公开(公告)日:2020-08-14
申请号:CN202010040575.1
申请日:2020-01-15
Applicant: 国际商业机器公司
Abstract: 在一个实施例中,一种方法包括使用由混合格式表示的数来配置用于浮点计算的专用电路,其中混合格式包括第一格式和第二格式。在该实施例中,该方法包括操作进一步配置的专用电路,以在用于训练深度学习网络的正向传递期间以第一格式存储数值近似值。在该实施例中,该方法包括操作进一步配置的专用电路,以在用于训练深度学习网络的反向传递期间以第二格式存储第二数值近似值。
-
公开(公告)号:CN112204516B
公开(公告)日:2024-05-24
申请号:CN201980036712.X
申请日:2019-05-30
Applicant: 国际商业机器公司
IPC: G06F7/00
Abstract: 提出使用增强浮点数格式对二进制浮点数进行操作和计算的技术。增强格式可以包括单个符号位、指数的六位和小数的九位。使用指数的六位可提供增强的指数范围,其便于计算密集型算法的期望的快速收敛和用于计算密集型应用的低错误率。增强格式可以采用最低二进制码的指定定义,该定义使得最低二进制码能够用于零和正规数;以及最高二进制代码的指定定义,该定义使其能够被构造为具有用于合并的非数(NaN)/无穷大符号的一个数据点和用于有限数的剩余数据点。零与合并的NaN/无穷大的符号可以是“无关紧要”项。增强格式仅采用一种舍入模式,其用于向最近舍入(rounding toward nearest up)。
-
公开(公告)号:CN111538532B
公开(公告)日:2023-07-07
申请号:CN202010040575.1
申请日:2020-01-15
Applicant: 国际商业机器公司
IPC: G06F9/30 , G06N3/0464 , G06N3/084
Abstract: 在一个实施例中,一种方法包括使用由混合格式表示的数来配置用于浮点计算的专用电路,其中混合格式包括第一格式和第二格式。在该实施例中,该方法包括操作进一步配置的专用电路,以在用于训练深度学习网络的正向传递期间以第一格式存储数值近似值。在该实施例中,该方法包括操作进一步配置的专用电路,以在用于训练深度学习网络的反向传递期间以第二格式存储第二数值近似值。
-
-
-
-
-