-
公开(公告)号:CN119783810A
公开(公告)日:2025-04-08
申请号:CN202411350668.9
申请日:2024-09-26
Abstract: 公开了一种加速器设备,包括接口电路,与外部设备通信,存储器,存储通过接口电路接收的第一数据,极化编码器,对从存储器提供的第一数据执行极化编码并输出极化编码的结果作为第二数据、以及加速器核心,加载第二数据。第一数据是压缩的权重数据,第二数据是解压缩的权重数据,加速器核心被配置为基于第二数据执行基于机器学习的推理,并且第一数据的长度是可变的。
-
公开(公告)号:CN119884571A
公开(公告)日:2025-04-25
申请号:CN202411484632.X
申请日:2024-10-23
IPC: G06F17/16
Abstract: 提供了矩阵乘法器和包括矩阵乘法器的矩阵乘法器件的操作方法。一种矩阵乘法器包括:输入向量缩放器,基于第一输入向量、多个公共缩放系数以及第一乘法缩放系数至第R乘法缩放系数来生成第一量化缩放输入向量;第一数据类型转换器,基于第一量化缩放输入向量来生成第一定点量化缩放输入向量;元件阵列,包括第一处理元件和第二处理元件,第一处理元件基于第一定点量化缩放输入向量和第一多个量化符号位来生成第一定点输出元素,第二处理元件基于第一定点量化缩放输入向量和第二多个量化符号位来生成第二定点输出元素;以及第二数据类型转换器,通过转换第一定点输出元素和第二定点输出元素的数据类型来生成并输出第一输出元素和第二输出元素。
-
公开(公告)号:CN119884570A
公开(公告)日:2025-04-25
申请号:CN202411452798.3
申请日:2024-10-17
IPC: G06F17/16
Abstract: 一种矩阵乘法器包含:输入向量缩放器,被配置为基于第一输入向量和多个量化缩放系数产生第一缩放的输入向量;第一数据类型转换器,被配置为基于第一缩放的输入向量生成第一定点缩放的输入向量;处理元件阵列,包括被配置为基于第一定点缩放的输入向量和第一多个量化符号值生成第一定点输出元素的第一处理元件和被配置为基于第一定点缩放的输入向量和第二多个量化符号值生成第二定点输出元素的第二处理元件;以及第二数据类型转换器,被配置为通过转换第一和第二定点输出元素的数据类型来生成第一和第二输出元素,并输出包括第一和第二输出元素的第一输出向量。
-
公开(公告)号:CN119781732A
公开(公告)日:2025-04-08
申请号:CN202411352504.X
申请日:2024-09-26
Abstract: 至少一个实施例提供了一种计算设备,包括:控制器,其接收第一数据类型的第一输入数据和不同于第一数据类型的第二数据类型的第二输入数据,并且基于第一输入数据和第二输入数据的位数来输出表示第一数据类型的第一信号、表示第二数据类型的第二信号和时钟信号;以及计算电路,其基于第一信号、第二信号和时钟信号来执行第一输入数据和第二输入数据的乘法计算,并且产生输出数据。
-
公开(公告)号:CN119690378A
公开(公告)日:2025-03-25
申请号:CN202411285452.9
申请日:2024-09-13
IPC: G06F7/485
Abstract: 公开了一种对多个数据执行累加运算的加速器,每个数据是浮点类型。一种操作加速器的方法,包括:加载第一数据;找到第一指数,该第一指数是第一数据的指数中的最大值;通过基于第一指数对第一数据的第一尾数执行移位来生成对齐的第一尾数,并且通过对对齐的第一尾数进行累加运算来生成第一累加值;加载第二数据;找到第二指数,该第二指数是第二数据的指数中的最大值;以及通过对第一累加值进行移位来生成第一对齐累加值,通过对第二数据的第二尾数进行移位来生成对齐的第二尾数,并且通过对对齐的第二尾数和第一对齐累加值进行累加运算来生成第二累加值。
-
公开(公告)号:CN111788582A
公开(公告)日:2020-10-16
申请号:CN201880089689.6
申请日:2018-11-21
Applicant: 三星电子株式会社
Abstract: 提供了一种电子设备。所述电子设备包括:第一存储器,被配置为存储包括多个第一元素的第一人工智能(AI)模型;以及处理器,包括第二存储器。第二存储器被配置为存储包括多个第二元素的第二AI模型。所述处理器被配置为基于第二AI模型从输入数据获取输出数据。第一AI模型通过AI算法被训练。所述多个第二元素中的每一个第二元素包括在所述多个第一元素中的各个第一元素中包括的多个位中的至少一个较高位。
-
-
公开(公告)号:CN111919389B
公开(公告)日:2024-12-27
申请号:CN201980021303.2
申请日:2019-01-04
Applicant: 三星电子株式会社
Abstract: 提供了一种数据压缩方法和数据解压缩方法。该方法包括:修剪包括多个权重参数的原始数据;在修剪后的原始数据中包括的多个权重参数中确认至少一个第一值并未通过修剪而改变的至少一个第一权重参数;获得包括至少一个第一值并未改变的至少一个第一权重参数的位置信息的第一索引数据;从修剪后的原始数据中包括的多个权重参数之中确认至少一个第二值由于修剪而改变了的至少一个第二权重参数;以及用无关参数替换至少一个第二值改变了的至少一个第二权重参数。
-
公开(公告)号:CN111788582B
公开(公告)日:2024-08-16
申请号:CN201880089689.6
申请日:2018-11-21
Applicant: 三星电子株式会社
Abstract: 提供了一种电子设备。所述电子设备包括:第一存储器,被配置为存储包括多个第一元素的第一人工智能(AI)模型;以及处理器,包括第二存储器。第二存储器被配置为存储包括多个第二元素的第二AI模型。所述处理器被配置为基于第二AI模型从输入数据获取输出数据。第一AI模型通过AI算法被训练。所述多个第二元素中的每一个第二元素包括在所述多个第一元素中的各个第一元素中包括的多个位中的至少一个较高位。
-
公开(公告)号:CN111971697B
公开(公告)日:2024-06-04
申请号:CN201980025238.0
申请日:2019-01-04
Applicant: 三星电子株式会社
IPC: G06N3/08 , G06N3/0464 , G06N10/00 , B82Y10/00
Abstract: 公开了一种电子装置。本电子装置包括:存储器;以及处理器,对基于深度学习训练的神经网络进行量化以生成量化的神经网络,并且将量化的神经网络存储在所述存储器中,其中,所述处理器以预设的第一比特单位对训练的神经网络的神经元之间的训练的连接强度进行量化,以预设的第二比特单位对量化的连接强度进行反量化,对反量化的连接强度进行再训练,并且以预设的第一比特单位对再训练的连接强度进行量化。
-
-
-
-
-
-
-
-
-