-
公开(公告)号:CN114020626A
公开(公告)日:2022-02-08
申请号:CN202111306220.3
申请日:2021-11-05
Applicant: 北京百度网讯科技有限公司
IPC: G06F11/36 , G06F30/367
Abstract: 本公开提供了一种芯片验证方法、装置、设备及介质,涉及计算机技术领域,尤其涉及芯片领域。实现方案为:确定第一数量的指令流;针对任意一条指令流,执行验证操作,验证操作至少包括:针对每一个运算描述符,使多个运算模块中的至少一个运算模块来执行针对该运算描述符的数据处理,以得到该运算描述符所对应的处理结果;响应于执行至中止描述符,确定位于该中止描述符之前的至少一个运算描述符所对应的反馈结果,其中,反馈结果为根据至少一个运算描述符中的每一个运算描述符所对应的处理结果而得到;以及将至少一个运算描述符所对应的反馈结果与至少一个运算描述符所对应的仿真结果进行比对,以确定对芯片的验证结果。
-
公开(公告)号:CN107817888A
公开(公告)日:2018-03-20
申请号:CN201610827237.6
申请日:2016-09-14
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了用于操作无人驾驶车辆的FPGA板卡的方法和装置。所述方法的一具体实施方式包括:采集无人驾驶车辆所处驾驶场景的驾驶场景信息;根据所述驾驶场景信息,确定所述无人驾驶车辆在所述驾驶场景下执行计算操作的速度;比较所述速度与速度阈值;响应于所述速度小于所述速度阈值,切换所述无人驾驶车辆中用于执行所述计算操作的FPGA板卡的工作模式,以降低所述FPGA板卡的功耗。该实施方式实现了对FPGA板卡工作模式的自适应调整,降低了整体的功耗。
-
公开(公告)号:CN113407352A
公开(公告)日:2021-09-17
申请号:CN202110821443.7
申请日:2021-07-20
Applicant: 北京百度网讯科技有限公司
IPC: G06F9/50
Abstract: 本公开提供了用于处理任务的方法、处理器、设备和可读存储介质,涉及计算机技术领域,尤其涉及芯片和深度学习领域。具体实现方案为:针对预定类型的计算任务,将计算任务中的多个指令块分配给通用处理核和专用加速核;专用加速核中的控制单元将与其耦合的预定的协处理单元的指令完成指示通过信号通路传送给通用处理核的至少一个处理单元,信号通路被配置为将至少一个通用处理单元耦合到控制单元;以及如果确定接收到指令完成指示,通用处理核通过数据通路获取专用加速核中的第一片内缓存中的数据以用于完成计算任务,数据通路被配置为将通用处理核耦合到第一片内缓存。通过该方法,避免了计算任务切换开销,改进了存储资源和计算资源的利用率。
-
公开(公告)号:CN113222101A
公开(公告)日:2021-08-06
申请号:CN202010080940.1
申请日:2020-02-05
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开的实施例提出了深度学习处理装置、方法、设备和存储介质,涉及人工智能领域。一种深度学习处理装置包括至少一个矩阵乘加模块,被配置为执行卷积神经网络中的卷积层的卷积核参数值矩阵与第一误差梯度值矩阵的矩阵乘加运算,得到多个中间矩阵;存储装置,用于存储多个中间矩阵而无需对多个中间矩阵中的元素进行重新整形;以及多个矩阵累加模块,被配置为从存储装置读取多个中间矩阵并且以并行方式按卷积层的卷积方案执行基于多个中间矩阵的矩阵累加运算,得到针对卷积层的第二误差梯度值矩阵。这样的深度学习处理装置可以显著提高卷积反向操作的计算效率,在计算速度和耗能方面均能得到改进。
-
公开(公告)号:CN113641404A
公开(公告)日:2021-11-12
申请号:CN202110819963.4
申请日:2021-07-20
Applicant: 北京百度网讯科技有限公司
Inventor: 王京
Abstract: 本公开提出了一种程序运行方法、装置、处理器芯片、电子设备和存储介质,涉及人工智能芯片技术领域。具体实现方案为:获取第一程序,对第一程序进行解析得到各个第一指令,将各个第一指令发送至对应的协处理器,在等待协处理器执行第一指令的过程中,向上位机发送请求消息,其中,请求消息用于获取不依赖于第一程序的运行结果的第二程序,获取上位机发送的第二程序,并运行第二程序。本公开中在第一程序运行完毕,而协处理器执行第一指令的过程中,运行不依赖第一程序运行结果的第二程序,实现了在异构处理器中同时运行两个不存在依赖关系的程序,提高了异构处理器的利用率,以及提高了程序运行效率。
-
公开(公告)号:CN110825665A
公开(公告)日:2020-02-21
申请号:CN201810908767.2
申请日:2018-08-10
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了数据获取单元和应用于控制器的数据获取方法。该数据获取单元包括存储器、至少两个数据处理部件和控制器;数据处理部件被配置成:向控制器发送数据获取请求,以及接收存储器发送的数据,其中,数据获取请求包括数据地址信息;控制器被配置成:接收预设时间段内数据处理部件发送的数据获取请求;按照预先设置的优先级顺序,从接收到的数据地址信息中选择预设数目个数据地址信息;将所选择的数据地址信息发送至存储器;存储器被配置成:从接收到的数据地址信息指示的地址中获取数据,将数据发送至与选择出的数据地址信息对应的数据处理部件。该实施方式可以节省访存带宽、节省数据获取单元内部的资源。
-
公开(公告)号:CN110826707B
公开(公告)日:2023-10-31
申请号:CN201810908049.5
申请日:2018-08-10
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了应用于卷积神经网络的加速方法和硬件加速器。该方法的一具体实施方式包括:接收对待整理的数据的加载指令,待整理的数据包括:特征图像数据;从片外存储器中读取出用于卷积计算任务的预设格式的数据中的待整理的数据,以及将读取出的待整理的数据写入到硬件加速器中的片上存储器中,其中,特征图像数据中的多个通道的通道数据中的预设长度的数据在片上存储器中连续存储。实现了在硬件加速器处理卷积计算任务的过程中,快速读取出适用于多个计算部件进行并行计算的诸如多个通道的预设长度的通道数据的数据,使得多个计算部件根据快速读取出的数据进行并行计算,提升硬件加速器处理卷积计算任务的处理速度。
-
公开(公告)号:CN113641621A
公开(公告)日:2021-11-12
申请号:CN202110819670.6
申请日:2021-07-20
Applicant: 北京百度网讯科技有限公司
IPC: G06F15/163 , G06F15/78
Abstract: 本公开提供了一种数据处理方法、装置、处理器芯片、电子设备和介质,涉及人工智能芯片技术领域。具体实现方案为:获取第一关系指令,根据第一关系指令,执行第一关系指令之前获取的至少一个第一计算指令,在至少一个第一计算指令执行完成的情况下,根据第一关系指令,发送确认信息,以使得接收到确认信息的第二协处理器,根据确认信息,恢复获取第二协处理器获取到的第二关系指令之后的第二计算指令的状态。本公开中,第一协处理和第二协处理间根据第一关系指令,生成确认信息,根据确认信息实现协处理器间自行协调运行时间,提升了整体的运行效率。
-
公开(公告)号:CN110827891A
公开(公告)日:2020-02-21
申请号:CN201810911943.8
申请日:2018-08-10
Applicant: 北京百度网讯科技有限公司
IPC: G11C11/413
Abstract: 本申请实施例公开了信号转换单元、存储器以及应用于存储器的驱动方法。该信号转换单元的使能控制模块基于写使能输入端接收到的写使能信号以及读写状态控制端接收到的读写状态控制信号,生成第一使能信号,将第一使能信号提供至第一使能输出端,基于读使能输入端接收到的读使能信号、写使能输入端接收到的写使能信号以及读写状态控制端接收到的读写状态控制信号,生成第二使能信号,将第二使能信号提供至第二使能输出端;读写地址确定模块基于第一使能信号,将写地址输入端接收到的写地址信号或读地址输入端接收到的读地址信号提供至地址信号输出端。该实施方式可以提高存储器中的数据存储容量;减小存储器所占用的版图的面积。
-
公开(公告)号:CN110825440A
公开(公告)日:2020-02-21
申请号:CN201810911185.X
申请日:2018-08-10
Applicant: 北京百度网讯科技有限公司
IPC: G06F9/38
Abstract: 本申请实施例公开了指令执行方法和装置。该方法的一具体实施方式包括:获取指令队列;按照预设顺序从指令队列中获取待发送指令,执行如下发送步骤:确定出待发送指令的类型;响应于确定出待发送指令为运算类指令,从执行部件集合中确定执行待发送指令的执行部件,将待发送指令发送到所确定的执行部件;响应于确定出待发送指令为阻塞类指令,在接收到用于指示与待发送指令关联的指令执行完成的信号之后,获取下一条待发送指令,继续执行发送步骤。该实施方式能够提高指令执行的可靠性、降低指令队列所占用的存储器的容量、提高指令执行效率。
-
-
-
-
-
-
-
-
-