-
公开(公告)号:CN106487896B
公开(公告)日:2019-10-08
申请号:CN201610898921.3
申请日:2016-10-14
Applicant: 北京百度网讯科技有限公司
IPC: H04L29/08
Abstract: 本申请公开了用于处理远程直接内存访问请求的方法和装置。所述方法的一具体实施方式包括:响应于用户空间发送批量远程直接内存访问RDMA请求,在RDMA网卡中为所述批量RDMA请求分配链路;将所述批量RDMA请求中的每个RDMA请求封装成供RDMA网卡的链路识别的描述符;将所封装成的多个描述符的描述符物理地址构造成链表;将所述链表的起始物理地址下发至所分配的链路,以使用所分配的链路依次读取所述链表中的描述符物理地址并对描述符物理地址对应的描述符中所封装的RDMA请求进行处理。该实施方式实现了RDMA请求的批量处理。
-
公开(公告)号:CN110827891B
公开(公告)日:2021-08-03
申请号:CN201810911943.8
申请日:2018-08-10
Applicant: 北京百度网讯科技有限公司
IPC: G11C11/413
Abstract: 本申请实施例公开了信号转换单元、存储器以及应用于存储器的驱动方法。该信号转换单元的使能控制模块基于写使能输入端接收到的写使能信号以及读写状态控制端接收到的读写状态控制信号,生成第一使能信号,将第一使能信号提供至第一使能输出端,基于读使能输入端接收到的读使能信号、写使能输入端接收到的写使能信号以及读写状态控制端接收到的读写状态控制信号,生成第二使能信号,将第二使能信号提供至第二使能输出端;读写地址确定模块基于第一使能信号,将写地址输入端接收到的写地址信号或读地址输入端接收到的读地址信号提供至地址信号输出端。该实施方式可以提高存储器中的数据存储容量;减小存储器所占用的版图的面积。
-
公开(公告)号:CN111209232A
公开(公告)日:2020-05-29
申请号:CN201811393074.0
申请日:2018-11-21
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开涉及用于访问静态随机存取存储器的方法、装置、电子设备和计算机可读存储介质。该方法包括接收针对与静态随机存取存储器相关联的数据的访问请求;响应于访问请求是针对数据的写入请求,将数据的预定大小的多个部分交织地写入不同的多个静态随机存取存储器;以及响应于访问请求是针对数据的读取请求,从多个静态随机存取存储器交织地读取数据的预定大小的多个部分。本公开的实施例能够实现SRAM的多读多写而无需重新设计SRAM电路,因此能够以低成本的方式实现SRAM的多读多写操作。
-
公开(公告)号:CN106487896A
公开(公告)日:2017-03-08
申请号:CN201610898921.3
申请日:2016-10-14
Applicant: 北京百度网讯科技有限公司
IPC: H04L29/08
Abstract: 本申请公开了用于处理远程直接内存访问请求的方法和装置。所述方法的一具体实施方式包括:响应于用户空间发送批量远程直接内存访问RDMA请求,在RDMA网卡中为所述批量RDMA请求分配链路;将所述批量RDMA请求中的每个RDMA请求封装成供RDMA网卡的链路识别的描述符;将所封装成的多个描述符的描述符物理地址构造成链表;将所述链表的起始物理地址下发至所分配的链路,以使用所分配的链路依次读取所述链表中的描述符物理地址并对描述符物理地址对应的描述符中所封装的RDMA请求进行处理。该实施方式实现了RDMA请求的批量处理。
-
公开(公告)号:CN113222101A
公开(公告)日:2021-08-06
申请号:CN202010080940.1
申请日:2020-02-05
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开的实施例提出了深度学习处理装置、方法、设备和存储介质,涉及人工智能领域。一种深度学习处理装置包括至少一个矩阵乘加模块,被配置为执行卷积神经网络中的卷积层的卷积核参数值矩阵与第一误差梯度值矩阵的矩阵乘加运算,得到多个中间矩阵;存储装置,用于存储多个中间矩阵而无需对多个中间矩阵中的元素进行重新整形;以及多个矩阵累加模块,被配置为从存储装置读取多个中间矩阵并且以并行方式按卷积层的卷积方案执行基于多个中间矩阵的矩阵累加运算,得到针对卷积层的第二误差梯度值矩阵。这样的深度学习处理装置可以显著提高卷积反向操作的计算效率,在计算速度和耗能方面均能得到改进。
-
公开(公告)号:CN112131174A
公开(公告)日:2020-12-25
申请号:CN201910554661.1
申请日:2019-06-25
Applicant: 北京百度网讯科技有限公司
IPC: G06F15/78
Abstract: 本公开的实施例涉及一种确定多个芯片之间的连接关系的方法、装置、电子设备和计算机可读存储介质。该方法可以包括确定由主机管理的多个芯片的身份信息,多个芯片通过各自的用于片间通信的片间通信接口相连接。该方法还可以包括使多个芯片中的一个或多个芯片获取与一个或多个芯片的片间通信接口连接的其他芯片的身份信息。该方法可以进一步包括经由一个或多个芯片的用于与主机通信的管理接口读取该其他芯片的身份信息,以确定多个芯片之间的连接关系。本公开的技术方案通过各芯片的片间通信接口来确定与之连接的芯片,从而可以在主机侧创建并维护该芯片网络的物理连接矩阵,进而为芯片网络连接的故障检测以及芯片网络拓扑的动态配置提供便利。
-
公开(公告)号:CN113641621A
公开(公告)日:2021-11-12
申请号:CN202110819670.6
申请日:2021-07-20
Applicant: 北京百度网讯科技有限公司
IPC: G06F15/163 , G06F15/78
Abstract: 本公开提供了一种数据处理方法、装置、处理器芯片、电子设备和介质,涉及人工智能芯片技术领域。具体实现方案为:获取第一关系指令,根据第一关系指令,执行第一关系指令之前获取的至少一个第一计算指令,在至少一个第一计算指令执行完成的情况下,根据第一关系指令,发送确认信息,以使得接收到确认信息的第二协处理器,根据确认信息,恢复获取第二协处理器获取到的第二关系指令之后的第二计算指令的状态。本公开中,第一协处理和第二协处理间根据第一关系指令,生成确认信息,根据确认信息实现协处理器间自行协调运行时间,提升了整体的运行效率。
-
公开(公告)号:CN112149049A
公开(公告)日:2020-12-29
申请号:CN201910559362.7
申请日:2019-06-26
Applicant: 北京百度网讯科技有限公司
Inventor: 龚小章
IPC: G06F17/16
Abstract: 本文中描述了用于变换矩阵的装置和方法、数据处理系统。该装置包括:第一移位单元,被配置为接收矩阵数据,并且对矩阵数据进行第一循环移位,以生成第一数据;缓存单元,被配置为将第一数据中的每一行数据以与该行数据中的各个数据的不同排列的排列顺序来写入到缓存单元,以将第一数据存储为第二数据;以及第二移位单元,被配置为从缓存单元读取第二数据,并且对第二数据进行第二循环移位,以生成变换后的矩阵数据。
-
公开(公告)号:CN110827891A
公开(公告)日:2020-02-21
申请号:CN201810911943.8
申请日:2018-08-10
Applicant: 北京百度网讯科技有限公司
IPC: G11C11/413
Abstract: 本申请实施例公开了信号转换单元、存储器以及应用于存储器的驱动方法。该信号转换单元的使能控制模块基于写使能输入端接收到的写使能信号以及读写状态控制端接收到的读写状态控制信号,生成第一使能信号,将第一使能信号提供至第一使能输出端,基于读使能输入端接收到的读使能信号、写使能输入端接收到的写使能信号以及读写状态控制端接收到的读写状态控制信号,生成第二使能信号,将第二使能信号提供至第二使能输出端;读写地址确定模块基于第一使能信号,将写地址输入端接收到的写地址信号或读地址输入端接收到的读地址信号提供至地址信号输出端。该实施方式可以提高存储器中的数据存储容量;减小存储器所占用的版图的面积。
-
公开(公告)号:CN110825440A
公开(公告)日:2020-02-21
申请号:CN201810911185.X
申请日:2018-08-10
Applicant: 北京百度网讯科技有限公司
IPC: G06F9/38
Abstract: 本申请实施例公开了指令执行方法和装置。该方法的一具体实施方式包括:获取指令队列;按照预设顺序从指令队列中获取待发送指令,执行如下发送步骤:确定出待发送指令的类型;响应于确定出待发送指令为运算类指令,从执行部件集合中确定执行待发送指令的执行部件,将待发送指令发送到所确定的执行部件;响应于确定出待发送指令为阻塞类指令,在接收到用于指示与待发送指令关联的指令执行完成的信号之后,获取下一条待发送指令,继续执行发送步骤。该实施方式能够提高指令执行的可靠性、降低指令队列所占用的存储器的容量、提高指令执行效率。
-
-
-
-
-
-
-
-
-