-
公开(公告)号:CN113222101A
公开(公告)日:2021-08-06
申请号:CN202010080940.1
申请日:2020-02-05
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开的实施例提出了深度学习处理装置、方法、设备和存储介质,涉及人工智能领域。一种深度学习处理装置包括至少一个矩阵乘加模块,被配置为执行卷积神经网络中的卷积层的卷积核参数值矩阵与第一误差梯度值矩阵的矩阵乘加运算,得到多个中间矩阵;存储装置,用于存储多个中间矩阵而无需对多个中间矩阵中的元素进行重新整形;以及多个矩阵累加模块,被配置为从存储装置读取多个中间矩阵并且以并行方式按卷积层的卷积方案执行基于多个中间矩阵的矩阵累加运算,得到针对卷积层的第二误差梯度值矩阵。这样的深度学习处理装置可以显著提高卷积反向操作的计算效率,在计算速度和耗能方面均能得到改进。
-
公开(公告)号:CN106209682B
公开(公告)日:2019-04-30
申请号:CN201610539215.X
申请日:2016-07-08
Applicant: 北京百度网讯科技有限公司
IPC: H04L12/863
Abstract: 本申请公开了业务调度方法、装置和系统。所述方法的一具体实施方式包括:监测等待队列中是否存在业务请求,其中等待队列用于存储待执行的业务请求;响应于确定等待队列中存在业务请求,交换运行队列和等待队列,其中运行队列用于存储当前执行的业务请求;将交换后的运行队列中的业务请求合并后生成待处理请求集合并发送至业务处理接口,以通过业务处理接口对待处理请求集合进行批量处理;在待处理请求集合中的业务请求处理完毕后,清空交换后的运行队列。该实施方式能够根据业务需求和硬件处理能力自适应调整批处理数量,提升了业务处理效率。
-
公开(公告)号:CN106411519B
公开(公告)日:2019-01-25
申请号:CN201610936230.8
申请日:2016-11-01
Applicant: 北京百度网讯科技有限公司
IPC: H04L9/30
-
公开(公告)号:CN106533665B
公开(公告)日:2018-08-07
申请号:CN201610976635.4
申请日:2016-10-31
Applicant: 北京百度网讯科技有限公司
CPC classification number: H04L63/0435 , H04L9/0618 , H04L63/0442 , H04L63/061
Abstract: 本申请公开了用于存储网站私钥明文的方法、系统和装置。该方法的具体实施方式包括:接收用于加解密的终端发送的公钥,其中,公钥是终端随机生成的;利用公钥加密网站私钥明文,生成网站私钥密文,其中,网站私钥明文是预先获取的;向终端发送网站私钥密文,以供终端利用私钥解密网站私钥密文,生成网站私钥明文并将网站私钥明文存储在终端中。该实施方式提高了网站私钥明文存储的安全性。
-
公开(公告)号:CN105893159B
公开(公告)日:2018-06-19
申请号:CN201610454483.1
申请日:2016-06-21
Applicant: 北京百度网讯科技有限公司
IPC: G06F9/50
CPC classification number: G11C7/1072 , G06F9/30025 , G06N3/0481 , G11C7/1006 , G11C7/1036 , G11C11/41 , G11C29/50004 , G11C2029/5004
Abstract: 本申请公开了数据处理方法和装置。所述方法的一具体实施方式包括:对接收到的待处理输入数据进行预处理;根据预处理的结果以及通过线性拟合激活函数得到的结果获得所述待处理输入数据的配置参数的存储地址,其中,配置参数是根据激活函数的曲线特性预先设置的;根据所述存储地址获取所述待处理输入数据的配置参数;根据所述待处理输入数据的配置参数以及预先设定的电路结构对所述待处理输入数据的预处理结果进行处理,得到处理结果。该实施方式实现了使用配置参数和预先设定的电路结构实现对待处理输入数据的处理,不需要使用用于实现激活函数的专用电路,从而简化了电路结构,且同时可以支持多种激活函数,提高了灵活性。
-
公开(公告)号:CN106209682A
公开(公告)日:2016-12-07
申请号:CN201610539215.X
申请日:2016-07-08
Applicant: 北京百度网讯科技有限公司
IPC: H04L12/863
CPC classification number: H04L47/62
Abstract: 本申请公开了业务调度方法、装置和系统。所述方法的一具体实施方式包括:监测等待队列中是否存在业务请求,其中等待队列用于存储待执行的业务请求;响应于确定等待队列中存在业务请求,交换运行队列和等待队列,其中运行队列用于存储当前执行的业务请求;将交换后的运行队列中的业务请求合并后生成待处理请求集合并发送至业务处理接口,以通过业务处理接口对待处理请求集合进行批量处理;在待处理请求集合中的业务请求处理完毕后,清空交换后的运行队列。该实施方式能够根据业务需求和硬件处理能力自适应调整批处理数量,提升了业务处理效率。
-
公开(公告)号:CN107678781B
公开(公告)日:2021-02-26
申请号:CN201610621990.X
申请日:2016-08-01
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了处理器以及用于在处理器上执行指令的方法。所述处理器的一具体实施方式包括:主机交互器件、指令控制器件、片外存储器、片上缓存、阵列处理机,其中:所述主机交互器件,用于与所述处理器所连接的主机交互数据与指令,其中,所交互的数据以矩阵为粒度;所述片外存储器,用于存储从所述主机接收的、待执行矩阵运算的矩阵;所述指令控制器件,用于将从所述主机接收的外部指令转换成一系列访存指令与一系列计算指令并执行所转换成的指令。该实施方式能提高对深度学习算法的执行效率。
-
公开(公告)号:CN112148653A
公开(公告)日:2020-12-29
申请号:CN201910559188.6
申请日:2019-06-26
Applicant: 北京百度网讯科技有限公司
Abstract: 根据本公开的示例性实施例,提供了一种数据传输装置。该数据传输装置包括多个第一端口,被耦合至处理单元;多个第二端口,被耦合至多个存储器;以及多条数据通道,被布置在第一端口和第二端口之间以形成具有多个层的交织网络,以用于在处理单元和多个存储器之间传输数据,使得交织网络的每层包括至少一个子交织网络。通过采用多通道、分层的内存交织的技术,有效降低了硬件开销,并提高了扩展性和灵活性。由于分成了多个子交织网络,使得需要走长路径的数据通道大幅减少,物理实现更容易。这对功耗以及数据的传输时延以及稳定性方面都是有利的。分层的交织网络的数据传输技术能够更容易地实现对称结构的布局,从而能够更容易地布置数据处理系统中的各个模块。
-
公开(公告)号:CN112148418A
公开(公告)日:2020-12-29
申请号:CN201910560713.6
申请日:2019-06-26
Applicant: 北京百度网讯科技有限公司
IPC: G06F9/455
Abstract: 根据本公开的实施例,提供了用于访问数据的方法、装置、设备和计算机可读存储介质,涉及计算机领域。用于访问数据的方法包括获得与计算设备的虚拟机相对应的虚拟功能的标识和与虚拟机要访问的存储器中的数据有关的地址,虚拟功能的标识和地址是基于接收的来自计算设备的虚拟机的访问请求而确定的。该方法还包括基于标识,确定与虚拟机相对应的存储器中的存储资源的范围。该方法还包括确定地址是否在范围内。该方法还包括响应于确定地址在范围内,访问与地址有关的数据。通过片上系统芯片上的存储器管理单元来控制虚拟机访问存储器,该访问方法不仅减小了硬件资源,并且还减少了软件开销,提高了效率。
-
公开(公告)号:CN107680028B
公开(公告)日:2020-04-21
申请号:CN201610621655.X
申请日:2016-08-01
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了用于缩放图像的处理器和方法。所述处理器的一具体实施方式包括:包括片外存储器、通信器件、控制器件以及阵列处理机,其中:所述片外存储器,用于存储待缩放的原始图像;所述通信器件,用于接收图像缩放指令;所述控制器件,用于执行所述图像缩放指令,向所述阵列处理机发出计算控制信号;所述阵列处理机,用于在所述计算控制信号的控制下,使用所述阵列处理机中的N个处理单元根据所述宽度缩放倍数、所述高度缩放倍数以及所提取像素数据中N个通道的通道值,并行计算目标像素中N个通道的通道值。该实施方式提高了图像缩放操作的处理速度。
-
-
-
-
-
-
-
-
-