一种CPU与协处理器间的数据传输方法和装置

    公开(公告)号:CN103049421B

    公开(公告)日:2019-08-27

    申请号:CN201210532292.4

    申请日:2012-12-11

    Inventor: 欧阳剑 王勇

    Abstract: 本发明提供了一种CPU与协处理器间的数据传输方法和装置,其中方法包括:根据CPU生成的N个线程并行对N个协处理器的数据传输进行控制,所述N为大于或等于2的整数;所述控制包括:协处理器接收CPU以切片形式发送的数据;或者,协处理器接收并存储CPU或上一协处理器发送来的当前时刻的数据切片的同时,发送已存储的上一时刻的数据切片至下一协处理器。本发明能够充分利用各个协处理器与CPU之间的总线,以及各个协处理器之间的总线,能够提高CPU将数据传送至多个协处理器时以及协处理器将数据传输至其余多个协处理器时的数据传输效率。

    一种基于多GPU的BPNN训练方法和装置

    公开(公告)号:CN103996069B

    公开(公告)日:2018-04-03

    申请号:CN201310054733.9

    申请日:2013-02-20

    Inventor: 欧阳剑 王勇

    Abstract: 本发明提供了一种基于多图形处理器(GPU)的反向传播神经网络(BPNN)训练方法和装置,其中方法包括:S1、控制各GPU进行BPNN的正向计算,并在各GPU间同步正向计算输出;S2、控制各GPU进行BPNN的反向误差计算,并在各GPU间同步反向误差计算输出;S3、控制各GPU根据所述同步得到的正向计算输出与所述同步得到的反向误差计算输出更新BPNN的权重。本发明能够减少多GPU的BPNN训练时的数据同步开销,提高多GPU的BPNN训练效率。

    基于位置服务的提供方法和装置

    公开(公告)号:CN104376111A

    公开(公告)日:2015-02-25

    申请号:CN201410706959.7

    申请日:2014-11-27

    Inventor: 王勇

    CPC classification number: G06F16/2465 G06F16/9537

    Abstract: 本发明实施例公开了一种基于位置服务的提供方法和装置。所述基于位置服务的提供方法包括:将数据发布方根据统一的数据发布模板发布的原始数据存储在发布数据池中;对所述发布数据池中的数据进行数据挖掘,以得到用于提供基于位置的服务的检索基础数据,并将所述检索基础数据存储于检索数据库中;根据所述检索数据库中的检索基础数据向用户提供基于位置的服务。本发明实施例提供的基于位置服务的提供方法和装置丰富了基于位置服务的服务内容。

    一种基于多GPU的BPNN训练方法和装置

    公开(公告)号:CN103996069A

    公开(公告)日:2014-08-20

    申请号:CN201310054733.9

    申请日:2013-02-20

    Inventor: 欧阳剑 王勇

    Abstract: 本发明提供了一种基于多图形处理器(GPU)的反向传播神经网络(BPNN)训练方法和装置,其中方法包括:S1、控制各GPU进行BPNN的正向计算,并在各GPU间同步正向计算输出;S2、控制各GPU进行BPNN的反向误差计算,并在各GPU间同步反向误差计算输出;S3、控制各GPU根据所述同步得到的正向计算输出与所述同步得到的反向误差计算输出更新BPNN的权重。本发明能够减少多GPU的BPNN训练时的数据同步开销,提高多GPU的BPNN训练效率。

    一种CPU与协处理器间的数据传输方法和装置

    公开(公告)号:CN103049421A

    公开(公告)日:2013-04-17

    申请号:CN201210532292.4

    申请日:2012-12-11

    Inventor: 欧阳剑 王勇

    Abstract: 本发明提供了一种CPU与协处理器间的数据传输方法和装置,其中方法包括:根据CPU生成的N个线程并行对N个协处理器的数据传输进行控制,所述N为大于或等于2的整数;所述控制包括:协处理器接收CPU以切片形式发送的数据;或者,协处理器接收并存储CPU或上一协处理器发送来的当前时刻的数据切片的同时,发送已存储的上一时刻的数据切片至下一协处理器。本发明能够充分利用各个协处理器与CPU之间的总线,以及各个协处理器之间的总线,能够提高CPU将数据传送至多个协处理器时以及协处理器将数据传输至其余多个协处理器时的数据传输效率。

Patent Agency Ranking