基于GPU的序列比对算法的比对结果处理方法

    公开(公告)号:CN102663270B

    公开(公告)日:2015-06-17

    申请号:CN201210060480.1

    申请日:2012-03-08

    Abstract: 本发明公开了一种基于GPU的序列比对算法的比对结果处理方法,包括:初始化GPU的块大小为Bs,并确定线程数量为N,用户输入的待查询序列Q的长度为qlen,GPU在共享内存中建立分值缓冲区score[Bs]和比对结果缓冲区val[Bs*17][2],GPU初始化线程号为tid,score[]为零,val[][]为零,缓冲器标记p=1,段计数器s=0,线程号tid小于线程数量N的所有线程在纹理内存中查找相应的数据库序列,并将数据库序列的序列号sid设置为线程号tid,设置计数器i=0,每个线程分别取出相应数据库序列中的第i个字符,设置计数器j=s,每个线程分别取出待查询序列Q中的第j个字符。本发明能实现Smith-Waterman算法快速打分,且能高效直观地写回比对结果,从而为回溯部分获取最佳匹配片段提供分值矩阵。

    一种基于GPU多序列比对算法的社交网络关联搜索方法

    公开(公告)号:CN102651030B

    公开(公告)日:2013-10-30

    申请号:CN201210100526.8

    申请日:2012-04-09

    Abstract: 本发明公开了一种基于GPU多序列比对算法的社交网络关联搜索方法,包括以下步骤:CPU对个体网页进行网络爬虫,以提取社交网络中的个体特征信息向量,CPU过滤个体特征信息向量中的冗余特征信息,以生成统一个体特征信息向量库,GPU根据统一个体特征信息向量库计算社交网络个体距离矩阵和矫正距离矩阵,GPU根据矫正距离矩阵构建社交网络关联路线指导树,GPU遍历社交网络关联路线指导树,以进行最优关联路线搜索。本发明充分利用GPU适合处理大量密集型数据的优势,将多序列比对算法解决关联搜索问题进行并行化,利用GPU完成矩阵及关联路线指导树的形成和遍历等复杂耗时操作,解决了社交网络数据量大和操作复杂性所带来的耗时长问题。

    一种分布式环境下的文件快速读写方法

    公开(公告)号:CN103092927B

    公开(公告)日:2016-01-20

    申请号:CN201210590615.5

    申请日:2012-12-29

    Abstract: 本发明公开了一种分布式环境下的文件快速读方法,包括:客户节点向元数据节点发出读文件请求,客户节点判断其自身是否和分布式文件系统中该客户节点上一次读取文件所连接的数据节点保持着连接,若不是则元数据节点根据其索引区中的信息查询该文件是否存在于其数据区中,若不是则元数据节点根据其一级索引信息查询存有该文件的数据节点,客户节点与该数据节点建立连接,数据节点根据二级索引信息查找该文件所在的数据块,根据二级索引信息获取文件,并将该文件发送给客户节点,客户节点接收数据并保持与该数据节点的连接。本发明能够解决现有方法中存在的元数据节点占用内存大,以及大量文件写效率低下的问题。

    一种基于分类驱动的可视化词袋特征权重化方法和系统

    公开(公告)号:CN103399870A

    公开(公告)日:2013-11-20

    申请号:CN201310285891.5

    申请日:2013-07-08

    Abstract: 本发明公开了一种基于分类驱动的可视化词袋特征权重化方法,包括:从网络下载图像,并建立图像数据库,提取图像数据库中所有N张图像的可视化词袋特征,建立所有N张图像的可视化词袋特征的倒排索引,从图像数据库中随机抽取N1张图像及其对应的可视化词袋特征,通过聚类算法将N1张图像形成C个视觉类,并从每个视觉类中随机选择图像组成该视觉类的学习样本集,针对每一视觉类,在该视觉类的学习样本集上建立可视化词袋特征的权重学习样本集,并利用该权重学习样本集训练每个视觉类,以形成该视觉类的支持向量机判别模型。本发明能够解决现有方法中存在的检索精度低、无法挖掘不同查询图像之间差异性的技术问题。

    一种面向GPU集群的资源管理方法和系统

    公开(公告)号:CN103365726A

    公开(公告)日:2013-10-23

    申请号:CN201310284684.8

    申请日:2013-07-08

    CPC classification number: G06F9/5011

    Abstract: 本发明公开了一种面向GPU集群的资源管理方法,包括:主管理节点建立两张表:资源信息表和任务信息表;主管理节点接收到新任务;判断任务是CPU任务还是GPU任务;主管理节点查找满足任务需求的空闲资源;对于CPU任务,次管理节点对任务的数据进行预处理,将数据片分发到其管理的所有节点进行计算,计算完成后,主管理节点根据任务号回收次管理节点管理的所有节点的相关CPU资源;对于GPU任务,在检测到GPU计算完成后,主管理节点先根据任务号回收次管理节点管理的所有节点的相关GPU资源;同时次管理节点管理的所有节点中的CPU进行计算结果后处理,后处理完成后。本发明将CPU资源和GPU资源区别对待,通过任务的检测,能快速地回收空闲的GPU资源。

    一种面向GPU集群的资源管理方法和系统

    公开(公告)号:CN103365726B

    公开(公告)日:2016-05-25

    申请号:CN201310284684.8

    申请日:2013-07-08

    CPC classification number: G06F9/5011

    Abstract: 本发明公开了一种面向GPU集群的资源管理方法,包括:主管理节点建立两张表:资源信息表和任务信息表;主管理节点接收到新任务;判断任务是CPU任务还是GPU任务;主管理节点查找满足任务需求的空闲资源;对于CPU任务,次管理节点对任务的数据进行预处理,将数据片分发到其管理的所有节点进行计算,计算完成后,主管理节点根据任务号回收次管理节点管理的所有节点的相关CPU资源;对于GPU任务,在检测到GPU计算完成后,主管理节点先根据任务号回收次管理节点管理的所有节点的相关GPU资源;同时次管理节点管理的所有节点中的CPU进行计算结果后处理,后处理完成后。本发明将CPU资源和GPU资源区别对待,通过任务的检测,能快速地回收空闲的GPU资源。

    基于GPU的稀疏矩阵数据存储方法

    公开(公告)号:CN102436438B

    公开(公告)日:2015-03-04

    申请号:CN201110415911.7

    申请日:2011-12-13

    Abstract: 本发明公开了一种基于GPU的稀疏矩阵数据存储方法,该方法包括:1)对行长度数组length[]按照升序排序;2)按每行非零元素的个数将数组length[]分为[0,8),[8,16),[16,32),[32,+∞)四段,每段分别合并32、16、8、4行;3)对各数据段中的行进行补零操作,对各数据段进行补行操作,所补行的元素全为零;4)产生SC-CSR格式的三个一维数组cval[]、ccol_ind[]、crow_ptr[],本发明的方法中,分段处理降低了每行的行长度变化幅度,从而减少了线程束、线程块间的负载不平衡,相邻行交错合并避免了行非零元素少于32时的线程束计算资源浪费,提高了CUDA显存联合访问的效率,并减少了计算内核并行归约的步骤,从而显著提高了稀疏矩阵向量乘的计算性能。

    一种GPU上基于内存统一管理的MapReduce实现方法

    公开(公告)号:CN103714009A

    公开(公告)日:2014-04-09

    申请号:CN201310710435.0

    申请日:2013-12-20

    Abstract: 本发明公开了一种GPU上基于内存统一管理的MapReduce实现方法,包括:初始化GPU的块大小为Bs,每个块中的线程数目N,输入数据量大小M;在全局内存上为GPU的每个块分配一个中间数据缓冲区,同时分配一个全局结果缓冲区;对p%的输入数据进行预处理,在中间数据缓冲区中收集map任务计算结果和归约频率信息;根据键值对的归约频率,对中间结果进行排序,保存键值对索引信息到排序结果缓冲区sort_index[]中;初始化GPU每个块对应的中间数据缓冲区为零,在共享内存中建立内存分配区sm_pool[];设置内存分配标记数组mem_flag[]。本发明在每个GPU块的中间数据缓冲区中,对全局内存和共享内存资源进行统一管理,减少了内存资源开销,避免了分开管理导致的键值对对重复查找和map任务重复计算开销。

    基于GPU的条件随机场模型的数据分类方法

    公开(公告)号:CN102663415B

    公开(公告)日:2014-03-05

    申请号:CN201210072409.5

    申请日:2012-03-19

    Abstract: 本发明提供了一种基于GPU的条件随机场模型的数据分类方法,包括以下步骤:CPU读取训练数据集,根据匹配模板定义法则,生成特征集。CPU初始化相关矩阵和向量,先计算出观察序列的起始结点对应所有特征的初始概率。CPU判断是否数据分割处理。传递参数后,GPU根据处理数据规模自动选择合适并行计算方法,并行计算每个观察点对应每个特征的最大概率值。计算结束后,返回结果由CPU判断数据处理完成情况和最后的输出。本方法具有通用性好、训练速度快、有效处理大规模序列数据、自适应力的特点。

    一种局部特征的分布式并行提取方法

    公开(公告)号:CN103366173A

    公开(公告)日:2013-10-23

    申请号:CN201310289194.7

    申请日:2013-07-10

    Abstract: 本发明公开了一种局部特征的分布式并行提取方法,包括:利用图像爬虫软件下载图像到云环境中的各个计算节点,并建立图像数据库,图像数据库中存储了每张图像的ID与计算节点的ID之间的映射关系,并行地获取每个计算节点上存储的每张图像的像素值,并建立图像的ID与其像素大小之间的映射关系,根据云环境中每个计算节点存储的每张图像像素大小,获得云环境中每个计算节点上总像素值,根据云环境里每个计算节点总像素值、计算节点的个数、每个计算节点的网络状况,确定供应计算节点,供应计算节点应供应的图片和接收这些图片的计算节点。本发明能够解决现有方法中存在的局部特征提取过程中,各计算节点图像数量分配不准确和计算负载不均衡的问题。

Patent Agency Ranking