用于现场或基于云的DNA和RNA处理和分析的基因组学基础架构

    公开(公告)号:CN108604260A

    公开(公告)日:2018-09-28

    申请号:CN201780006359.1

    申请日:2017-01-11

    IPC分类号: G06F19/28 G06F19/22

    CPC分类号: G06F19/28

    摘要: 用于对基因序列数据执行序列分析管道的系统、方法和设备,包括集成电路,该集成电路由一组硬连线数字逻辑电路形成,该硬连线数字逻辑电路通过多个物理电气互连进行互连。其中一个物理电气互连形成与电子数据源连接的该集成电路的输入,用于接受基因组数据read。该硬连线数字逻辑电路被布置为一组处理引擎,每个处理引擎由硬连线数字逻辑电路的子集形成,以对基因组数据read执行序列分析管道中的一个或多个步骤。硬连线数字逻辑电路的每个子集为有线配置,执行序列分析管道中的一个或多个步骤。

    基于生物云平台的项目结题报告分析系统和方法

    公开(公告)号:CN104331640B

    公开(公告)日:2018-04-17

    申请号:CN201410555641.3

    申请日:2014-10-17

    发明人: 郑洪坤 刘戈 刘敏

    IPC分类号: G06F19/10

    CPC分类号: G06F19/28 G06F17/30011

    摘要: 本发明公开了基于生物云平台的项目结题报告分析系统和方法,系统包括:结题报告解析,对各个项目的结题报告进行解析,并将解析结果以及原始数据整合封装成相应的项目文件;结题报告呈现模块,查询所有的项目文件并以列表形式展示,将某个项目按照预设样式显示;综合分析模块,接收用户界面模块发送的用户请求并生成分析任务,按照分析任务的指示进行分析,并将分析结果发送给结题报告呈现模块;结题报告呈现模块,还从项目文件列表中查询并读取项目文件对应的分析结果,并对项目文件以及相应的分析结果进行展示。通过将结题报告的内容、原始数据和分析软件集成到一个页面中,使用户在查看结题报告的同时查看原始数据并进行分析,提高工作效率。

    一种基于图匹配的跨物种生物通路发现方法

    公开(公告)号:CN107832583A

    公开(公告)日:2018-03-23

    申请号:CN201711093138.0

    申请日:2017-11-08

    申请人: 武汉大学

    发明人: 祝园园 李阅志

    IPC分类号: G06F19/16 G06F19/18 G06F19/28

    CPC分类号: G06F19/16 G06F19/18 G06F19/28

    摘要: 本发明公开了一种基于图匹配的跨物种生物通路发现方法,本发明是为了解决采用传统生物化学实验方法发现生物通路的低效率问题,和现有图匹配算法无法很好结合生物序列相似性和蛋白质交互网络结构相似性问题。通过本发明可以将生物序列相似性和网络结构相似性很好地融合,能够发现不同物种的蛋白质交互网络中共存的较大子结构,从而更有效地发现存在于不同物种中具有相似功能的生物通路,对生物学研究不同物种之间的联系有指导意义。

    材料基因工程数据的存储方法及系统

    公开(公告)号:CN107766494A

    公开(公告)日:2018-03-06

    申请号:CN201710975996.1

    申请日:2017-10-19

    IPC分类号: G06F17/30 G06F19/28

    摘要: 本发明公开一种材料基因工程数据的存储方法及系统。方法包括:获取用户输入的数据信息;解析所述数据信息的属性,得到数据属性信息序列;按照所述数据属性信息序列中属性的排列顺序,利用字段容器模型根据数据属性信息序列中的属性依次生成对应的字段容器;将所有的所述字段容器组合成一个集合,得到数据容器;识别所述数据信息中的数据字段;将各个数据字段的数据依次对应到对应的字段容器中,得到容器化数据;将各个字段容器中的数据依次转换成键值型数据,从而使所述数据信息包含在所述数据容器中从而存储在数据库中。本发明提供的材料基因工程数据的存储方法及系统,可以使用户在存储数据时不受存储结构的限制。

    基于Y染色体分子标记高效推断姓氏的方法

    公开(公告)号:CN107679365A

    公开(公告)日:2018-02-09

    申请号:CN201710868578.2

    申请日:2017-09-22

    发明人: 陈华 严江伟

    IPC分类号: G06F19/18 G06F19/28 C12Q1/68

    摘要: 本发明提供一种基于Y染色体分子标记高效推断姓氏的方法,特别是基于Y-STR分子标记高效推断姓氏的方法。根据多个DNA的标记信息,通过计算个体间遗传距离的方法来预测样本的姓氏。本发明提供的方法可根据Y染色体分子标记(如Y-STR、Y-SNP、RFLP等)遗传变异信息对中国人群的姓氏进行有效推断,且姓氏推断的准确性随着每个姓氏样本量的增加而提高,随使用的分子标记数目增多而上升。采用本方法可以对中国人群的姓氏进行准确可靠的推断,并具有广阔的实际应用前景。

    基于离散关联决策树的表型-基因型的数据处理方法和系统

    公开(公告)号:CN107516022A

    公开(公告)日:2017-12-26

    申请号:CN201610430453.7

    申请日:2016-06-17

    发明人: 曹诗琴

    IPC分类号: G06F19/24 G06F19/26 G06F19/28

    CPC分类号: G06F19/24 G06F19/26 G06F19/28

    摘要: 一种基于离散关联决策树的表型-基因型的数据处理方法和系统,处理方法包括如下步骤:采集表型数据和基因型数据;将表型数据和基因型数据进行标准化处理,得到标准化数据;将标准化数据进行检测和离散处理,得到离散数据;采用离散关联决策树算法对离散数据进行处理,得到目标数据;将目标数据进行可视化展示。上述基于离散关联决策树的表型-基因型的数据处理方法,通过将采集的表型数据和基因型数据进行离散处理并得到离散数据后,再采用离散关联决策树算法对离散数据进行处理,用于得到能够进行可视化展示的目标数据,这样,能够克服传统处理方法中由于大样本数据单机内存的上限引发的问题,进而提高了数据处理分析效率。

    大批量单细胞RNA-seq数据质量控制和分析方法

    公开(公告)号:CN107451424A

    公开(公告)日:2017-12-08

    申请号:CN201710639452.8

    申请日:2017-07-31

    IPC分类号: G06F19/20 G06F19/24 G06F19/28

    CPC分类号: G06F19/20 G06F19/24 G06F19/28

    摘要: 本发明公开了一种大批量单细胞RNA-seq数据质量控制和分析方法,其特征在于,包括以下步骤:第一步、原始测序文件的FASTQ格式或者比对完的SAM/BAM格式作为输入文件,运行相关命令;第二步、测序片段水平的质量控制;第三步、多细胞水平的质量控制;第四步、单个细胞层面的质量控制;第五步、细胞聚类和细胞特异峰的探测;第六步、给用户提供一份质量控制的报告文档。本发明可适用于不同类型的单细胞转录组数据,并对不同类型的大批量的转录组进行质量控制和细胞间的异质性分析。

    抗原表位构象指纹数据库
    10.
    发明公开

    公开(公告)号:CN107451421A

    公开(公告)日:2017-12-08

    申请号:CN201710475245.3

    申请日:2017-06-21

    发明人: 杨家安

    IPC分类号: G06F19/16 G06F19/28

    CPC分类号: G06F19/16 G06F19/28

    摘要: 本发明涉及一种抗原表位构象指纹数据库,属于生物信息学领域。每一条抗原表位的数据包括名称,氨基酸序列,全信息构象指纹,所述的氨基酸序列从抗原表位数据库中获取,所述的全信息构象指纹是对抗原表位的氨基酸序列的三维空间构象进行预测得到的构象谱带。该数据库包含超过25万抗原表位的构象指纹。不仅包含了抗原表位序列的一级结构和有规则的二级结构,而且涵盖了无规则的三级结构。由于采用指纹代码,可以采用相似性分数来评估抗原的表位特征,为定量地分析和比对抗原表位提供了工具。