一种基于高通量测序数据的计算机集群的作业调度系统

    公开(公告)号:CN105468451A

    公开(公告)日:2016-04-06

    申请号:CN201410409376.8

    申请日:2014-08-19

    Applicant: 复旦大学

    Abstract: 本发明属计算机领域,涉及一种基于高通量测序数据的计算机集群的作业调度系统。具体涉及针对高通量组学数据的数据密集性计算的集群作业调度系统。本发明中包括:搭建独立的消息与储存网络构架;指定分析软件与输入数据;通过文件系统自动生成指定的分析作业任务;通过消息传递侦听集群计算结点负载状态,向结点布署批量任务;在计算结点里,通过进程通迅侦听任务状态,根据指定负载要求控制任务量,并最终完成批量任务。该作业调度系统与现有技术相比,可以实现以大数据文件为主要输入的高通量组学数据分析的任务自动化,减少结点间的消息通迅,并形成对数据密集型任务的多层次负载平衡,充分利用高速网络资源进行数据传输。

    模型及其构建方法
    3.
    发明公开

    公开(公告)号:CN110111841A

    公开(公告)日:2019-08-09

    申请号:CN201810010227.2

    申请日:2018-01-05

    Abstract: 本发明提供了一套基于宏基因组测序的动脉粥样硬化早期识别模型构建技术。本发明采用国际先进的Illumina NovaSeq平台,对人的粪便和口腔菌群宏基因组DNA采用Nextera转座子鸟枪宏基因组测序技术,配合传统的高通量测序,并产生宏基因组数据。进而运用数据库和系统等进行宏基因组测序数据分析。通过对数据进行训练集和验证机矫正,并配合机器学习和神经网络算法,产生可靠的早期动脉粥样硬化识别模型,并通过扩大宏基因组生物标志物进行验证。本发明基于较大规模的系统性队列研究,通过队列将病程变化和菌谱进行关联性分析,从而对早期标记物进行判断,在预防医学领域提供了更具价值的系统性研究方法。

    动脉粥样硬化的识别模型的构建方法

    公开(公告)号:CN110111841B

    公开(公告)日:2023-03-10

    申请号:CN201810010227.2

    申请日:2018-01-05

    Abstract: 本发明提供了一套基于宏基因组测序的动脉粥样硬化早期识别模型构建技术。本发明采用国际先进的Illumina NovaSeq平台,对人的粪便和口腔菌群宏基因组DNA采用Nextera转座子鸟枪宏基因组测序技术,配合传统的高通量测序,并产生宏基因组数据。进而运用数据库和系统等进行宏基因组测序数据分析。通过对数据进行训练集和验证机矫正,并配合机器学习和神经网络算法,产生可靠的早期动脉粥样硬化识别模型,并通过扩大宏基因组生物标志物进行验证。本发明基于较大规模的系统性队列研究,通过队列将病程变化和菌谱进行关联性分析,从而对早期标记物进行判断,在预防医学领域提供了更具价值的系统性研究方法。

    一种单细胞转录组的测序方法

    公开(公告)号:CN109971843A

    公开(公告)日:2019-07-05

    申请号:CN201711447883.0

    申请日:2017-12-27

    Abstract: 本发明属于生物技术领域,公开了一种单细胞转录组的测序方法。本发明使用了PAP/PGP在RNA链的尾部加入多聚A/G,使RNA稳定性增加,同时产一条可以用于逆转录和cDNA合成的延伸链。本发明在下游进行有效RNA富集时,采用标记核糖体DNA探针的磁珠纯化小片段PCR非特异性产物,使用半退火夹板杂交,去除5s,5.8s,18s和28s大小的cDNA形式存在的rRNA,并在测序时减少大量无效的Reads数。本发明可以对单个真核细胞进行一站式non‑coding RNA、microRNA和mRNA的总转录组测序并产生该转录组的表达矩阵,摆脱了一个细胞只能进行一种测序的应用局限。

    一种单细胞转录组的测序方法

    公开(公告)号:CN109971843B

    公开(公告)日:2022-11-11

    申请号:CN201711447883.0

    申请日:2017-12-27

    Abstract: 本发明属于生物技术领域,公开了一种单细胞转录组的测序方法。本发明使用了PAP/PGP在RNA链的尾部加入多聚A/G,使RNA稳定性增加,同时产一条可以用于逆转录和cDNA合成的延伸链。本发明在下游进行有效RNA富集时,采用标记核糖体DNA探针的磁珠纯化小片段PCR非特异性产物,使用半退火夹板杂交,去除5s,5.8s,18s和28s大小的cDNA形式存在的rRNA,并在测序时减少大量无效的Reads数。本发明可以对单个真核细胞进行一站式non‑coding RNA、microRNA和mRNA的总转录组测序并产生该转录组的表达矩阵,摆脱了一个细胞只能进行一种测序的应用局限。

    一种对高通量RNA测序数据的质量控制方法及装置

    公开(公告)号:CN105349617A

    公开(公告)日:2016-02-24

    申请号:CN201410409210.6

    申请日:2014-08-19

    Applicant: 复旦大学

    Abstract: 本发明属于高通量RNA测序技术领域,公开了一种通过加入外源参照物对高通量RNA测序数据进行质量评估和质量控制的方法,其包括:系统评估外源参照序列在测定样品中的比例、定量水平、基因覆盖度及测序错误率等特征,以及评估批次效应并在此基础上优化数据分析方案。本发明还公开了一种对高通量测序进行质量控制的装置,包括:基因表达测算单元、相关性分析单元、基因覆盖度分析单元和碱基错误率分析单元。本发明可以针对RNA质量、转录组测序实验过程及数据分析流程等多个环节进行质量控制,从而大幅提高高通量测序数据的可靠性和可重复性。

Patent Agency Ranking