一种PacBio测序数据纠错结果的自动化评估方法

    公开(公告)号:CN114937475A

    公开(公告)日:2022-08-23

    申请号:CN202210380137.9

    申请日:2022-04-12

    Abstract: 本发明公开一种PacBio测序数据纠错结果的自动化评估方法,对原始PacBio测序数据进行质量控制得到符合设定阈值范围的测序序列;使用待评估的纠错方法对质量控制后的clean reads纠错得到序列记为corrected reads,并统计纠错所需的内存资源和时间消耗;对纠错前、后的clean reads、corrected reads进行比较、分析,得到纠错输出率TH和纠错后序列的平均长度;将纠错后的corrected reads与其对应的参考基因组进行比对,得到比对序列MSA并统计分析,得到纠错的灵敏度和正确率;将纠错后的corrected reads组装得到contigs;将contigs与其对应的参考基因组比对,得到比对contigs MSA统计分析,统计出contigs的数量、基因组覆盖率和NGA50。

    一种基于GPU并行计算的第三代测序RNA-seq比对方法

    公开(公告)号:CN114564306A

    公开(公告)日:2022-05-31

    申请号:CN202210186254.1

    申请日:2022-02-28

    Abstract: 本发明公开了一种基于GPU并行计算的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集,然后对查询序列即第三代测序的RNA‑seq进行数据纠错;以及数据索引和播种;再对播种得到的种子进行链算法;利用GPU并行计算进行基因组比对和剪接序列比对得到比对结果;最后对比对结果进行评估;经测试,本发明的方法通过预先对第三代测序数据纠错和剪接比对策略,提高了算法的准确率,又使用GPU并行计算算法提高了算法的运行速度。

    一种基于WFA算法的第三代测序RNA-seq比对方法

    公开(公告)号:CN114550820A

    公开(公告)日:2022-05-27

    申请号:CN202210186243.3

    申请日:2022-02-28

    Abstract: 本发明公开了一种基于WFA算法的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集;然后对参考基因组进行索引;以及区域选择和图映射;查找k长子字符串的最长公共子序列LCSk,再进行锚点过滤和锚点比对;引入注释文件获得比对结果,最后对比对结果进行评估。实验证明,本发明的方法有效地提高了序列比对的准确性,尤其是剪接位点比对的准确率,同时一定程度减少比对时间。

    一种用于加速第三代RNA测序数据比对的最大精确匹配并行查找算法

    公开(公告)号:CN117672372A

    公开(公告)日:2024-03-08

    申请号:CN202311739166.0

    申请日:2023-12-18

    Inventor: 王荣兴 张艳菊

    Abstract: 本发明公开了一种用于加速第三代RNA测序数据比对的最大精确匹配并行查找算法,适用于对以“索引‑种子‑链接”为设计思想的比对算法进行加速。该算法首先对基因组的参考序列进行BWT变换,构建对应的FM索引;然后计算基因组参考序列的所有前缀,并对它们进行排序,从而创建最长公共前缀数组并采样。为了能加快查找最大精确匹配,采用基于POSIX的多线程进行并行化处理;此外,为了缩短程序的执行时间,对FM索引和最长公共前缀数组进行序列化。实验结果表明,该算法能极大加快最大精确匹配的查找,进而有效地加速RNA测序数据的剪接比对。

    基于生物序列顺式作用调控元件的在线预测网站构建方法

    公开(公告)号:CN115658052A

    公开(公告)日:2023-01-31

    申请号:CN202211209040.8

    申请日:2022-09-30

    Inventor: 张艳菊 王荣兴

    Abstract: 本发明公开了一种基于生物序列顺式作用调控元件的在线预测网站构建方法,该方法适用于将针对生物序列进行机器学习训练所得模型构建成在线预测网站。随着人工智能技术的不断发展,机器学习算法蓬勃发展,并且成功地被应用于多个领域。特别地,在生物和医学研究领域中,研究人员构建了大量的预测模型以服务各类研究任务,如顺式作用调控元件、生物医学致病元件和蛋白质等的预测。尽管大量的预测模型已被成功构建出来,但对于经常利用计算机工作的相关从业人员而言,他们更关注如何能够将这些模型应用于实际工作。因此,将论文中的预测模型构建成为用户友好且简单易用的在线网站,能够极大提高模型的实际应用价值。

    一种基于GPU并行计算的第三代测序RNA-seq比对方法

    公开(公告)号:CN114564306B

    公开(公告)日:2024-05-03

    申请号:CN202210186254.1

    申请日:2022-02-28

    Abstract: 本发明公开了一种基于GPU并行计算的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集,然后对查询序列即第三代测序的RNA‑seq进行数据纠错;以及数据索引和播种;再对播种得到的种子进行链算法;利用GPU并行计算进行基因组比对和剪接序列比对得到比对结果;最后对比对结果进行评估;经测试,本发明的方法通过预先对第三代测序数据纠错和剪接比对策略,提高了算法的准确率,又使用GPU并行计算算法提高了算法的运行速度。

    一种基于深度学习的第三代测序数据的自校正纠错方法

    公开(公告)号:CN114664379A

    公开(公告)日:2022-06-24

    申请号:CN202210380222.5

    申请日:2022-04-12

    Abstract: 本发明公开了一种基于深度学习的第三代测序数据的自校正纠错方法,该方法是通过对第三代DNA测序数据进行质量控制,得到高质量的测序序列;将高质量测序序列与其对应的参考基因组进行比对,得到比对序列MSA;对高质量测序序列生成的MSA进行定长的切片,对于每个片段,提取其中的有用特征,并将其编码成图像;将图像视为训练集,训练深度学习模型;对未纠错的序列uncorrected reads执行自我比对,得到比对序列uncorrected MSA进行定长的切片,对于每个片段,提取其中的有用特征,并将其编码成图像;将uncorrected reads编码成的图像,输入训练完成的深度学习模型中进行分类,若分类结果与真实图像中心位置碱基种类不匹配,则纠正真实图像;对纠正后的图像进行反编码,生成纠错后的corrected reads。

    一种基于WFA算法的第三代测序RNA-seq比对方法

    公开(公告)号:CN114550820B

    公开(公告)日:2024-05-03

    申请号:CN202210186243.3

    申请日:2022-02-28

    Abstract: 本发明公开了一种基于WFA算法的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集;然后对参考基因组进行索引;以及区域选择和图映射;查找k长子字符串的最长公共子序列LCSk,再进行锚点过滤和锚点比对;引入注释文件获得比对结果,最后对比对结果进行评估。实验证明,本发明的方法有效地提高了序列比对的准确性,尤其是剪接位点比对的准确率,同时一定程度减少比对时间。

Patent Agency Ranking