一种基于GPU并行计算的第三代测序RNA-seq比对方法

    公开(公告)号:CN114564306B

    公开(公告)日:2024-05-03

    申请号:CN202210186254.1

    申请日:2022-02-28

    Abstract: 本发明公开了一种基于GPU并行计算的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集,然后对查询序列即第三代测序的RNA‑seq进行数据纠错;以及数据索引和播种;再对播种得到的种子进行链算法;利用GPU并行计算进行基因组比对和剪接序列比对得到比对结果;最后对比对结果进行评估;经测试,本发明的方法通过预先对第三代测序数据纠错和剪接比对策略,提高了算法的准确率,又使用GPU并行计算算法提高了算法的运行速度。

    一种基于GPU并行计算的第三代测序RNA-seq比对方法

    公开(公告)号:CN114564306A

    公开(公告)日:2022-05-31

    申请号:CN202210186254.1

    申请日:2022-02-28

    Abstract: 本发明公开了一种基于GPU并行计算的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集,然后对查询序列即第三代测序的RNA‑seq进行数据纠错;以及数据索引和播种;再对播种得到的种子进行链算法;利用GPU并行计算进行基因组比对和剪接序列比对得到比对结果;最后对比对结果进行评估;经测试,本发明的方法通过预先对第三代测序数据纠错和剪接比对策略,提高了算法的准确率,又使用GPU并行计算算法提高了算法的运行速度。

    一种基于WFA算法的第三代测序RNA-seq比对方法

    公开(公告)号:CN114550820A

    公开(公告)日:2022-05-27

    申请号:CN202210186243.3

    申请日:2022-02-28

    Abstract: 本发明公开了一种基于WFA算法的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集;然后对参考基因组进行索引;以及区域选择和图映射;查找k长子字符串的最长公共子序列LCSk,再进行锚点过滤和锚点比对;引入注释文件获得比对结果,最后对比对结果进行评估。实验证明,本发明的方法有效地提高了序列比对的准确性,尤其是剪接位点比对的准确率,同时一定程度减少比对时间。

    一种基于WFA算法的第三代测序RNA-seq比对方法

    公开(公告)号:CN114550820B

    公开(公告)日:2024-05-03

    申请号:CN202210186243.3

    申请日:2022-02-28

    Abstract: 本发明公开了一种基于WFA算法的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集;然后对参考基因组进行索引;以及区域选择和图映射;查找k长子字符串的最长公共子序列LCSk,再进行锚点过滤和锚点比对;引入注释文件获得比对结果,最后对比对结果进行评估。实验证明,本发明的方法有效地提高了序列比对的准确性,尤其是剪接位点比对的准确率,同时一定程度减少比对时间。

    一种基于主动学习迭代的社交媒体谣言检测方法

    公开(公告)号:CN117992651A

    公开(公告)日:2024-05-07

    申请号:CN202410180591.9

    申请日:2024-02-18

    Abstract: 本发明公开了一种基于主动学习迭代的社交媒体谣言检测方法,属于自然语言处理技术领域,包括:使用预训练语言模型来表征样本;通过无监督的对比学习方法,利用无标签样本池中的数据,对Bert模型进行训练调优;通过基于样本标签距离的主动学习查询策略,分别更新无标签样本池和有标签样本池;按照样本标签和领域对有标签样本进行增广;通过有监督的对比学习方法,利用有标签样本池中的数据,对Bert模型进行训练调优;更新软提示前缀编码;更新当前样本池,将原有的无标签样本池纳入到领域下的无标签样本池中,重新训练模型。本发明在保持模型精度的前提下,降低了社交媒体数据样本标记成本,并在零样本场景下改善了谣言检测性能。

Patent Agency Ranking