-
公开(公告)号:CN114564306B
公开(公告)日:2024-05-03
申请号:CN202210186254.1
申请日:2022-02-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于GPU并行计算的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集,然后对查询序列即第三代测序的RNA‑seq进行数据纠错;以及数据索引和播种;再对播种得到的种子进行链算法;利用GPU并行计算进行基因组比对和剪接序列比对得到比对结果;最后对比对结果进行评估;经测试,本发明的方法通过预先对第三代测序数据纠错和剪接比对策略,提高了算法的准确率,又使用GPU并行计算算法提高了算法的运行速度。
-
公开(公告)号:CN114564306A
公开(公告)日:2022-05-31
申请号:CN202210186254.1
申请日:2022-02-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于GPU并行计算的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集,然后对查询序列即第三代测序的RNA‑seq进行数据纠错;以及数据索引和播种;再对播种得到的种子进行链算法;利用GPU并行计算进行基因组比对和剪接序列比对得到比对结果;最后对比对结果进行评估;经测试,本发明的方法通过预先对第三代测序数据纠错和剪接比对策略,提高了算法的准确率,又使用GPU并行计算算法提高了算法的运行速度。
-
公开(公告)号:CN114550820A
公开(公告)日:2022-05-27
申请号:CN202210186243.3
申请日:2022-02-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于WFA算法的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集;然后对参考基因组进行索引;以及区域选择和图映射;查找k长子字符串的最长公共子序列LCSk,再进行锚点过滤和锚点比对;引入注释文件获得比对结果,最后对比对结果进行评估。实验证明,本发明的方法有效地提高了序列比对的准确性,尤其是剪接位点比对的准确率,同时一定程度减少比对时间。
-
公开(公告)号:CN114550820B
公开(公告)日:2024-05-03
申请号:CN202210186243.3
申请日:2022-02-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于WFA算法的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集;然后对参考基因组进行索引;以及区域选择和图映射;查找k长子字符串的最长公共子序列LCSk,再进行锚点过滤和锚点比对;引入注释文件获得比对结果,最后对比对结果进行评估。实验证明,本发明的方法有效地提高了序列比对的准确性,尤其是剪接位点比对的准确率,同时一定程度减少比对时间。
-
公开(公告)号:CN117992651A
公开(公告)日:2024-05-07
申请号:CN202410180591.9
申请日:2024-02-18
Applicant: 桂林电子科技大学
IPC: G06F16/951 , G06N3/0455 , G06N3/088 , G06N3/09 , G06N3/084
Abstract: 本发明公开了一种基于主动学习迭代的社交媒体谣言检测方法,属于自然语言处理技术领域,包括:使用预训练语言模型来表征样本;通过无监督的对比学习方法,利用无标签样本池中的数据,对Bert模型进行训练调优;通过基于样本标签距离的主动学习查询策略,分别更新无标签样本池和有标签样本池;按照样本标签和领域对有标签样本进行增广;通过有监督的对比学习方法,利用有标签样本池中的数据,对Bert模型进行训练调优;更新软提示前缀编码;更新当前样本池,将原有的无标签样本池纳入到领域下的无标签样本池中,重新训练模型。本发明在保持模型精度的前提下,降低了社交媒体数据样本标记成本,并在零样本场景下改善了谣言检测性能。
-
-
-
-