一种基于注意力机制的剪接位点预测及解释性方法

    公开(公告)号:CN114566216B

    公开(公告)日:2024-04-02

    申请号:CN202210178010.9

    申请日:2022-02-25

    Abstract: 本发明公开了一种基于注意力机制的剪接位点预测及解释性方法,该方法提出结合注意力机制的卷积神经网络模型,精准识别剪接位点,并基于模型,提出可视化权重解释分析方法,在五个物种上建立了有效的预测模型。独立测试集的结果证明了在涉及五个物种的10个数据集上,本发明模型比现有模型更具有鲁棒性,性能更优,泛化能力更强。随后,为研究结合注意力机制的卷积神经网络模型能达到更好性能的原因,本发明采用于梯度类激活映射可视化技术获取模型对于每个样本的位置权重分布,最终验证了模型能够自动注意并获取到样本的有效特征。本发明可以提高预测精度和对剪接位点序列进行解释性分析。

    一种基于GPU的最大精确匹配并行查找算法

    公开(公告)号:CN117746987A

    公开(公告)日:2024-03-22

    申请号:CN202311774037.5

    申请日:2023-12-22

    Inventor: 王荣兴 张艳菊

    Abstract: 本发明公开了一种基于GPU的最大精确匹配并行查找算法,旨在于加速第三代RNA测序数据比对算法耗时最多的种子过程。首先,在CPU上对转录组创建FM索引,构建并采样参考基因组后缀的最长公共前缀数组,将它们从CPU内存复制到GPU内存;然后,使用GPU并行加载RNA测序数据,将它们分割到GPU线程块;其次,设置GPU线程参数,每个线程查找所分配数据与参考基因组之间的最大精确匹配;最后,同步线程并合并查询结果。本发明有效减少了最大精确匹配查找算法的运行时间,从而能够加速RNA测序数据的比对算法。

    一种双端成对的剪接位点预测方法

    公开(公告)号:CN114566215B

    公开(公告)日:2024-03-22

    申请号:CN202210178009.6

    申请日:2022-02-25

    Abstract: 本发明公开了一种双端成对的剪接位点预测方法,该方法通过获取双端成对的剪接位点样本序列作为基准数据集和独立数据集;将碱基序列通过基于序列本身、物理化学性质等多种特征提取方式进行编码;组合多种特征作为一个多通道多维的向量表示;训练卷积神经网络模型;最后进行评估。这种预测方法可以结合样本多种特征表示方式,帮助卷积神经网络充分学习样本内在模式,提高了双端成对的剪接位点预测的准确率。

    一种基于注意力机制的剪接位点预测及解释性方法

    公开(公告)号:CN114566216A

    公开(公告)日:2022-05-31

    申请号:CN202210178010.9

    申请日:2022-02-25

    Abstract: 本发明公开了一种基于注意力机制的剪接位点预测及解释性方法,该方法提出结合注意力机制的卷积神经网络模型,精准识别剪接位点,并基于模型,提出可视化权重解释分析方法,在五个物种上建立了有效的预测模型。独立测试集的结果证明了在涉及五个物种的10个数据集上,本发明模型比现有模型更具有鲁棒性,性能更优,泛化能力更强。随后,为研究结合注意力机制的卷积神经网络模型能达到更好性能的原因,本发明采用于梯度类激活映射可视化技术获取模型对于每个样本的位置权重分布,最终验证了模型能够自动注意并获取到样本的有效特征。本发明可以提高预测精度和对剪接位点序列进行解释性分析。

    一种双端成对的剪接位点预测方法

    公开(公告)号:CN114566215A

    公开(公告)日:2022-05-31

    申请号:CN202210178009.6

    申请日:2022-02-25

    Abstract: 本发明公开了一种双端成对的剪接位点预测方法,该方法通过获取双端成对的剪接位点样本序列作为基准数据集和独立数据集;将碱基序列通过基于序列本身、物理化学性质等多种特征提取方式进行编码;组合多种特征作为一个多通道多维的向量表示;训练卷积神经网络模型;最后进行评估。这种预测方法可以结合样本多种特征表示方式,帮助卷积神经网络充分学习样本内在模式,提高了双端成对的剪接位点预测的准确率。

Patent Agency Ranking