基于contig质量评估分类及图优化的scaffolding方法

    公开(公告)号:CN108491687A

    公开(公告)日:2018-09-04

    申请号:CN201810242418.1

    申请日:2018-03-22

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于contig质量评估分类及图优化的scaffolding方法,采用序列比对信息以及contig的GC含量信息对contig集合进行质量评估并分类,再将每个contig作为一个节点,根据双端读数比对到contig上的数量期望值以及实际值之间的差异判断是否在两个节点之间构建边,并计算边的权值,构建加权的scaffold图。最后通过为节点分配方向以及剪切节点来消除scaffold图中的方向冲突,通过为节点分配顺序来消除scaffold图中的顺序冲突。本发明简单易用,在四组真实测序数据上表现出良好的拼接结果,较其他序列拼接方法具有更高的F-score值。

    基于集成的相似性度量和双向随机游走的药物重定位方法

    公开(公告)号:CN105653846B

    公开(公告)日:2018-08-31

    申请号:CN201510991455.9

    申请日:2015-12-25

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于集成的相似性度量和双向随机游走的药物重定位方法,集成相似性度量方法在计算药物相似性、疾病相似性时,除了分别利用药物特性信息与疾病特性信息,还充分考虑了当前数据集中已知药物‑疾病关联信息对相似性度量的作用,使得所计算的相似性值能够更好的反映药物间的相似度和疾病间的相似度。在此基础上,构建了药物‑疾病异构网络,基于该异构网络,采用双向随机游走算法为所有的药物预测候选疾病。本发明简单有效,通过与其他方法比较,及在多个数据集上测试表明,该发明在药物重定位方面具有较好的预测性能。

    一种基于读数和距离分布的基因组De novo序列拼接方法

    公开(公告)号:CN104200133B

    公开(公告)日:2017-03-29

    申请号:CN201410482300.8

    申请日:2014-09-19

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于读数和距离分布的基因组De novo序列拼接方法,采用De Bruijn图存储读数之间的重叠关系,基于读数分布提出了一种新的打分函数用在contig构建、scaffolding和填充空白区域等步骤。该打分函数充分考虑了测序深度,k-mer频次以及在复杂重复区中insertsize的偏移。本发明简单易用,在不同的模拟和真实测序数据上表现出良好的拼接结果,较其他序列拼接方法具有更高的连续性和完整性。

    基于双端读数insert size统计特征的scaffolding方法

    公开(公告)号:CN106355000A

    公开(公告)日:2017-01-25

    申请号:CN201610728996.7

    申请日:2016-08-25

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于双端读数insert size统计特征的scaffolding方法,首先对双端读数比对到contig上的噪音进行预处理。接着构建scaffold图,图中每个节点代表一个contig;基于insert size分布估计两个节点之间比对上双端读数的期望值;再根据两个节点之间比对上双端读数的实际个数和期望值,确定两个节点之间是否存在边以及边的权重。然后采用迭代和线性规划的方法解决scaffold图中可能存在的冲突。最后利用广度优先遍历算法从scaffold图中确定scaffold。本发明简单易用,在不同的真实数据上表现出良好的scaffolding结果,较其它scaffolding方法具有更高的准确性。

    基于双端读数insertsize分布的contig错误连接区域识别方法

    公开(公告)号:CN105787295A

    公开(公告)日:2016-07-20

    申请号:CN201610153531.3

    申请日:2016-03-17

    Applicant: 中南大学

    CPC classification number: G06F19/20

    Abstract: 本发明公开了一种基于双端读数insert size分布的contig错误连接区域识别方法,包括以下步骤:1)输入contigs集合和双端读数文库,使用序列比对工具将双端读数文库的双端读数比对到contigs集合上,得到比对结果;2)根据比对结果,得到双端支持稀疏的区域;将这些区域作为错误连接的候选区域;3)并通过双端读数的分布检验对候选区域进行延伸,最终通过区域长度判定候选区域是否是错误连接位置;4)确定错误连接区域的边界。本发明方法具有较高的准确度,通过错误位点切割能够明显减少contig中的拼接错误,有效地提高了contig的质量。

    基于亚细胞定位特异性的关键蛋白质识别方法

    公开(公告)号:CN104156634B

    公开(公告)日:2017-02-01

    申请号:CN201410399693.6

    申请日:2014-08-14

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于亚细胞定位特异性的关键蛋白质识别方法,包括以下步骤:步骤1:建立亚细胞定位的蛋白质相互作用子网;步骤2:衡量各个蛋白质亚细胞定位相互作用子网的蛋白质关键性得分的可信度;步骤3:计算所有蛋白质的关键性综合得分:步骤4:输出结果:对细胞内所有蛋白质按关键性综合得分排序并输出排序结果。该基于亚细胞定位特异性的关键蛋白质识别方法在关键蛋白质的识别方面准确性高、敏感度高。

    基于集成的相似性度量和双向随机游走的药物重定位方法

    公开(公告)号:CN105653846A

    公开(公告)日:2016-06-08

    申请号:CN201510991455.9

    申请日:2015-12-25

    Applicant: 中南大学

    CPC classification number: G06F19/3456

    Abstract: 本发明公开了一种基于集成的相似性度量和双向随机游走的药物重定位方法,集成相似性度量方法在计算药物相似性、疾病相似性时,除了分别利用药物特性信息与疾病特性信息,还充分考虑了当前数据集中已知药物-疾病关联信息对相似性度量的作用,使得所计算的相似性值能够更好的反映药物间的相似度和疾病间的相似度。在此基础上,构建了药物-疾病异构网络,基于该异构网络,采用双向随机游走算法为所有的药物预测候选疾病。本发明简单有效,通过与其他方法比较,及在多个数据集上测试表明,该发明在药物重定位方面具有较好的预测性能。

    基于contig质量评估分类及图优化的scaffolding方法

    公开(公告)号:CN108491687B

    公开(公告)日:2021-07-13

    申请号:CN201810242418.1

    申请日:2018-03-22

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于contig质量评估分类及图优化的scaffolding方法,采用序列比对信息以及contig的GC含量信息对contig集合进行质量评估并分类,再将每个contig作为一个节点,根据双端读数比对到contig上的数量期望值以及实际值之间的差异判断是否在两个节点之间构建边,并计算边的权值,构建加权的scaffold图。最后通过为节点分配方向以及剪切节点来消除scaffold图中的方向冲突,通过为节点分配顺序来消除scaffold图中的顺序冲突。本发明简单易用,在四组真实测序数据上表现出良好的拼接结果,较其他序列拼接方法具有更高的F‑score值。

    基于双端读数insert size统计特征的scaffolding方法

    公开(公告)号:CN106355000B

    公开(公告)日:2018-10-16

    申请号:CN201610728996.7

    申请日:2016-08-25

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于双端读数insert size统计特征的scaffolding方法,首先对双端读数比对到contig上的噪音进行预处理。接着构建scaffold图,图中每个节点代表一个contig;基于insert size分布估计两个节点之间比对上双端读数的期望值;再根据两个节点之间比对上双端读数的实际个数和期望值,确定两个节点之间是否存在边以及边的权重。然后采用迭代和线性规划的方法解决scaffold图中可能存在的冲突。最后利用广度优先遍历算法从scaffold图中确定scaffold。本发明简单易用,在不同的真实数据上表现出良好的scaffolding结果,较其它scaffolding方法具有更高的准确性。

    基于双端读数insert size分布的contig错误连接区域识别方法

    公开(公告)号:CN105787295B

    公开(公告)日:2018-03-06

    申请号:CN201610153531.3

    申请日:2016-03-17

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于双端读数insert size分布的contig错误连接区域识别方法,包括以下步骤:1)输入contigs集合和双端读数文库,使用序列比对工具将双端读数文库的双端读数比对到contigs集合上,得到比对结果;2)根据比对结果,得到双端支持稀疏的区域;将这些区域作为错误连接的候选区域;3)并通过双端读数的分布检验对候选区域进行延伸,最终通过区域长度判定候选区域是否是错误连接位置;4)确定错误连接区域的边界。本发明方法具有较高的准确度,通过错误位点切割能够明显减少contig中的拼接错误,有效地提高了contig的质量。

Patent Agency Ranking