一种基于信息熵的基因序列数字化实现方法及系统

    公开(公告)号:CN109903812A

    公开(公告)日:2019-06-18

    申请号:CN201910133090.4

    申请日:2019-02-22

    Abstract: 本发明公开了一种基于信息熵的基因序列数字化实现方法及系统。其中,所述方法包括:输入脱氧核糖核酸DNA序列,设定滑动窗口的长度l及子串长度n,和根据该设定的滑动窗口的长度l,从该输入的脱氧核糖核酸DNA序列的第一个碱基开始,步长为1,和计算该设定的滑动窗口内的给定子串长度下的拓扑熵大小,赋值给该设定的滑动窗口内的碱基,和重复计算该设定的滑动窗口内的给定子串长度下的拓扑熵大小,赋值给该设定的滑动窗口内的碱基,直到到达该输入的脱氧核糖核酸DNA序列的最后一个碱基位置,和输出得到同该输入的脱氧核糖核酸DNA序列长度的数字序列。通过上述方式,能够实现预测基因序列中的外显子区域。

Patent Agency Ranking