-
公开(公告)号:CN109903812A
公开(公告)日:2019-06-18
申请号:CN201910133090.4
申请日:2019-02-22
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种基于信息熵的基因序列数字化实现方法及系统。其中,所述方法包括:输入脱氧核糖核酸DNA序列,设定滑动窗口的长度l及子串长度n,和根据该设定的滑动窗口的长度l,从该输入的脱氧核糖核酸DNA序列的第一个碱基开始,步长为1,和计算该设定的滑动窗口内的给定子串长度下的拓扑熵大小,赋值给该设定的滑动窗口内的碱基,和重复计算该设定的滑动窗口内的给定子串长度下的拓扑熵大小,赋值给该设定的滑动窗口内的碱基,直到到达该输入的脱氧核糖核酸DNA序列的最后一个碱基位置,和输出得到同该输入的脱氧核糖核酸DNA序列长度的数字序列。通过上述方式,能够实现预测基因序列中的外显子区域。