-
公开(公告)号:CN104834834A
公开(公告)日:2015-08-12
申请号:CN201510166526.1
申请日:2015-04-09
Applicant: 苏州大学张家港工业技术研究院
Abstract: 本发明的启动子识别系统的构建方法和装置,将包含多条基因序列的数据集划分为具有预设属性的第一数据子集和不具有预设属性的第二数据子集;并分别提取第一、第二数据子集的多种预设特征,所述预设特征包括基因刚性特征;之后,对特征提取所得的多个特征数据集合进行建模,得到构成启动子识别系统所需的各个子分类器模型。可见,本发明在构建人类基因启动子识别系统时,考虑了基因结构特征(如基因刚性特征),通过提取基因数据的基因刚性特征,并将提取的基因刚性特征作为训练数据进行建模,使最终的识别系统具备了结合基因结构特征识别启动子的能力,提升了系统的识别性能。