-
公开(公告)号:CN1598821A
公开(公告)日:2005-03-23
申请号:CN200410041883.7
申请日:2004-09-07
Applicant: 东南大学
IPC: G06F17/30
Abstract: 基于特征的基因组序列数据库的搜索方法,是一种根据序列的统计特征在数据库范围内搜索近似序列的方法搜索方法为:根据序列统计特征间的距离来搜索相似序列,即把不同物种的基因组序列数据的基本信息——即序列在基因库的数据库登录号、序列所属的物种名称、序列所在该物种的染色体号和序列原始数据、以及从统计学角度体现序列特征的包括碱基组成特性、碱基对相关性统计特征值存储到数据库里;对于客户提交的任何一个基因片段,首先根据客户的要求计算它的一个特征值,再依次计算该序列的特征值与数据库内所有序列的相应特征值之间的距离,比较相似序列;按照距离由小到大,排列显示出数据库里和用户提交的序列最相似的一部分序列。