一种用最近邻检索实现的蛋白质亚细胞定位预测方法

    公开(公告)号:CN105046106B

    公开(公告)日:2018-02-23

    申请号:CN201510411973.9

    申请日:2015-07-14

    Abstract: 一种用最近邻检索实现的蛋白质亚细胞定位预测方法,该方法包括以下步骤:(1)、以AAC特征向量作为蛋白序列的特征,用LSH方法将训练集中的各蛋白序列的AAC特征向量存放在多个哈希表中;(2)、预测时,用LSH方法计算出目标序列AAC特征向量在每一个哈希表中对应的哈希值,得到相似序列向量的集合;(3)、从得到的相似序列向量的集合中选取离目标序列AAC特征向量欧氏距离最近的Q个向量,用全局比对动态规划法计算目标序列AAC特征向量与前述Q个向量的向量间蛋白序列期望距离,将Q个向量中与目标序列期望距离最高的序列蛋白对应区间作为预测区间。

    一种用最近邻检索实现的蛋白质亚细胞定位预测方法

    公开(公告)号:CN105046106A

    公开(公告)日:2015-11-11

    申请号:CN201510411973.9

    申请日:2015-07-14

    Abstract: 一种用最近邻检索实现的蛋白质亚细胞定位预测方法,该方法包括以下步骤:(1)、以AAC特征向量作为蛋白序列的特征,用LSH方法将训练集中的各蛋白序列的AAC特征向量存放在多个哈希表中;(2)、预测时,用LSH方法计算出目标序列AAC特征向量在每一个哈希表中对应的哈希值,得到相似序列向量的集合;(3)、从得到的相似序列向量的集合中选取离目标序列AAC特征向量欧氏距离最近的Q个向量,用全局比对动态规划法计算目标序列AAC特征向量与前述Q个向量的向量间蛋白序列期望距离,将Q个向量中与目标序列期望距离最高的序列蛋白对应区间作为预测区间。

Patent Agency Ranking