一种脱落细胞DNA低频突变富集测序方法

    公开(公告)号:CN105132407A

    公开(公告)日:2015-12-09

    申请号:CN201510488017.0

    申请日:2015-08-10

    Abstract: 本发明提供了一种脱落细胞DNA的低频突变富集测序方法,包括脱落细胞DNA的提取与DNA的打断,样品DNA文库构建、通用文库TT-COLD PCR扩增富集、探针富集捕获、捕获产物PCR及上机测序、正反双链纠错低频信息分析步骤,具体为基于接头通用引物进行TT COLD PCR对所有类型变异实现第一级突变富集扩增;设计富集探针芯片,针对热点变异将人基因组参考序列hg19设计的探针替换为基于突变碱基设计的探针,其他位点探针不变,进行第二级富集捕获;文库构建中的插入DNA两端12bp自身序列作为标签进行正反双链纠错比对,提高数据利用率,实现低频精确检测,可以对0.01%低频变异具有高特异性检测。

    一种基于多连体特征的T细胞受体对应表位预测方法

    公开(公告)号:CN111429965A

    公开(公告)日:2020-07-17

    申请号:CN202010198109.6

    申请日:2020-03-19

    Abstract: 本发明公开了一种基于多连体特征的T细胞受体对应表位预测方法,将CDR3β链以及对应的表位解析为长度3的碱基,统计每种三联体的频次作为初始特征;根据得到的初始特征建立初始特征矩阵,使用主成分分析法对初始特征矩阵进行降维,进行特征提取;设有n个训练样本,输入预测数据x后,训练得到梯度提升决策树模型,通过梯度提升决策树模型将各个决策树的决策结果线性组合起来做出预测;将特征数据输入训练好的模型中进行预测,根据不同的预测目的选择不同的预测指标。本发明仅使用三联体的统计值作为初始特征,结合梯度提升决策树模型能够在极短的时间内完成模型的训练,且预测的准确度更高。

    一种基于多连体特征的T细胞受体对应表位预测方法

    公开(公告)号:CN111429965B

    公开(公告)日:2023-04-07

    申请号:CN202010198109.6

    申请日:2020-03-19

    Abstract: 本发明公开了一种基于多连体特征的T细胞受体对应表位预测方法,将CDR3β链以及对应的表位解析为长度3的碱基,统计每种三联体的频次作为初始特征;根据得到的初始特征建立初始特征矩阵,使用主成分分析法对初始特征矩阵进行降维,进行特征提取;设有n个训练样本,输入预测数据x后,训练得到梯度提升决策树模型,通过梯度提升决策树模型将各个决策树的决策结果线性组合起来做出预测;将特征数据输入训练好的模型中进行预测,根据不同的预测目的选择不同的预测指标。本发明仅使用三联体的统计值作为初始特征,结合梯度提升决策树模型能够在极短的时间内完成模型的训练,且预测的准确度更高。

    一种肿瘤良恶性鉴别模型的构建方法及装置

    公开(公告)号:CN111276252A

    公开(公告)日:2020-06-12

    申请号:CN202010043127.7

    申请日:2020-01-15

    Abstract: 本发明提供的一种肿瘤良恶性鉴别模型的构建方法及装置,包括:取已知良性肿瘤样本和恶性肿瘤样本若干作为训练集,获得训练集中样本的TCR克隆种类和CDR3区段;统计并计算所述CDR3区段出现的频次,然后将所述CDR3区段通过Kmer打断进行重编码;将CDR3重编码后获得的Kmer频率数据进行数据降维处理;将训练集中的已知肿瘤样本的良恶性信息与数据降维后的Kmer数据关联,利用机器学习算法进行模型的训练,得到肿瘤良恶性鉴别模型;上述构建方法构建得到肿瘤良恶性鉴别模型,用于对未知肿瘤样本进行良恶性鉴定,且能够对不同种类的肿瘤样本的良恶性进行鉴定,满足广谱性和特异性的需求。

Patent Agency Ranking