一种基于多连体特征的T细胞受体对应表位预测方法

    公开(公告)号:CN111429965A

    公开(公告)日:2020-07-17

    申请号:CN202010198109.6

    申请日:2020-03-19

    Abstract: 本发明公开了一种基于多连体特征的T细胞受体对应表位预测方法,将CDR3β链以及对应的表位解析为长度3的碱基,统计每种三联体的频次作为初始特征;根据得到的初始特征建立初始特征矩阵,使用主成分分析法对初始特征矩阵进行降维,进行特征提取;设有n个训练样本,输入预测数据x后,训练得到梯度提升决策树模型,通过梯度提升决策树模型将各个决策树的决策结果线性组合起来做出预测;将特征数据输入训练好的模型中进行预测,根据不同的预测目的选择不同的预测指标。本发明仅使用三联体的统计值作为初始特征,结合梯度提升决策树模型能够在极短的时间内完成模型的训练,且预测的准确度更高。

    一种基于多连体特征的T细胞受体对应表位预测方法

    公开(公告)号:CN111429965B

    公开(公告)日:2023-04-07

    申请号:CN202010198109.6

    申请日:2020-03-19

    Abstract: 本发明公开了一种基于多连体特征的T细胞受体对应表位预测方法,将CDR3β链以及对应的表位解析为长度3的碱基,统计每种三联体的频次作为初始特征;根据得到的初始特征建立初始特征矩阵,使用主成分分析法对初始特征矩阵进行降维,进行特征提取;设有n个训练样本,输入预测数据x后,训练得到梯度提升决策树模型,通过梯度提升决策树模型将各个决策树的决策结果线性组合起来做出预测;将特征数据输入训练好的模型中进行预测,根据不同的预测目的选择不同的预测指标。本发明仅使用三联体的统计值作为初始特征,结合梯度提升决策树模型能够在极短的时间内完成模型的训练,且预测的准确度更高。

    一种构建病原生物基因组数据库的方法及装置

    公开(公告)号:CN115346608A

    公开(公告)日:2022-11-15

    申请号:CN202210743555.X

    申请日:2022-06-27

    Abstract: 一种构建病原生物基因组数据库的方法及装置,该方法包括:获取基因组数据步骤,包括从数据库获取选定的病原生物的基因组数据;同源区域屏蔽步骤,包括对基因组数据进行质粒同源区域屏蔽、宿主源同源区域屏蔽,获得屏蔽同源区域后的基因组数据;融合基因组构建步骤,包括对屏蔽同源区域序列后的基因组数据中的各个基因组构建融合基因组;组库步骤,包括重复所述获取基因组数据步骤、同源区域屏蔽步骤、融合基因组构建步骤,遍历所选定的所有病原生物的基因组数据,汇总所有融合基因组,得到病原生物基因组数据库。该方法构建的数据库具有准确度高,分析时间短的优点。

    全基因组甲基化非重亚硫酸氢盐测序文库及构建

    公开(公告)号:CN110820050A

    公开(公告)日:2020-02-21

    申请号:CN201911159400.6

    申请日:2019-11-22

    Abstract: 本发明涉及生物信息学技术领域,具体涉及一种全基因组甲基化非重亚硫酸氢盐的测序文库及构建、用途,包括TET酶反应液,所述TET酶反应液包括如下独立包装的组分:TET酶氧化缓冲液;所述TET酶氧化缓冲液包括如下微摩尔份的组分:HEPES或Tris–Cl(20-167)×103份,NaCl(100-333)×103份,α-KG或2-oxoglutarate 3.3×103份,抗坏血酸6.67×103份,和三磷酸腺苷4×103份;采用上述试剂盒结合Fe(NH4)2(SO4)2以及TET酶可以将5mc氧化为5cac,5cac在还原剂作用下被还原为二氢尿嘧啶,经PCR测序识别为T,实现在非重亚硫酸氢盐条件下的DNA甲基化“C”到“T”转化,解决现有的基于亚硫酸氢盐转化构建的甲基化测序文库存在的碱基不平衡,测序数据使用率低的缺陷,该配方还具有组分精简,TET酶使用量极低,显著降低成本的效果。

    一种血浆中游离的目标DNA低频突变富集测序方法

    公开(公告)号:CN105063208B

    公开(公告)日:2018-03-06

    申请号:CN201510487759.1

    申请日:2015-08-10

    CPC classification number: A61K38/00 C12Q1/68

    Abstract: 本发明提供了一种血浆中游离的目标DNA低频突变富集测序方法,包括血浆DNA提取与文库构建、通用文库TT COLD PCR扩增富集、探针富集捕获、捕获产物PCR及上机测序、正反双链纠错低频信息分析,具体为基于通用引物进行TT COLD PCR对所有类型变异实现第一级突变富集扩增;设计富集探针芯片,针对热点变异将人基因组参考序列hg19设计的探针替换为基于突变碱基设计的探针,其他位点探针不变,进行第二级富集捕获;基于文库构建中的插入DNA两端12bp自身序列作为标签进行正反双链纠错比对,提高数据利用率,实现低频精确检测。本发明方法操作简便,实用性强,可以对0.01%低频变异具有高特异性检测。

    一种外泌体miRNA的定量检测方法

    公开(公告)号:CN105063209A

    公开(公告)日:2015-11-18

    申请号:CN201510488030.6

    申请日:2015-08-10

    CPC classification number: C12Q1/6851 C12Q2525/191 C12Q2525/207 C12Q2535/122

    Abstract: 本发明提供了一种外泌体miRNA的定量检测方法,包括外泌体总RNA提取、3’端和5’端特异性唯一标签接头连接、反转录合成cDNA并进行PCR扩增、miRNA文库的筛选纯化与上机测序、纠错算法的信息分析等步骤。本发明方法基于特异性的唯一标签接头的标记,对每个原始模板进行区分,避免了扩增时分子间存在的偏好性,可以精确检测低于10拷贝以下的miRNA分子,且特异性高,可用于肿瘤源性的外泌体miRNA的检测,神经退行性疾病、心血管疾病,生育健康等领域的检测,可为疾病的早期筛查提供依据,还可应用于其他小RNA精准定量检测领域。具有广阔的应用前景和市场价值。

    一种肿瘤良恶性鉴别模型的构建方法及装置

    公开(公告)号:CN111276252B

    公开(公告)日:2023-03-28

    申请号:CN202010043127.7

    申请日:2020-01-15

    Abstract: 本发明提供的一种肿瘤良恶性鉴别模型的构建方法及装置,包括:取已知良性肿瘤样本和恶性肿瘤样本若干作为训练集,获得训练集中样本的TCR克隆种类和CDR3区段;统计并计算所述CDR3区段出现的频次,然后将所述CDR3区段通过Kmer打断进行重编码;将CDR3重编码后获得的Kmer频率数据进行数据降维处理;将训练集中的已知肿瘤样本的良恶性信息与数据降维后的Kmer数据关联,利用机器学习算法进行模型的训练,得到肿瘤良恶性鉴别模型;上述构建方法构建得到肿瘤良恶性鉴别模型,用于对未知肿瘤样本进行良恶性鉴定,且能够对不同种类的肿瘤样本的良恶性进行鉴定,满足广谱性和特异性的需求。

Patent Agency Ranking