一种筛选具有肽编码能力小开放阅读框的方法

    公开(公告)号:CN111899792B

    公开(公告)日:2022-10-14

    申请号:CN202010777126.5

    申请日:2020-08-05

    Abstract: 本发明属于医药技术领域,具体涉及一种筛选具有肽编码能力小开放阅读框的方法,以基因组GC含量为依据,从数据库筛选具有sORFs注释的原核生物基因组,并将其按照基因组GC含量分组,然后将各基因组中具有明确生物功能的sORFs筛选出来,进而利用CD‑Hit程序进行去冗余处理,依次以各基因组中肽编码sORFs作为正样本,其对应随机打乱序列为负样本,作为初步训练集分别预测其余基因组中的sORFs,将各基因组GC含量区间预测效果最好的基因组作为最终训练集来源基因组;基于筛选的训练集,以各序列密码子使用频率作为特征参数,利用分类器进行训练完成筛选。该方法对原核及真核生物都具有较好的筛选效果。

    一种前列腺癌预后显著相关ceRNA调控网络的构建方法

    公开(公告)号:CN112837744A

    公开(公告)日:2021-05-25

    申请号:CN202110174715.9

    申请日:2021-02-07

    Abstract: 本发明公开了一种前列腺癌预后显著相关ceRNA调控网络的构建方法,整合TCGA和GTEx数据库的前列腺癌基因表达数据集,分别进行差异基因表达分析和加权基因共表达网络分析,筛选差异表达的关键模块基因;通过WGCNA分析和Cox比例风险回归分析得到关键基因,将得到的关键基因,miRNA,lncRNA通过其相互作用关系构建ceRNA网络,并根据lncRNA,miRNA和hub gene在PRAD中的表达趋势进行评估,结合生存分析得到与PRAD预后显著相关的ceRNA调控网,便于进行疾病的早期诊断,设计靶向药物的精准治疗。

    基于决策树与线性回归模型预测癌症合成致死基因对的方法

    公开(公告)号:CN110349622A

    公开(公告)日:2019-10-18

    申请号:CN201910613818.3

    申请日:2019-07-09

    Abstract: 本发明为基因预测领域,公开了基于决策树模型和线性回归模型的癌症合成致死基因对预测方法。本方法主要分为数据训练阶段和合成致死基因对测试阶段。步骤依次为,首先基于多组学数据中提取包含所有突变基因对覆盖率、DNA甲基化、mRNA表达谱、拷贝数变异数据作为模型特征值进行聚类、去除假阳性、归一化处理,并且训练决策树模型以及线性回归模型。其次,利用决策树模型和线性回归模型分别预测在多种癌症中可能存在的合成致死基因对,得出合成致死基因对在不同癌症中的分布图谱。最后,对比两种模型得出在泛癌中均存在的合成致死基因对508对。本发明能较准确的预测多种癌症中可能存在的合成致死基因对,为癌症的精准治疗提供依据。

    一种结直肠癌合成致死基因对的应用

    公开(公告)号:CN115998887A

    公开(公告)日:2023-04-25

    申请号:CN202211037653.8

    申请日:2022-08-26

    Abstract: 本发明属于生物医药领域,提供了一种结直肠癌合成致死基因对的应用,该基因对可应用于携带有APC突变的结直肠癌精准治疗。所述的合成致死基因对是基于机器学习算法和分子细胞生物学实验筛选得到的APC和GFER。本发明首次发现合成致死基因对APC和GFER可用于结直肠癌的治疗。经检验证明,利用APC和GFER合成致死基因对,可有效杀死结直肠癌细胞而不损害正常细胞。在此基础上,APC和GFER合成致死基因对还可用于制备开发治疗结直肠癌的药物。本发明为临床在分子水平上开发结直肠癌治疗提供了新的思路,同时为结直肠癌的治疗提供了新的药物靶点。

    一种基于Notch信号通路的泛癌多组学分子分型与预后模型构建方法

    公开(公告)号:CN114927166A

    公开(公告)日:2022-08-19

    申请号:CN202210079683.9

    申请日:2022-01-24

    Abstract: 本发明属于生物信息领域,公开了一种基于Notch信号通路的泛癌多组学分子分型与预后模型构建方法,基于多组学数据中提取包含所有Notch通路基因DNA甲基化、mRNA表达谱、miRNA表达、拷贝数变异数据作为模型特征值,并进行缺失值处理和标准化处理,将包含多组学数据的所有特征输入到降噪自编码器网络中;将得到的代表性特征进行单变量Cox‑PH分析获得与生存时间显著相关的特征数据,对这些特征进行K均值聚类,根据中位风险评分将样本分为高风险组和低风险组,对这两组进行Kaplan‑Meier生存分析。Notch信号通路的多组学特征能很好的将患者分为两个亚型,在多种癌症中具有预后作用。

    一种基于TP53基因缺陷的结直肠癌合成致死基因组合的应用

    公开(公告)号:CN116983410A

    公开(公告)日:2023-11-03

    申请号:CN202310928652.0

    申请日:2023-07-27

    Abstract: 本发明属于生物医药领域,提供了一种基于TP53基因缺陷的结直肠癌合成致死基因组合的应用,用于针对携带有TP53突变的结直肠癌进行精准治疗。所述的合成致死基因对由TP53和USP1基因组成,是基于机器学习预测和分子细胞生物学实验验证得出的结果。本发明首次发现了TP53和USP1这一合成致死基因对可用于治疗结直肠癌。经过验证,利用TP53和USP1合成致死基因对可以有效杀死结直肠癌细胞,而不会损害正常细胞。此外,基于该基因对,还可以制备开发治疗结直肠癌的药物。本发明提供了一种新的分子水平上开发结直肠癌治疗的方法,并且为直肠癌治疗的药物研发提供了新的靶点。

    一种前列腺癌预后显著相关ceRNA调控网络的构建方法

    公开(公告)号:CN112837744B

    公开(公告)日:2023-07-28

    申请号:CN202110174715.9

    申请日:2021-02-07

    Abstract: 本发明公开了一种前列腺癌预后显著相关ceRNA调控网络的构建方法,整合TCGA和GTEx数据库的前列腺癌基因表达数据集,分别进行差异基因表达分析和加权基因共表达网络分析,筛选差异表达的关键模块基因;通过WGCNA分析和Cox比例风险回归分析得到关键基因,将得到的关键基因,miRNA,lncRNA通过其相互作用关系构建ceRNA网络,并根据lncRNA,miRNA和hub gene在PRAD中的表达趋势进行评估,结合生存分析得到与PRAD预后显著相关的ceRNA调控网,便于进行疾病的早期诊断,设计靶向药物的精准治疗。

    一种基于信息熵表征isomiR表达鉴定乳腺癌生物标志物的方法

    公开(公告)号:CN115954054A

    公开(公告)日:2023-04-11

    申请号:CN202310056304.9

    申请日:2023-01-18

    Abstract: 本发明属于生物信息领域,公开了一种基于信息熵表征isomiR表达鉴定乳腺癌生物标志物的方法,包括以下步骤:获取乳腺癌的isomiR表达数据,利用信息熵量化miRNA对应两臂的isomiR序列表达,作为miRNA的表达特征;并使用表达特征进行差异分析,筛选在乳腺癌中共同差异表达的miR‑3p/5p对;进行生存分析,预测可作为乳腺癌生物标志物的miR‑3p/5p对;获取miRNA靶标调控网络,确定其在乳腺癌发生过程中参与的生物学通路。本发明利用信息熵较无偏差地构建出表达特征,筛选在乳腺癌发生发展过程中起重要作用的生物标志物,为乳腺癌的诊断、预防和治疗提供了可行的现实方法。

    一种预测错义突变致病性的分析方法

    公开(公告)号:CN117393042A

    公开(公告)日:2024-01-12

    申请号:CN202311339424.6

    申请日:2023-10-16

    Inventor: 葛芳 郭丽

    Abstract: 本发明公开了一种预测错义突变致病性的分析方法,包括获取待测基因的错义突变、蛋白质序列以及映射了错义突变的错义突变蛋白质序列;提取错义突变蛋白质序列的突变位点的氨基酸特征向量,并利用多尺度残差神经网络捕获氨基酸特征向量的多尺度特征;分别利用ESM‑1b和ProtT5‑XL‑U50获得氨基酸特征矩阵,并预处理各氨基酸特征矩阵;利用多头注意力网络多路径捕捉预处理后的氨基酸特征矩阵的映射特征后,通过多头融合和残差连接处理头注意力网络捕捉的映射特征,以确定各氨基酸特征矩阵的映射特征;将多尺度特征与各氨基酸特征矩阵的氨基酸映射特征串联合并获得突变位点的氨基酸特征,并利用氨基酸特征确定错义突变为致病性突变或良性突变。能够预测错义突变为致病性突变或良性突变。

Patent Agency Ranking