蛋白预测模型训练方法、预测方法及可读存储介质

    公开(公告)号:CN115240771A

    公开(公告)日:2022-10-25

    申请号:CN202210900274.0

    申请日:2022-07-28

    Inventor: 邹权 丁漪杰

    Abstract: 本发明提供了一种目标蛋白预测模型的训练方法,包括:获取目标蛋白序列样本;根据研究视角对目标蛋白序列样本进行序列特征提取,得到序列特征;根据共享隐藏向量的方法,对所述序列特征进行耦合,得到耦合特征;将所述耦合特征导入分类机进行训练,得到目标蛋白预测模型。发明人通过共享隐藏向量的方法,对序列特征进行耦合,再导入分类机进行训练,提高了目标蛋白预测模型的预测的精确程度。

    一种甲基化位点识别方法及装置

    公开(公告)号:CN113823356A

    公开(公告)日:2021-12-21

    申请号:CN202111136225.6

    申请日:2021-09-27

    Inventor: 邹权 李静 杜军平

    Abstract: 本发明提供一种甲基化位点识别方法及装置,方法包括:导入甲基化位点识别序列数据文件,并从甲基化位点识别序列数据文件中获取待处理的原始甲基化位点数据集;从原始甲基化位点数据集中提取数据特征,得到特征矩阵;对所述特征矩阵进行特征选择,选择得到多个特征和与其关联的实例类别,根据多个特征和与其关联的实例类别得到特征子集基于所述特征子集中的多个目标特征分别生成对应的基分类器;将多个基分类器进行集成,得到可识别甲基化位点的甲基化位点识别模型。本发明能够实现对甲基化位点的准确识别,为相应药物开发提供了理论基础,通过对基分类器进行集成进而构建甲基化位点识别模型,提升了甲基化位点识别精度。

    基于图的特征排序和降维方法

    公开(公告)号:CN113780416A

    公开(公告)日:2021-12-10

    申请号:CN202111063272.2

    申请日:2021-09-10

    Inventor: 贺世达 邹权

    Abstract: 基于图的特征排序和降维方法,它属于计算机和生物学交叉领域。本发明解决了现有降维方法的通用性差,降维过程费时的问题。本发明集成了多种特征排序方法,利用这些方法之间存在的互补性,这样更有利于挖掘出数据的潜在信息,有利于去除数据的冗余特征,有利于筛选出更有利于建模的特征。将这些算法的结果以图的形式表示,相对于其他算法而言,本发明方法更具有普适性、通用性。使用户不需要去尝试测试不同的降维方法,大大节省了降维所需要的时间。本发明可以应用于计算机和生物学交叉领域。

    药物-靶标相互作用的预测方法、装置、设备和存储介质

    公开(公告)号:CN113409897A

    公开(公告)日:2021-09-17

    申请号:CN202110606005.9

    申请日:2021-05-25

    Inventor: 邹权 茹晓青

    Abstract: 本申请提供了一种药物‑靶标相互作用的预测方法、装置、设备和存储介质。方法包括:获取训练数据集,所述训练数据集包括:靶标对象的蛋白序列和药物对象的化学结构,以及所述靶标对象和所述药物对象两者之间的相互作用关系;提取所述靶标对象的蛋白序列的靶标特征和所述药物对象的化学结构的药物特征;对所述靶标特征和所述药物特征进行特征选择;将选择后的靶标特征和药物特征进行特征融合;基于融合后的靶标特征和药物特征,构建用于预测药物‑靶标相互作用强弱顺序的排序模型;获取待预测靶标对象和待预测药物对象;基于所述排序模型,预测所述待预测靶标对象和所述待预测药物对象的亲和力。能够预测靶标对象和药物对象的亲和力。

    肿瘤基因共表达网络构建方法、装置、设备和存储介质

    公开(公告)号:CN112908405A

    公开(公告)日:2021-06-04

    申请号:CN202110113106.2

    申请日:2021-01-27

    Inventor: 徐磊 王彦苏 邹权

    Abstract: 本申请提供了一种肿瘤基因共表达网络构建方法、装置、设备和存储介质。所述方法包括:获取目标人体系统中的多种组织癌变转录组测序数据和所述多种组织的正常转录组测序数据;所述目标人体系统是人体解剖学八大人体系统中的任一人体系统;根据基因和转录本的关系,以及正常转录组测序数据中基因表达量呈现均一化的RNA,提取出多种组织的癌变转录组测序数据中存在差异的mRNA、lncRNA和miRNA;对所述多种组织的癌变差异mRNA、lncRNA和miRNA进行GO分析,得到融合为一个目标表达矩阵;对所述目标表达矩阵进行WGCNA分析,根据性状构建表达模块,取相关性最高的模块进行网络的构建。能够实现对多种癌症的网络构建。

    基于转录因子基序预测scATAC-seq中启动子片段的分类方法

    公开(公告)号:CN120032725A

    公开(公告)日:2025-05-23

    申请号:CN202510495859.2

    申请日:2025-04-21

    Abstract: 本发明公开了一种基于转录因子基序预测scATAC‑seq中启动子片段的分类方法,它解决了现有技术中通过多组学整合来确定启动子的方式繁琐且效率低的问题。它包括通过分析同一组织中的多种组学数据,接着通过RNA表达量分析,筛选出前2000个高变基因。然后利用基因ID确定这些基因是否具有对应的RNA表达量,并找到这些基因的转录起始位点TSS处的scATAC‑seq序列,同时区分出非启动子区域的序列,并将启动子区域的序列分割成100bp的片段,以便进行后续的特征提取。随后利用motif特征对这些片段进行特征提取,建立预测模型,用于预测启动子区域。最后对预测模型进行评估,确保其具有良好的预测性能和准确性。本发明的优点在于:能够通过学习多组学数据可以准确快速的识别启动子区域。

Patent Agency Ranking