一种增强子启动子调控网络预测模型构建方法

    公开(公告)号:CN119446286A

    公开(公告)日:2025-02-14

    申请号:CN202411370937.8

    申请日:2024-09-29

    Inventor: 吴杨 齐晓宁 赵屹

    Abstract: 本发明提供一种增强子启动子调控网络预测模型构建方法,包括:S1、获取原始数据集,原始数据集中包含多个生物样本的多个增强子‑启动子对数据,并将原始数据集划分为多个子集,其中,同一染色体对上的所有增强子启动子对划分到同一个子集;S2、子集进行预处理,每个子集均包含多个数据样本,每个数据样本为一个增强子启动子对,每个数据样本的特征向量为对应增强子启动子对的序列特征、该增强子启动子对之间的距离特征、该增强子启动子对对应的染色质开放性特征拼接形成的特征向量,每个数据样本的标签为对应增强子启动子对之间是否有相互作用;S3、基于预处理后的所有子集采用类别型特征梯度提升的方式,迭代构建多棵对称决策树组成预测模型。

    用于预测对新型药物扰动的转录响应的方法及虚拟筛选方法和系统

    公开(公告)号:CN119763720A

    公开(公告)日:2025-04-04

    申请号:CN202411330327.5

    申请日:2024-09-24

    Abstract: 本发明提供一种用于预测对新型药物扰动的转录响应的方法、基于该预测方法的虚拟筛选的方法以及基于以上方法的虚拟筛选系统。其中,预测模型包括扰动适配器、扰动编码器和扰动解码器。扰动适配器,用于将输入的一种或多种新型药物的化学结构和其剂量信息编码到扰动嵌入中;扰动编码器,用于将新型药物的扰动对输入的未扰动转录谱的影响映射到可解释的潜在空间,得到未扰动状态的潜在表示;以及扰动解码器,用于基于潜在表示和扰动嵌入预测新型药物扰动的转录响应的分布。根据新型药物的预测转录响应进行虚拟筛选,计算候选化合物对疾病敏感药物的富集分数,根据富集分数进型化合物推荐。本发明的预测模型的灵活性和扩展性能够无需先验知识或注释。

Patent Agency Ranking