-
公开(公告)号:CN117275606A
公开(公告)日:2023-12-22
申请号:CN202311254921.6
申请日:2023-09-26
Applicant: 南京大学
IPC: G16C20/30 , G16C20/70 , G06F18/241 , G06F18/213
Abstract: 本发明公开了一种基于化合物2D结构的用途分类模型的构建方法与应用,属于化合物用途高通量预测领域。本发明通过CompTox Chemicals Dashboard数据库收集化合物结构和用途,将化合物结构用分子描述符和混合分子指纹表征,而后去冗余并输入随机森林回归模型进行特征选择、超参数搜索、模型训练和验证,通过化合物的结构实现有效预测化合物的用途,有效填补目前大量化学品仅有结构而用途未知的空白,为我国和全球化学品的管控提供有效辅助和导向。
-
公开(公告)号:CN116052772A
公开(公告)日:2023-05-02
申请号:CN202310071460.2
申请日:2023-01-31
Applicant: 南京大学
Abstract: 本发明公开了一种干扰生物学通路的活性结构预测方法,通过构建包含细胞系、暴露时间、暴露浓度等明确标签的化合物生物学通路干扰数据库,通过累计超几何分布和累计伯努利分布评估训练集和测试集在生物学通路交叉程度和调控趋势的一致性,紧接着识别到训练集中一批潜在的化合物,进而以累积分布概率评估潜在化合物中分子描述符的出现频率,最终实现通过输入生物学通路预测驱动其变化的潜在活性结构。
-