-
公开(公告)号:CN108920889A
公开(公告)日:2018-11-30
申请号:CN201810694666.X
申请日:2018-06-28
Applicant: 中国科学院生态环境研究中心
IPC: G06F19/00
Abstract: 一种化学品健康危害筛查方法,主要包括以下步骤:将已知药效药物结构和转录组学特征通过非负矩阵分解,建立结构-健康影响-转录组学的关联网络模型;分别从药物治疗作用和结构相似度对该关联网络模型进行内部验证;根据药物确定的药效与模型每种健康影响的结构匹配度获得化学品健康危害筛查标准;将该化学品健康危害筛查标准用于模型应用域内化学品健康危害的排序和筛查。本发明充分利用药物组学大数据,建立仅输入化学品结构即可同时获得其多种健康危害排序的评估筛查模型,克服化学品健康风险评价中单纯依赖结构相似性无法解决的复杂毒性准确预测和多种健康影响同时筛查这一难题,在化学品健康风险评价领域具有广阔的应用前景。
-
公开(公告)号:CN119416069A
公开(公告)日:2025-02-11
申请号:CN202510020485.9
申请日:2025-01-07
Applicant: 中国科学院生态环境研究中心
IPC: G06F18/2415 , G06F18/214 , G06F18/213 , G06F18/241 , G06N20/00
Abstract: 本发明提供了一种用于预测农产品种植类型的预测模型训练方法和预测方法,可以应用于安全评估技术领域。该方法包括:获取有机种植农产品和常规种植农产品的高分辨率质谱数据样本以及与高分辨率质谱数据样本对应的分类标签;对每条高分辨率质谱数据样本进行预处理,得到标准化质谱数据样本,并针对每条标准化质谱数据样本,将标准化质谱数据样本划分为M个等长的箱盒样本;基于M个箱盒样本各自对应的总离子丰度,得到与标准化质谱数据样本所对应的质谱样本特征向量;利用数据集在初始预测模型上验证多组超参数组合,得到最优超参数组合,数据集包括质谱样本特征向量和分类标签;基于最优超参数组合训练初始预测模型,得到目标预测模型。
-
公开(公告)号:CN116230105A
公开(公告)日:2023-06-06
申请号:CN202310027541.2
申请日:2023-01-09
Applicant: 中国科学院生态环境研究中心
Abstract: 本发明公开了化学品和蛋白质靶点相互作用的预测方法,属于化学品毒性筛查技术领域。本发明所要解决的技术问题是如何预测化学品和蛋白质靶点相互作用。该预测方法包括从公共数据库获取化学品结构数据、蛋白质靶点一级结构数据和化学品和蛋白质靶点的亲和力数据,并进行标准化和结构清洗,能够进一步划分为阳性数据集和阴性数据集,作为模型输入数据;通过以化学品输入数据、蛋白质输入数据以及化学品和蛋白质相互作用标签输入数据为输入的基于深度学习注意力机制的网络架构,获得化学品和蛋白质靶点相互作用预测模型,根据该模型预测待测化学品和待测蛋白质靶点是否存在相互作用。
-
公开(公告)号:CN117393060A
公开(公告)日:2024-01-12
申请号:CN202311324827.3
申请日:2023-10-13
Applicant: 中国科学院生态环境研究中心
Abstract: 一种挥发性有机物大气氧化反应速率常数预测模型的建立方法,包括:获取多种挥发性有机物在大气中与不同氧化物分别发生反应的反应速率常数数据;将挥发性有机物的SMILES编码和氧化物的SMILES编码分别转换为分子图;针对每种挥发性有机物和每种氧化物在大气中发生的反应,将挥发性有机物和氧化物的分子图输入至图神经网络模型,输出反应速率常数预测数据;根据反应速率常数数据和反应速率常数预测数据,对图神经网络模型的网络参数进行优化,得到挥发性有机物大气氧化反应速率常数预测模型。本发明建立了两种物质的分子结构到反应过程性质的预测模型,节省模型训练时对分子描述符的计算时间和资源,降低对计算化学基础要求,提高预测性能,扩大预测范围。
-
公开(公告)号:CN116612821A
公开(公告)日:2023-08-18
申请号:CN202310484219.2
申请日:2023-04-28
Applicant: 中国科学院生态环境研究中心
Abstract: 一种化学品潜在生物靶点预测模型的建立方法、预测方法,该建立方法包括:获取蛋白质相互作用网络及化学品影响下包含差异化基因的转录组数据;将差异化基因的差异化分数沿蛋白‑蛋白相互作用网络扩散至临近基因节点,得到扩散后的差异化基因节点;分别计算每个基因节点与扩散后的差异化基因节点之间的平均最短距离;基于平均最短距离对蛋白质相互作用网络中基因节点进行排序,得到靶点蛋白预测列表;对扩散的参数进行调整直至靶点蛋白预测列表满足第一预测准确度条件;选择满足第一预测准确度条件的靶点蛋白预测列表的截断值,以使在截断值之前的靶点蛋白预测列表满足第二预测准确度条件。本发明利用该预测模型可快速、准确地预测潜在生物靶点。
-
公开(公告)号:CN112634993A
公开(公告)日:2021-04-09
申请号:CN202011642815.1
申请日:2020-12-30
Applicant: 中国科学院生态环境研究中心
Abstract: 一种化学品雌激素受体激活活性的预测模型及筛查方法,该化学品雌激素受体激活活性预测模型的建立方法包括获取已知雌激素受体激活活性的化学品数据,其中,所述化学品数据包括化学品的SMILES编码;将SMILES编码转换得到M×N的数字矩阵;将获得的已知化学品的数据分为训练集和验证集,构建以SMILES数字矩阵为输入的卷积神经网络模型;使用训练集训练卷积神经网络模型,使用验证集确定卷积神经网络模型的最优超参数,得到最优卷积神经网络模型。本发明适用于大规模化学品雌激素激活活性的筛查,方法简单快速,效率高,该方法在化学品风险评价、环境安全性评估等领域具有广阔的应用前景。
-
公开(公告)号:CN109583662A
公开(公告)日:2019-04-05
申请号:CN201811500291.5
申请日:2018-12-07
Applicant: 中国科学院生态环境研究中心
Abstract: 一种大气污染二元混合物健康风险评价新方法,包括以下步骤:从文献或实际环境监测中获得大气中污染物浓度,选取近似浓度的污染物作为待评价的二元混合组分,并将实际环境暴露浓度转化为体外等价浓度;从公开数据库或文献中获得每种污染物的转录组数据和特定通路的体外生物测试信息,计算其混合效应数值、校正相对效能因子和联合毒性作用模式;对污染物体外等价浓度进行蒙特卡洛模拟并耦合校正相对效能因子,评价混合污染物的健康风险。本发明建立在污染物单体环境暴露浓度和生物测试数据的基础上,不依赖混合物毒性数据,便可评价其健康风险,节约人力物力成本,在实际环境混合暴露健康风险评价和环境安全性评估等领域具有广阔的应用前景。
-
公开(公告)号:CN118447962A
公开(公告)日:2024-08-06
申请号:CN202410490051.0
申请日:2024-04-23
Applicant: 中国科学院生态环境研究中心 , 国科大杭州高等研究院
IPC: G16C20/70 , G06N3/045 , G06N3/09 , G06Q10/0635 , G06Q50/26
Abstract: 本公开提供了一种根浓度因子预测模型的建立方法,可以应用于环境健康风险评价技术领域。该方法包括:获取多种化合物的第一数据集和第一标签;利用第一数据集和第一标签,对第一训练模型的第一模型参数进行优化,得到包含初级模型参数的初级模型;获取多种污染物的第二数据集和第二标签;利用第二数据集和第二标签,对初级模型的第二模型参数进行优化,得到根浓度因子预测模型。本公开还提供了一种根浓度因子预测模型的训练装置以及根浓度因子预测方法。
-
公开(公告)号:CN112885415B
公开(公告)日:2024-02-06
申请号:CN202110092707.X
申请日:2021-01-22
Applicant: 中国科学院生态环境研究中心
IPC: G16C20/30 , G06N3/0464 , G06N3/0985
Abstract: 一种雌激素活性预测模型的构建方法、雌激素活性的筛查方法、电子设备以及计算机可读存储介质,该雌激素活性预测模型的构建方法包括获取已知具有雌激素活性的化学品数据,所述化学品数据包括化学品的初始三维结构信息;优化所述初始三维结构信息,获得优化后的三维结构信息;基于优化后的三维结构信息,获得所述化学品的分子表面点云矩阵;将分子表面点云矩阵作为输入训练卷积神经网络模型,获得所述雌激素活性预测模型。本发明所构建的深度人工神经网络模型无需人为定义的可量化的结构参数作为分子描述符,节省了分子描述符计算和描述符(56)对比文件Manz T A等.Improved atoms-in-moleculecharge partitioning functional forsimultaneously reproducing theelectrostatic potential and chemicalstates in periodic and nonperiodicmaterials《.Journal of chemical theory andcomputation》.2012,第8卷(第8期),2844-2867.刘芬.基于局部分子表面静电势参数的定量构效关系研究《.中国优秀硕士学位论文全文数据库工程科技Ⅰ辑》.2016,(第2期),第1.1.1节、第1.4节、第2章.郭明等.基于三维静电势参数研究 C60溶解性的构效关系《.物理化学学报》.2016,第19卷(第5期),432-435.Wang L等.SepPCNET: deeping learningon a 3D surface electrostatic potentialpoint cloud for enhanced toxicityclassification and its application tosuspected environmental estrogens.《Environmental Science & Technology》.2021,第55卷(第14期),9958-9967.Qi C R等.Pointnet: Deep learning onpoint sets for 3d classification andsegmentation《.Proceedings of the IEEEconference on computer vision and patternrecognition》.2017,652-660.堵锡华等.基于神经网络的喹诺酮羧酸类衍生物活性研究《.西北大学学报:自然科学版》.2019,第46卷(第9期),第918-926页.
-
公开(公告)号:CN113610326B
公开(公告)日:2023-05-12
申请号:CN202111058907.X
申请日:2021-09-09
Applicant: 中国科学院生态环境研究中心
IPC: G06Q10/04 , G06Q10/0635 , G06Q50/26 , G16C20/20
Abstract: 本公开提供了一种用于预测环境持久性自由基生成性能的方法,包括:建立起始反应物结构模型,建立反应产物结构模型;根据起始反应物结构模型与反应产物结构模型,采用预设方法搜寻反应驻点,得到多条反应路径;根据每条反应路径对应的过渡态结构的能量与起始反应物结构的能量,计算污染物分子在颗粒物表面转化生成环境持久性自由基的活化能;根据高精度量子化学方法计算污染物分子的关键结构参数,建立污染物分子转化为持久性自由基活化能与关键结构参数的快速预测模型;根据污染物分子结构参数的简单计算进行其活化能推算从而预测污染物分子在颗粒物表面能否转化生成环境持久性自由基。
-
-
-
-
-
-
-
-
-