-
公开(公告)号:CN116003260B
公开(公告)日:2023-07-18
申请号:CN202310307448.7
申请日:2023-03-27
Applicant: 广州国家实验室
IPC: C07C209/00 , C07C209/24 , C07C211/58 , C07C211/59 , C07C213/02 , C07C217/94 , C07D333/16 , C07D239/94 , C07D319/22 , G16C20/70
Abstract: 本发明提供了由尿素衍生物制备1‑萘胺类化合物的方法及其预测模型。在碱性条件下,使用廉价的铜催化剂,以稳定易得的尿素衍生物作胺源,与2‑溴苯乙酮和末端炔烃类化合物反应合成1‑萘胺类化合物。该方法使用廉价易得的原料,不使用配体、微波辐射等特殊反应条件,底物适用性范围广,能兼容重要官能团,如氨基、噻吩、嘧啶等,反应条件温和,操作简单,产物产率都很高,在农药和生物活性药物上具有潜在的应用前景。同时利用高通量实验和机器学习技术,建立了一个基于MAF‑XGB的产率预测模型,可以对未出现的底物进行精准的预测,产率误差为±7.6%。
-
公开(公告)号:CN119833003A
公开(公告)日:2025-04-15
申请号:CN202411633552.6
申请日:2024-11-14
IPC: G16C20/10 , G16C20/70 , G06F18/23 , G06F18/213
Abstract: 本发明提供一种空间范围可灵活调节的多样性采样算法,包括:获取各候选数据;基于所述各候选数据与各数据簇的中心之间的特征距离,将所述各候选数据划分至所述各数据簇,所述各数据簇是对各参考数据进行特征聚类得到的;基于所述各数据簇中参考数据的特征分布信息,筛选所述各数据簇中的候选数据,在筛选完成后,采样所述各数据簇中的候选数据。本发明提供的算法,各候选数据划分至对参考数据聚类所得的各数据簇中,并基于各数据簇中参考数据的特征分布信息对各数据簇中的候选数据进行筛选,并在筛选完成后再对每个数据簇中的候选数据进行采样,由此使得数据采样能够参考数据的分布情况和多样性,进而保证采样结果的覆盖度和多样性。
-
公开(公告)号:CN119049593A
公开(公告)日:2024-11-29
申请号:CN202411096336.2
申请日:2024-08-09
Applicant: 广州国家实验室
IPC: G16C20/70 , G16C20/10 , G16C20/20 , G16C20/90 , G06N3/0464 , G06N3/045 , G06N3/09 , G06F18/2135 , G06F18/25 , G06N20/20
Abstract: 本发明提供一种化学反应的产率预测方法及装置,其中方法包括:基于化学反应的反应条件组合和参与化学反应的第一底物,确定化学反应的中间体;将中间体、参与化学反应的第二底物,以及化学反应的产物输入至产率预测模型,得到产率预测模型输出的化学反应的预测产率,第二底物是除第一底物之外的、参与化学反应的底物;产率预测模型是基于多个反应样本训练得到,反应样本包括参与样本化学反应的样本第二底物,以及样本化学反应的样本中间体、样本产物和实测产率。本发明提供的方法、装置及设备,由于无需输入种类繁多且复杂的反应条件组合,产率预测模型的复杂度大减,针对化学反应的产率预测精度得以提升。
-
公开(公告)号:CN116003260A
公开(公告)日:2023-04-25
申请号:CN202310307448.7
申请日:2023-03-27
Applicant: 广州国家实验室
IPC: C07C209/00 , C07C209/24 , C07C211/58 , C07C211/59 , C07C213/02 , C07C217/94 , C07D333/16 , C07D239/94 , C07D319/22 , G16C20/70
Abstract: 本发明提供了由尿素衍生物制备1‑萘胺类化合物的方法及其预测模型。在碱性条件下,使用廉价的铜催化剂,以稳定易得的尿素衍生物作胺源,与2‑溴苯乙酮和末端炔烃类化合物反应合成1‑萘胺类化合物。该方法使用廉价易得的原料,不使用配体、微波辐射等特殊反应条件,底物适用性范围广,能兼容重要官能团,如氨基、噻吩、嘧啶等,反应条件温和,操作简单,产物产率都很高,在农药和生物活性药物上具有潜在的应用前景。同时利用高通量实验和机器学习技术,建立了一个基于MAF‑XGB的产率预测模型,可以对未出现的底物进行精准的预测,产率误差为±7.6%。
-
-
-