-
公开(公告)号:CN117594156A
公开(公告)日:2024-02-23
申请号:CN202311496788.5
申请日:2023-11-10
Applicant: 之江实验室
IPC: G16C20/50 , G16C20/70 , G06F16/901 , G06F16/903 , G06F17/18
Abstract: 本发明公开了一种基于蒙特卡洛树搜索的多目标分子生成方法和装置,属于基于靶点的分子生成领域,包括:基于已知的蛋白质序列和分子碎片,以及用户多目标属性需求,本发明采用构建蒙特卡洛树的方式,依次将满足用户需求且亲和力强的原子符号拼接到分子碎片之后,最后得到的完整的分子再通过化学工具分析属性,得到分子的评估值,其中包含了用户对于分子的多目标属性的需求,再将构建起来的非支配的分子加入全局帕累托集合中,用于构建用户需要的分子。本发明采用蒙特卡洛树搜索算法,同时提出多目标选择标准,实现了用户指定的多目标属性的分子生成,具有简单易行、快速有效且搜索效率高的优势。
-
公开(公告)号:CN118711701B
公开(公告)日:2024-11-19
申请号:CN202411215460.6
申请日:2024-09-02
Applicant: 之江实验室
IPC: G16C20/30 , G16C20/70 , G06N3/0464 , G06N3/042
Abstract: 本发明公开了一种基于分布匹配的药物‑药物相互作用预测方法及装置,包括:提取药物的分子结构特征;基于所述分子结构特征,进一步提取药物间的拓扑关系特征;在特征空间和输出空间中,分别对所述分子结构特征和所述拓扑关系特征进行分布匹配,最大化其互信息,以预测DDI。本发明不仅考虑了药物的分子结构信息,还融合了药物间的拓扑关系信息。这种多视角信息的整合,全面捕捉了药物间的复杂相互作用,从而显著提高了预测的准确性,并且采用分布匹配策略,最大化了分子结构特征和拓扑关系特征之间的互信息,确保了信息的完整性和准确性,进一步提高了预测性能。
-
公开(公告)号:CN118711701A
公开(公告)日:2024-09-27
申请号:CN202411215460.6
申请日:2024-09-02
Applicant: 之江实验室
IPC: G16C20/30 , G16C20/70 , G06N3/0464 , G06N3/042
Abstract: 本发明公开了一种基于分布匹配的药物‑药物相互作用预测方法及装置,包括:提取药物的分子结构特征;基于所述分子结构特征,进一步提取药物间的拓扑关系特征;在特征空间和输出空间中,分别对所述分子结构特征和所述拓扑关系特征进行分布匹配,最大化其互信息,以预测DDI。本发明不仅考虑了药物的分子结构信息,还融合了药物间的拓扑关系信息。这种多视角信息的整合,全面捕捉了药物间的复杂相互作用,从而显著提高了预测的准确性,并且采用分布匹配策略,最大化了分子结构特征和拓扑关系特征之间的互信息,确保了信息的完整性和准确性,进一步提高了预测性能。
-
公开(公告)号:CN118116491A
公开(公告)日:2024-05-31
申请号:CN202410297931.6
申请日:2024-03-15
Applicant: 之江实验室
IPC: G16C20/10 , G16C20/70 , G06N3/042 , G06N3/0895
Abstract: 本发明公开了一种基于大型语言模型的化学反应产率预测方法及装置,利用大型语言模型从文献数据库中收集并参考类似的化学反应,来预测和优化新的化学反应的产率,旨在弥合现有产率预测模型与经验丰富的化学家之间的差距。通过用大语言模型生成代码来访问PubChem和Sci‑Finder等化学数据库,该人工智能助手可以像化学家一样访问最新且实时更新的文献数据,从而提高现有产率预测算法泛化能力以及实时知识获取能力。
-
公开(公告)号:CN118888046A
公开(公告)日:2024-11-01
申请号:CN202410915423.X
申请日:2024-07-09
Applicant: 之江实验室
Abstract: 本发明公开了一种基于大型语言模型的化学文献解析和反应信息提取方法和装置,对化学文献进行收集并经过OCR和筛选处理,得到处理后的化学文献数据集;对处理后的化学文献数据集进行信息提取,得到反应信息提取集合。相比于传统的常规工具包或成熟软件,本发明可适用于风格迥异的各类学术期刊,而传统的软件只能适用于专利文献或格式比较单一的某一类文献;因此本发明相比现有技术具有更好的普适性。本发明的针对性更强且在面对复杂问题时性能效果更加优良。本发明与传统上通过人工收集提取化学数据的方式相比,效率更高、成本更低且综合性能更加稳定。
-
公开(公告)号:CN117558355A
公开(公告)日:2024-02-13
申请号:CN202311496800.2
申请日:2023-11-10
IPC: G16C20/10 , G16C20/30 , G16C20/70 , G16B40/00 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/0895
Abstract: 本发明公开了一种基于对比学习的生物合成表征方法及模型,属于生物合成反应的表征领域,包括:构建包含酶、酶的EC编号以及生物合成反应的训练样本集;采用对比学习方法,基于训练样本集构建包含酶的表征模型和小分子表征模型的生物合成表征模型,训练过程中使化学反应底物和产物间的损失函数、酶和EC编号间的损失函数、小分子和酶相互作用的损失函数最小化,完成对生物合成表征模型的训练;将下游任务的分子输入训练好的生物合成表征模型进行表征,得到酶的功能表征。本发明基于对比学习方法,构建了包含酶的表征模型和小分子表征模型的生物合成表征模型,能够同时实现小分子和酶的表征,从而实现多种酶的多种功能的通用性预测。
-
-
-
-
-