模型训练方法、生物序列类任务的处理方法及相关装置

    公开(公告)号:CN119724348A

    公开(公告)日:2025-03-28

    申请号:CN202311763497.8

    申请日:2023-12-20

    Abstract: 本申请提供了一种模型训练方法、生物序列类任务的处理方法及相关装置,该模型训练方法包括:获取第一数据集,然后基于第一数据集对第一神经网络进行训练,从而得到生物序列基模型。其中,第一数据集包括多种序列类型的生物序列。第一数据集中的生物序列具有对应的第一序列类型标记和第一序列元件标记,第一序列类型标记用于指示对应的生物序列所属的序列类型,第一序列元件标记用于指示对应的生物序列中的组成片段所属的片段类型。生物序列基模型用于构建执行多个生物序列类任务的序列任务模型。本申请的方案能够获得通用性较好的生物序列基模型,能够适应多种不同的生物序列类任务。

    用于药物设计的方法、装置、设备、介质和程序产品

    公开(公告)号:CN118629538A

    公开(公告)日:2024-09-10

    申请号:CN202310200273.X

    申请日:2023-03-03

    Abstract: 本公开的实施例提供了用于药物设计的方法、装置、设备、介质和程序产品。用于药物设计的方法包括获取表示蛋白质三维结构的蛋白质数据和表示待与蛋白质三维结构结合的初始分子的初始分子数据。该方法还包括:基于蛋白质数据和初始分子数据,确定表示初始分子中的第一分子片段的第一分子片段数据。该方法还包括:基于第一分子片段数据和初始分子数据,生成表示目标分子的目标分子数据。通过本公开的实施例,针对蛋白质三维结构,通过在初始分子中自动确定的分子片段并基于所确定的分子片段来优化初始分子,可以有针对性地实现对药物分子的片段式人工智能优化,从而降低药物发现的时间和人力成本。

    一种数据处理方法及相关设备
    3.
    发明公开

    公开(公告)号:CN118467744A

    公开(公告)日:2024-08-09

    申请号:CN202310067484.0

    申请日:2023-02-02

    Abstract: 本申请实施例提供了一种数据处理方法,可以应用于知识图谱构建等场景。该方法包括:获取文本数据;基于采样矩阵确定文本数据中的多个片段;确定多个片段的多个实体信息,每个实体信息包括第一实体的实体边界信息以及第一实体的类型;基于多个实体信息生成文本数据的多个第二实体。通过采样矩阵确定文本数据的多个片段,并预测出片段的实体信息,进而基于实体信息生成文本数据的第二实体。实体识别过程细化为片段的实体预测与第二实体的生成,相较于整个文本数据的实体生成,可以实现更细粒度的实体生成。

    一种语言表征模型的训练方法以及训练装置

    公开(公告)号:CN116933789A

    公开(公告)日:2023-10-24

    申请号:CN202210318687.8

    申请日:2022-03-29

    Abstract: 本申请实施例公开了一种语言表征模型的训练方法以及训练装置,用于提升语言表征模型的模型精度。本申请实施例方法包括:获取第一语言数据,基于语言表征模型和第一语言数据进行多任务学习,得到目标损失函数,多任务学习包括掩码语言任务和关系分类任务,掩码语言任务用于根据语言表征模型生成的数据执行掩码语言任务,关系分类任务用于基于语言表征模型生成的数据执行关系分类任务。根据目标损失函数更新语言表征模型。

    一种数据处理方法及数据处理装置

    公开(公告)号:CN116205306A

    公开(公告)日:2023-06-02

    申请号:CN202111453147.2

    申请日:2021-11-30

    Abstract: 本申请实施例公开了一种数据处理方法以及数据处理装置,用于提升AI任务模型的预测准确率。本申请实施例方法包括:获取多种数据,多种数据中的各种数据具有不同的来源和不同的数据类型。对多种数据进行知识抽取,获得知识图谱,知识图谱包括多个知识实体以及多个知识实体之间的关联关系,多个知识实体包括不同的数据类型。利用与每个知识实体的数据类型对应的知识表征算法对每个知识实体进行知识表征,且对知识图谱中多个知识实体之间的关系进行权重的初始化,获得向量图,向量图用于训练人工智能AI任务模型。

    一种分子优化方法以及装置
    7.
    发明公开

    公开(公告)号:CN117174185A

    公开(公告)日:2023-12-05

    申请号:CN202211019436.6

    申请日:2022-08-24

    Abstract: 本申请提供了人工智能领域一种分子优化方法以及装置,基于伊辛模型来构造目标函数,并使用量子退火算法来进行求解,从而可以高效准确地求解得到最优的分子结构。该方法包括:首先,获取第一数据集合和属性集合,该第一数据集合中包括多组数据,该多组数据可以用于表示多种分子结构,每组数据可以表示至少一种分子结构,属性集合中包括表示多种分子结构的属性的值,每组数据具有对应的至少一种分子属性,如分子的韧性、毒性或者溶解性等属性;根据第一数据集合以及属性集合构造目标函数;随后通过量子退火算法对目标函数进行求解,得到分子序列,该分子序列可以用于表示求解得到的分子结构。

    一种分子生成方法及相关装置
    8.
    发明公开

    公开(公告)号:CN116935975A

    公开(公告)日:2023-10-24

    申请号:CN202210334013.7

    申请日:2022-03-31

    Abstract: 本申请提供了一种分子生成方法及相关装置,分子生成方法包括:接收用户在终端输入的约束条件,约束条件用于指示分子的属性需要满足的条件,分子的属性包括分子的分子量、水溶性、脂溶性、生物活性、可合成性、与特定分子的对接结合性、与源分子的相似度、所包含的特定子结构、药代动力学和毒性中的任意一项或多项;根据约束条件生成第一分子集合,第一分子集合包括一个或多个分子;向终端返回第一分子集合中一个或多个分子的信息。根据本申请提供的分子生成方法生成分子,能够提高分子生成效率,节省时间成本及人力物力财力等成本。

Patent Agency Ranking