-
公开(公告)号:CN119724348A
公开(公告)日:2025-03-28
申请号:CN202311763497.8
申请日:2023-12-20
Applicant: 华为云计算技术有限公司
IPC: G16B30/00 , G16B35/00 , G16B40/00 , G16B50/00 , G06N3/0455 , G06N3/0499 , G06N3/08
Abstract: 本申请提供了一种模型训练方法、生物序列类任务的处理方法及相关装置,该模型训练方法包括:获取第一数据集,然后基于第一数据集对第一神经网络进行训练,从而得到生物序列基模型。其中,第一数据集包括多种序列类型的生物序列。第一数据集中的生物序列具有对应的第一序列类型标记和第一序列元件标记,第一序列类型标记用于指示对应的生物序列所属的序列类型,第一序列元件标记用于指示对应的生物序列中的组成片段所属的片段类型。生物序列基模型用于构建执行多个生物序列类任务的序列任务模型。本申请的方案能够获得通用性较好的生物序列基模型,能够适应多种不同的生物序列类任务。
-
公开(公告)号:CN118629538A
公开(公告)日:2024-09-10
申请号:CN202310200273.X
申请日:2023-03-03
Applicant: 华为云计算技术有限公司
IPC: G16C20/50
Abstract: 本公开的实施例提供了用于药物设计的方法、装置、设备、介质和程序产品。用于药物设计的方法包括获取表示蛋白质三维结构的蛋白质数据和表示待与蛋白质三维结构结合的初始分子的初始分子数据。该方法还包括:基于蛋白质数据和初始分子数据,确定表示初始分子中的第一分子片段的第一分子片段数据。该方法还包括:基于第一分子片段数据和初始分子数据,生成表示目标分子的目标分子数据。通过本公开的实施例,针对蛋白质三维结构,通过在初始分子中自动确定的分子片段并基于所确定的分子片段来优化初始分子,可以有针对性地实现对药物分子的片段式人工智能优化,从而降低药物发现的时间和人力成本。
-
公开(公告)号:CN118467744A
公开(公告)日:2024-08-09
申请号:CN202310067484.0
申请日:2023-02-02
Applicant: 华为云计算技术有限公司
IPC: G06F16/36
Abstract: 本申请实施例提供了一种数据处理方法,可以应用于知识图谱构建等场景。该方法包括:获取文本数据;基于采样矩阵确定文本数据中的多个片段;确定多个片段的多个实体信息,每个实体信息包括第一实体的实体边界信息以及第一实体的类型;基于多个实体信息生成文本数据的多个第二实体。通过采样矩阵确定文本数据的多个片段,并预测出片段的实体信息,进而基于实体信息生成文本数据的第二实体。实体识别过程细化为片段的实体预测与第二实体的生成,相较于整个文本数据的实体生成,可以实现更细粒度的实体生成。
-
公开(公告)号:CN116933789A
公开(公告)日:2023-10-24
申请号:CN202210318687.8
申请日:2022-03-29
Applicant: 华为云计算技术有限公司
IPC: G06F40/295 , G06F16/36
Abstract: 本申请实施例公开了一种语言表征模型的训练方法以及训练装置,用于提升语言表征模型的模型精度。本申请实施例方法包括:获取第一语言数据,基于语言表征模型和第一语言数据进行多任务学习,得到目标损失函数,多任务学习包括掩码语言任务和关系分类任务,掩码语言任务用于根据语言表征模型生成的数据执行掩码语言任务,关系分类任务用于基于语言表征模型生成的数据执行关系分类任务。根据目标损失函数更新语言表征模型。
-
公开(公告)号:CN116205306A
公开(公告)日:2023-06-02
申请号:CN202111453147.2
申请日:2021-11-30
Applicant: 华为云计算技术有限公司
Abstract: 本申请实施例公开了一种数据处理方法以及数据处理装置,用于提升AI任务模型的预测准确率。本申请实施例方法包括:获取多种数据,多种数据中的各种数据具有不同的来源和不同的数据类型。对多种数据进行知识抽取,获得知识图谱,知识图谱包括多个知识实体以及多个知识实体之间的关联关系,多个知识实体包括不同的数据类型。利用与每个知识实体的数据类型对应的知识表征算法对每个知识实体进行知识表征,且对知识图谱中多个知识实体之间的关系进行权重的初始化,获得向量图,向量图用于训练人工智能AI任务模型。
-
-
公开(公告)号:CN117174185A
公开(公告)日:2023-12-05
申请号:CN202211019436.6
申请日:2022-08-24
Applicant: 华为云计算技术有限公司
IPC: G16C10/00 , G16C20/50 , G06N3/08 , G06N3/0464
Abstract: 本申请提供了人工智能领域一种分子优化方法以及装置,基于伊辛模型来构造目标函数,并使用量子退火算法来进行求解,从而可以高效准确地求解得到最优的分子结构。该方法包括:首先,获取第一数据集合和属性集合,该第一数据集合中包括多组数据,该多组数据可以用于表示多种分子结构,每组数据可以表示至少一种分子结构,属性集合中包括表示多种分子结构的属性的值,每组数据具有对应的至少一种分子属性,如分子的韧性、毒性或者溶解性等属性;根据第一数据集合以及属性集合构造目标函数;随后通过量子退火算法对目标函数进行求解,得到分子序列,该分子序列可以用于表示求解得到的分子结构。
-
公开(公告)号:CN116935975A
公开(公告)日:2023-10-24
申请号:CN202210334013.7
申请日:2022-03-31
Applicant: 华为云计算技术有限公司
Abstract: 本申请提供了一种分子生成方法及相关装置,分子生成方法包括:接收用户在终端输入的约束条件,约束条件用于指示分子的属性需要满足的条件,分子的属性包括分子的分子量、水溶性、脂溶性、生物活性、可合成性、与特定分子的对接结合性、与源分子的相似度、所包含的特定子结构、药代动力学和毒性中的任意一项或多项;根据约束条件生成第一分子集合,第一分子集合包括一个或多个分子;向终端返回第一分子集合中一个或多个分子的信息。根据本申请提供的分子生成方法生成分子,能够提高分子生成效率,节省时间成本及人力物力财力等成本。
-
公开(公告)号:CN116563572A
公开(公告)日:2023-08-08
申请号:CN202210095035.2
申请日:2022-01-26
Applicant: 华为云计算技术有限公司
IPC: G06V10/70 , G06V10/764 , G06V10/82 , G06T7/00 , G06T7/11 , G06N3/0464 , G06N3/042 , G06N3/0895 , G06N5/04 , G16H50/20
Abstract: 本申请实施例涉及一种推理模型训练方法,方法可以包括:根据已标注病理图片训练得到推理模型。然后,可以根据未标注病理图片、第一病理文本以及已标注病理图片,更新推理模型。其中,推理模型用于对输入的待检测病理图片进行推理,得到待检测病理图片对应的病理结果。第一病理文本为未标注病理图片相关联的病理文本。本申请通过结合未标注病理图片、第一病理文本和已标注病理图片对推理模型进行更新,使得模型融入了更多领域经验知识,从而大大提升了推理模型对病理图片的预测准确率。
-
公开(公告)号:CN119920352A
公开(公告)日:2025-05-02
申请号:CN202311437769.5
申请日:2023-10-31
Applicant: 华为云计算技术有限公司 , 中国科学院上海药物研究所
Abstract: 本申请公开了一种化合物安全性预测方法、装置及计算设备集群,该方法应用于云服务中心,云服务中心包括多个云应用实例,该方法包括:云应用实例根据多个化合物、多个靶点以及多个脱靶预测模型,确定每个化合物与每个靶点之间的第一概率;将第一概率输入药物不良反应ADR预测模型,得到每个化合物和每个ADR之间的第二概率;根据脱靶靶点的数量、第二概率以及每个ADR的危险性评分,确定多个化合物的安全性评分,预测化合物的安全性。上述过程通过将脱靶预测结果作为特征输入ADR预测中,实现脱靶预测和ADR预测的结合,从靶点层面揭示ADR的作用机制,并量化化合物安全性水平,在药物开发阶段化合物的安全性评估提供依据。
-
-
-
-
-
-
-
-
-