一种以基因组位置为索引的生物信息数据库跨库检索方法

    公开(公告)号:CN117095756A

    公开(公告)日:2023-11-21

    申请号:CN202310960615.8

    申请日:2023-08-01

    Abstract: 本发明为一种以基因组位置为索引的生物信息数据库跨库检索方法,包括以下步骤:创建跨库生物信息检索表;对多个现有生物信息数据库的条目进行遍历,获取第一基因数据;对所述第一基因数据按照基因组位置进行统一表述,得到统一表述索引;将所述统一表述索引与所述第一基因数据进行关联,得到第二基因数据;将所述第二基因数据存储到所述跨库生物信息检索表;根据待检索基因组位置在所述跨库生物信息检索表进行关联检索,得到第一检索结果;对所述第一检索结果进行区间运算,得到第二检索结果;根据所述第二检索结果在对应的所述现有生物信息数据库检索,得到待检索基因组位置关联的生物信息数据。

    用于构建用于预测蛋白质-RNA相互作用结合位点模型的方法和系统

    公开(公告)号:CN111192631B

    公开(公告)日:2023-07-21

    申请号:CN202010000530.1

    申请日:2020-01-02

    Inventor: 吴杨 杨瑞 赵屹

    Abstract: 本发明提供了一种构建用于预测蛋白质‑RNA相互作用结合位点模型的方法和系统,与其对应的还包括使用该方法预测蛋白质‑RNA相互作用结合位点的方法和系统。其使用RNA与蛋白质结合位点处及上下游的序列特征以及测定的RNA结构特征来训练深度学习模型,并使用所述模型对蛋白质‑RNA相互作用结合位点进行预测。在所述特征的提取过程中分别使用了基于卷积神经网络构建的基序获取模块和基于循环神经网络构建的上下文语义获取模块。本发明中训练出的模型在判断准确度和计算时间以及应用平台的广泛性方面都相比于现有技术有着显著进步。

    一种区分蛋白编码基因和非编码基因的方法及系统

    公开(公告)号:CN103218543B

    公开(公告)日:2016-04-13

    申请号:CN201310102224.9

    申请日:2013-03-27

    Inventor: 赵屹 孙亮 罗海涛

    Abstract: 本发明提供一种区分蛋白编码基因和非编码基因的方法及系统,其能够在序列水平上区分蛋白编码基因和非编码基因的特征,该特征不依赖于物种已知的数据,不需要保守性信息,并且对长非编码RNA有很好的判断效果,除了在准确性上具有强大的优势外,自身操作简单,不需要过多的文件依赖,处理时间明显优于已知的方法。

    用于预测对新型药物扰动的转录响应的方法及虚拟筛选方法和系统

    公开(公告)号:CN119763720A

    公开(公告)日:2025-04-04

    申请号:CN202411330327.5

    申请日:2024-09-24

    Abstract: 本发明提供一种用于预测对新型药物扰动的转录响应的方法、基于该预测方法的虚拟筛选的方法以及基于以上方法的虚拟筛选系统。其中,预测模型包括扰动适配器、扰动编码器和扰动解码器。扰动适配器,用于将输入的一种或多种新型药物的化学结构和其剂量信息编码到扰动嵌入中;扰动编码器,用于将新型药物的扰动对输入的未扰动转录谱的影响映射到可解释的潜在空间,得到未扰动状态的潜在表示;以及扰动解码器,用于基于潜在表示和扰动嵌入预测新型药物扰动的转录响应的分布。根据新型药物的预测转录响应进行虚拟筛选,计算候选化合物对疾病敏感药物的富集分数,根据富集分数进型化合物推荐。本发明的预测模型的灵活性和扩展性能够无需先验知识或注释。

    一种区分蛋白编码基因和非编码基因的方法及系统

    公开(公告)号:CN103218543A

    公开(公告)日:2013-07-24

    申请号:CN201310102224.9

    申请日:2013-03-27

    Inventor: 赵屹 孙亮 罗海涛

    Abstract: 本发明提供一种区分蛋白编码基因和非编码基因的方法及系统,其能够在序列水平上区分蛋白编码基因和非编码基因的特征,该特征不依赖于物种已知的数据,不需要保守性信息,并且对长非编码RNA有很好的判断效果,除了在准确性上具有强大的优势外,自身操作简单,不需要过多的文件依赖,处理时间明显优于已知的方法。

Patent Agency Ranking