基于结构网络模型的蛋白质功能位点预测方法

    公开(公告)号:CN108830043A

    公开(公告)日:2018-11-16

    申请号:CN201810643576.8

    申请日:2018-06-21

    Applicant: 苏州大学

    Abstract: 本发明涉及一种基于结构网络模型的蛋白质功能位点预测方法,包括:预测蛋白质结合位点;输入关于演化、物理化学性质、结构以及动态性这四个方面衡量蛋白质中每个残基的性质;基于蛋白质的三维结构对每个蛋白质构建其点加权的蛋白质结构网络(Node-weighted Protein Structure Network,NPSN);定义并计算点加权的蛋白质结构网络的参数;基于以上网络参数,利用随机森林模型预测蛋白质中的别构残基的概率。整合残基物理化学性质、序列信息、蛋白质结构特征、动态特征,节省时间,适用于大规模的、批量蛋白质功能位点预测,并提高预测的准确性。

    预测氨基酸变异对蛋白质结构稳定性影响的系统及其方法

    公开(公告)号:CN107358064A

    公开(公告)日:2017-11-17

    申请号:CN201710533801.8

    申请日:2017-07-03

    Applicant: 苏州大学

    CPC classification number: G16B40/00

    Abstract: 本发明公开了一种预测氨基酸变异对蛋白质结构稳定性影响的系统及其方法,该系统由氨基酸变异信息输入模块、氨基酸变异位点属性计算模块、蛋白质序列属性计算模块、预测稳定性变化模块、预测结果输出模块组成;该方法的步骤为录入并获取变异信息;提前约AAindex属性特征以及计算氨基酸微电物理化学属性特征;计算与氨基酸变异对应的蛋白质序列的保守性及其蛋白质属性;采用两层三分随机森林算法计算氨基酸变异对蛋白质稳定性的影响;储存并输出预测结果。本发明可以依据用户提供的氨基酸变异和对应的蛋白质序列,准确预测该氨基酸变异会导致所在蛋白质的结构稳定性升高、降低或不变,以及相应概率,并将结果存储并发送用户保存。

    一种早期胃癌检测的标志物识别方法及诊断模型构建方法

    公开(公告)号:CN119580829A

    公开(公告)日:2025-03-07

    申请号:CN202411689293.9

    申请日:2024-11-25

    Applicant: 苏州大学

    Abstract: 本发明涉及医学技术领域,具体指一种早期胃癌检测的标志物识别方法及诊断模型构建方法,包括:基于线性模型、经验贝叶斯方法及RRA算法,从数据集中筛选出多个稳健差异miRNA,并构建稳健差异候选标志物集合;采用WGCNA方法,构建共表达网络;筛选出共表达网络关键模块中GS、MM均大于其对应阈值的miRNA作为早期胃癌相关miRNA,并构建早期胃癌相关候选标志物集合;筛选出胃癌特异性调控网络中RNs评分、特征向量中心性值均超过其对应阈值的miRNA作为早期胃癌调控miRNA,并构建早期胃癌调控候选标志物集合;整合所有候选标志物集合,得到最终标志物集合。本发明识别的标志物有助于提高早期胃癌检测准确度。

    基于序列信息的蛋白质毒性预测方法和系统

    公开(公告)号:CN119418780A

    公开(公告)日:2025-02-11

    申请号:CN202510014140.2

    申请日:2025-01-06

    Applicant: 苏州大学

    Abstract: 本发明提供一种基于序列信息的蛋白质毒性预测方法和系统,方法包括从蛋白质数据库中获取多个蛋白质序列;对所有蛋白质序列进行特征计算,得到六大类蛋白质特征向量;将六大类特征向量按列拼接,得到第一特征向量;对第一特征向量进行降维筛选,得到目标维度的第二特征向量;利用第二特征向量训练基于图注意力的神经网络模型,并将训练好的神经网络模型作为蛋白质毒性预测模型;将新的蛋白质序列输入至蛋白质毒性预测模型,得到蛋白质毒性预测模型输出的毒性预测结果。本发明能够适应不同类型的蛋白质序列,通过学习到的通用序列模式对蛋白质毒性准确预测。

    一种基于序列预测蛋白质变性温度的系统及其方法

    公开(公告)号:CN110415762B

    公开(公告)日:2023-03-31

    申请号:CN201910719819.6

    申请日:2019-08-06

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于序列预测蛋白质变性温度的系统及其方法,该系统由蛋白质信息输入模块、蛋白质序列特征计算模块、蛋白质稳定性预测模块、预测结果输出模块和数据库组成。该预测方法主要为首先获取单一或批量蛋白质序列,并计算蛋白质的物理特征、电荷特征、结构特征、生化特征和属性特征,然后提取重要特征并计算蛋白质的变性温度,作为蛋白质稳定性的预测结果,最后保存预测结果并自动发送给用户。本发明的这种预测方式实用性强,且具有较高的预测准确率,特别是在蛋白质结构未知的情况下也能预测蛋白质变性温度的具体数值,而不是仅仅进行分类预测,泛化性强,对于蛋白质功能分析、辅助蛋白质工程和设计、药物设计等方面具有重大的意义。

    基于对比学习的剪接变异体致病性预测方法及系统

    公开(公告)号:CN119400239A

    公开(公告)日:2025-02-07

    申请号:CN202411990089.0

    申请日:2024-12-31

    Applicant: 苏州大学

    Abstract: 本发明涉及生物信息学技术领域,具体提供了一种基于对比学习的剪接变异体致病性预测方法及系统,仅使用剪切变异体变异前后的DNA序列信息,极大简化了模型的特征输入。经过DNA预训练模型获取序列信息的嵌入,再通过一个对比学习模块进行处理,对于变异后表现为致病性的变异体,对比学习模块将其处理为差异性更大的嵌入;对于变异后为良性的变异体,则是减小二者的区别,使分类器更容易捕捉到其中的细微区别,进而实现高效的致病性预测。本发明直接从序列中学习,减少了因特征选择不同而导致的模型偏差,避免生物特征计算中引入的额外误差,在盲测集上的性能表明模型可准确预测致病性变异,同时兼具平衡性、良好的泛化性和鲁棒性。

    一种基于实体对与最短依赖路径的关系抽取方法及装置

    公开(公告)号:CN118821779B

    公开(公告)日:2024-12-06

    申请号:CN202411304023.1

    申请日:2024-09-19

    Applicant: 苏州大学

    Abstract: 本发明涉及知识图谱技术领域,尤其是指一种基于实体对与最短依赖路径的关系抽取方法、装置及计算机可读存储介质,包括:构建关系抽取模型;将多个句子输入至嵌入层,得到每个句子的第一实体嵌入、第二实体嵌入和上下文表示;利用最短依赖路径处理模块生成最短依赖路径表示;获取每个句子的融合特征和句子语义信息;将多个句子的融合特征输入至图神经网络,得到每个句子的图拓扑信息;将每个句子的句子语义信息和图拓扑信息融合后输入至分类层,对句子进行分类。本发明将最短依赖路径与实体对图相结合,通过实体对图使得实体对之间互相学习实体信息和上下文信息,有效地利用了句子的上下文信息,显著提高了句子分类预测的准确性和可靠性。

    一种基于实体对与最短依赖路径的关系抽取方法及装置

    公开(公告)号:CN118821779A

    公开(公告)日:2024-10-22

    申请号:CN202411304023.1

    申请日:2024-09-19

    Applicant: 苏州大学

    Abstract: 本发明涉及知识图谱技术领域,尤其是指一种基于实体对与最短依赖路径的关系抽取方法、装置及计算机可读存储介质,包括:构建关系抽取模型;将多个句子输入至嵌入层,得到每个句子的第一实体嵌入、第二实体嵌入和上下文表示;利用最短依赖路径处理模块生成最短依赖路径表示;获取每个句子的融合特征和句子语义信息;将多个句子的融合特征输入至图神经网络,得到每个句子的图拓扑信息;将每个句子的句子语义信息和图拓扑信息融合后输入至分类层,对句子进行分类。本发明将最短依赖路径与实体对图相结合,通过实体对图使得实体对之间互相学习实体信息和上下文信息,有效地利用了句子的上下文信息,显著提高了句子分类预测的准确性和可靠性。

    一种胃癌组合标志物及标志物模型的建立方法

    公开(公告)号:CN116179691A

    公开(公告)日:2023-05-30

    申请号:CN202211088012.5

    申请日:2022-09-07

    Abstract: 本发明属于医学领域,尤其涉及一种胃癌组合标志物及标志物模型的建立方法。首先公开了一种胃癌组合标志物,包括胃癌预后组合标志物和/或预测胃癌进展的组合标志物;所述胃癌预后组合标志物包括miR‑200b‑3p、miR‑141‑3p、miR‑200c‑3p、miR‑200a‑3p、miR‑429、miR‑182‑5p、miR‑183‑5p中的至少两种;所述预测胃癌进展的组合标志物包括miR‑182‑5p,miR183‑5p,LDB3,NOVA1,NPTX1和NR3C1中的至少两种。本发明构建的模型可用于发现胃癌发展和预后的标志物,以便选择最佳治疗方案,显著提高患者生存率,为胃癌患者带来福音。

Patent Agency Ranking