-
公开(公告)号:CN114093427B
公开(公告)日:2023-06-09
申请号:CN202111342907.2
申请日:2021-11-12
Applicant: 杭州电子科技大学
IPC: G16B40/00 , G16B30/00 , G06N3/0442 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/08 , G06F18/2411 , G06N20/10
Abstract: 本发明公开了一种基于深度学习和机器学习领域的抗病毒肽预测方法,该方法的具体步骤如下:步骤1、获取序列数据,其中所获取的序列数据为待预测的肽序列;步骤2、对待预测的肽序列进行预处理;步骤3、将步骤2中得到的数据进行预测,并输出预测结果。其融合模型选择将神经网络和机器分类相结合,并采取两步走的预测方法,在交叉实验和独立测试集上的评估结果显示,FusedModel相比于其他模型,有着良好的分类结果,为抗病毒肽的识别提供了快速而又准确的方法,方便现代医疗的研究以及治疗。
-
公开(公告)号:CN112908418B
公开(公告)日:2024-06-28
申请号:CN202110143746.8
申请日:2021-02-02
Applicant: 杭州电子科技大学
IPC: G16B30/00 , G06F18/23213 , G16B40/00
Abstract: 本发明公开了一种基于字典学习的氨基酸序列特征提取方法。本发明首先给定一种AAindex,每条氨基酸肽序列数据都可用P=R1R2......RL表示,通过给定的AAindex,可将上述序列编码成PE=E1E2......EL。其中Ei为氨基酸残基的Ri的属性值;接着,对肽序列使用n‑gram模型分解成单词并分割成不同长度的片段,之后对同一长度的片段聚类生成字典;最后将样本基于欧氏距离的词频学习字典的特征构成样本特征矩阵。本发明能够有效的对氨基酸序列进行特征提取,实现降维,得到氨基酸中潜在的规律,特征选择的结果对样本类别判定具有重要意义,有效提高样本类别判定的准确率。
-
公开(公告)号:CN114093512A
公开(公告)日:2022-02-25
申请号:CN202111251516.X
申请日:2021-10-21
Applicant: 杭州电子科技大学
IPC: G16H50/30 , G16H30/40 , G06T7/00 , G06T7/11 , G06T7/136 , G06T7/60 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/771 , G16B25/10 , G16B40/00 , G06V10/762 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于多模态数据和深度学习模型的生存预测方法。传统的病理图像生存预测方法只能关注部分病理信息,不能完全反应患者的肿瘤形态,并且会忽视基因突变等因素对肿瘤产生的影响,以往方法大多不能有效的将图像和基因表达数据结合起来进行分析。本发明采用大津阈值算法生存区分组织区域的二值图并据此采样切片图像;根据由ImageNet数据集预训练的ResNet‑50网络提取相关特征,并使用K均值算法对特征进行聚类。将基因表达谱数据使用最小角回归特征选择算法和得到基因特征,将数据输入到深度学习生存预测模型中获得患者生存风险的概率。本发明是一种比较适用于病理图像和基因表达数据且同时保证高准确性的方法。
-
公开(公告)号:CN114093512B
公开(公告)日:2023-04-18
申请号:CN202111251516.X
申请日:2021-10-21
Applicant: 杭州电子科技大学
IPC: G16H50/30 , G16H30/40 , G06T7/00 , G06T7/11 , G06T7/136 , G06T7/60 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/771 , G16B25/10 , G16B40/00 , G06V10/762 , G06V10/82 , G06N3/048 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种基于多模态数据和深度学习模型的生存预测方法。传统的病理图像生存预测方法只能关注部分病理信息,不能完全反应患者的肿瘤形态,并且会忽视基因突变等因素对肿瘤产生的影响,以往方法大多不能有效的将图像和基因表达数据结合起来进行分析。本发明采用大津阈值算法生存区分组织区域的二值图并据此采样切片图像;根据由ImageNet数据集预训练的ResNet‑50网络提取相关特征,并使用K均值算法对特征进行聚类。将基因表达谱数据使用最小角回归特征选择算法和得到基因特征,将数据输入到深度学习生存预测模型中获得患者生存风险的概率。本发明是一种比较适用于病理图像和基因表达数据且同时保证高准确性的方法。
-
公开(公告)号:CN114093427A
公开(公告)日:2022-02-25
申请号:CN202111342907.2
申请日:2021-11-12
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于深度学习和机器学习领域的抗病毒肽预测方法,该方法的具体步骤如下:步骤1、获取序列数据,其中所获取的序列数据为待预测的肽序列;步骤2、对待预测的肽序列进行预处理;步骤3、将步骤2中得到的数据进行预测,并输出预测结果。其融合模型选择将神经网络和机器分类相结合,并采取两步走的预测方法,在交叉实验和独立测试集上的评估结果显示,FusedModel相比于其他模型,有着良好的分类结果,为抗病毒肽的识别提供了快速而又准确的方法,方便现代医疗的研究以及治疗。
-
公开(公告)号:CN112908418A
公开(公告)日:2021-06-04
申请号:CN202110143746.8
申请日:2021-02-02
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于字典学习的氨基酸序列特征提取方法。本发明首先给定一种AAindex,每条氨基酸肽序列数据都可用P=R1R2......RL表示,通过给定的AAindex,可将上述序列编码成PE=E1E2......EL。其中Ei为氨基酸残基的Ri的属性值;接着,对肽序列使用n‑gram模型分解成单词并分割成不同长度的片段,之后对同一长度的片段聚类生成字典;最后将样本基于欧氏距离的词频学习字典的特征构成样本特征矩阵。本发明能够有效的对氨基酸序列进行特征提取,实现降维,得到氨基酸中潜在的规律,特征选择的结果对样本类别判定具有重要意义,有效提高样本类别判定的准确率。
-
-
-
-
-