-
公开(公告)号:CN119541828A
公开(公告)日:2025-02-28
申请号:CN202411597421.7
申请日:2024-11-11
Applicant: 中国科学院计算技术研究所
IPC: G16H50/20 , G06F18/241 , G06F18/25 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/0985
Abstract: 本发明提出一种慢性肾脏疾病进展预测方法、装置,该方法包含:收集关于慢性肾脏疾病的多模态数据,将所述多模态数据输入至构建的预测模型中进行训练,若识别属于表格数据,通过所述表格特征提取器对该模态数据进行特征聚合并编码为多个一维特征向量,且将该多个一维特征向量整合为表格数据代表向量;若识别属于图像数据,通过所述图像特征提取器对该模态数据整图进行训练,整合得到图像代表向量;通过所述多模态融合分类器对所有所述表格数据代表向量与所有所述图像代表向量进行拼接融合后进行分类预测。该方法能够以极高的精度预测慢性肾脏疾病进展。
-
公开(公告)号:CN119446286A
公开(公告)日:2025-02-14
申请号:CN202411370937.8
申请日:2024-09-29
Applicant: 中国科学院计算技术研究所
IPC: G16B40/20 , G16B30/00 , G06F18/214 , G06F18/2431 , G06F18/213
Abstract: 本发明提供一种增强子启动子调控网络预测模型构建方法,包括:S1、获取原始数据集,原始数据集中包含多个生物样本的多个增强子‑启动子对数据,并将原始数据集划分为多个子集,其中,同一染色体对上的所有增强子启动子对划分到同一个子集;S2、子集进行预处理,每个子集均包含多个数据样本,每个数据样本为一个增强子启动子对,每个数据样本的特征向量为对应增强子启动子对的序列特征、该增强子启动子对之间的距离特征、该增强子启动子对对应的染色质开放性特征拼接形成的特征向量,每个数据样本的标签为对应增强子启动子对之间是否有相互作用;S3、基于预处理后的所有子集采用类别型特征梯度提升的方式,迭代构建多棵对称决策树组成预测模型。
-
公开(公告)号:CN115602326A
公开(公告)日:2023-01-13
申请号:CN202211292710.7
申请日:2022-10-21
Applicant: 中国科学院计算技术研究所(CN)
Abstract: 本发明提供了一种用于挖掘肿瘤标志物的方法,包括:S1、获取预定的多个分子通路所含有的所有基因在预设的实验组、对照组中分别发生变异的频率,实验组中的每个样本患有预定类别的肿瘤,对照组中的每个样本未患有所述预定类别的肿瘤或者患有所述预定类别的肿瘤但与实验组的样本的分型不同;S2、基于每个分子通路所含有的基因在实验组、对照组中分别发生变异的频率,确定在实验组和对照组中每个基因发生变异频率的差异指数;S3、针对每个分子通路,将该分子通路所含有的所有基因发生变异频率的差异指数求和,得到该分子通路的差异指数;S4、从预定的多个分子通路中,选择分子通路的差异指数大于预定检测阈值的分子通路作为肿瘤标志物。
-
公开(公告)号:CN109523520B
公开(公告)日:2020-12-18
申请号:CN201811250267.0
申请日:2018-10-25
Applicant: 北京大学第三医院 , 中国科学院计算技术研究所
Abstract: 本发明公开了一种基于深度学习的染色体自动计数方法,包括以下步骤:(1)图像收集和预处理步骤;(2)图像分类和回归步骤;(3)模型训练步骤;(4)测试计数步骤,其中,在步骤(2)中采用新的抽样策略,并对Faster R‑CNN模型损失函数进行了改进。本发明所需的数据来源于真实显微镜视野下的G显带染色体,所述方法无需复杂实验过程,成本低廉,耗时更短,能够自动准确完成目标染色体计数。本发明使用1000例标注的染色体图训练模型,随后用175例标注的染色体图做测试,统计显示175例共包含8023条染色体,测试的准确率为98.95%,召回率为98.67%。测试结果显示用机器计数后人工校正的方法完成一份报告的染色体计数所需时间短于目前的1/3。
-
公开(公告)号:CN111192631A
公开(公告)日:2020-05-22
申请号:CN202010000530.1
申请日:2020-01-02
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种构建用于预测蛋白质-RNA相互作用结合位点模型的方法和系统,与其对应的还包括使用该方法预测蛋白质-RNA相互作用结合位点的方法和系统。其使用RNA与蛋白质结合位点处及上下游的序列特征以及测定的RNA结构特征来训练深度学习模型,并使用所述模型对蛋白质-RNA相互作用结合位点进行预测。在所述特征的提取过程中分别使用了基于卷积神经网络构建的基序获取模块和基于循环神经网络构建的上下文语义获取模块。本发明中训练出的模型在判断准确度和计算时间以及应用平台的广泛性方面都相比于现有技术有着显著进步。
-
公开(公告)号:CN109523520A
公开(公告)日:2019-03-26
申请号:CN201811250267.0
申请日:2018-10-25
Applicant: 北京大学第三医院 , 中国科学院计算技术研究所
CPC classification number: G06T7/0012 , G06K9/0014 , G06K9/00147 , G06N3/0454 , G06T2207/10056 , G06T2207/20081 , G06T2207/30004 , G06T2207/30242
Abstract: 本发明公开了一种基于深度学习的染色体自动计数方法,包括以下步骤:(1)图像收集和预处理步骤;(2)图像分类和回归步骤;(3)模型训练步骤;(4)测试计数步骤,其中,在步骤(2)中采用新的抽样策略,并对Faster R-CNN模型损失函数进行了改进。本发明所需的数据来源于真实显微镜视野下的G显带染色体,所述方法无需复杂实验过程,成本低廉,耗时更短,能够自动准确完成目标染色体计数。本发明使用1000例标注的染色体图训练模型,随后用175例标注的染色体图做测试,统计显示175例共包含8023条染色体,测试的准确率为98.95%,召回率为98.67%。测试结果显示用机器计数后人工校正的方法完成一份报告的染色体计数所需时间短于目前的1/3。
-
-
-
-
-