-
公开(公告)号:CN112802555B
公开(公告)日:2022-04-19
申请号:CN202110147526.2
申请日:2021-02-03
Applicant: 南开大学
Abstract: 本发明提出一种基于多变量AUC的特征选择方法,从癌症的差异表达数据中选择最互补的基因子集,实现全局分类性能最大化。本发明首先基于特征的可能误分类集提出一种AUC计算的新角度;然后对于一个特征集,确定其共同可能误分类集并计算每个特征组合后的新AUC;一个特征的新AUC与原始AUC的差值展示了组合后特征集中的其他特征对该特征分类能力的互补作用。最后基于特征组合后的新AUC计算mvAUC,并增量式的选择使当前mvAUC最大化的候选特征加入被选特征子集。本发明方法具有可以直接评估被选特征子集的全局类辨别能力的优点,不需要成对地计算候选特征和每个被选特征之间的冗余信息。
-
公开(公告)号:CN112863603A
公开(公告)日:2021-05-28
申请号:CN202110271336.1
申请日:2021-03-12
Applicant: 南开大学
IPC: G16B30/10
Abstract: 本公开提供了一种细菌全基因组测序数据的自动化分析方法,包括:获取细菌基因组测序数据,判断测序数据类型;根据测序数据的类型分别进行相应预处理;根据用户选择的分析类型及预设的工具软件和软件参数,对预处理后的测序数据进行重测序分析和从头测序分析;实现细菌全基因组的鉴定和注释。所述方案提供了一种用户友好的自动化分析方法,对于没有专业生物信息学知识的研究人员和临床医生,自动化了生物信息学分析步骤,包括测序质量控制、重测序和从头组装、相似细菌参考基因组鉴定、细菌基因组注释,同时,能够针对不同平台产生的短读长和长读长测序数据进行定制的生物信息学分析,获得准确的分析结果。
-
公开(公告)号:CN114944197B
公开(公告)日:2024-06-25
申请号:CN202210540274.4
申请日:2022-05-18
Applicant: 南开大学
Abstract: 本申请提供一种基于测序数据的自动化血清型分析鉴定方法及系统,涉及基因测序数据分析技术领域,该方法包括:获取微生物基因组测序数据;将微生物基因组测序数据与关键等位基因数据库中的各关键等位基因进行比对,记录相似度大于预设阈值的关键等位基因和相应的比对评分;根据关键等位基因和相应的比对评分,确定微生物基因组测序数据所属的生物体;使用生物体的关键等位基因,确定序列型数据库中的序列型;使用序列型搜索血清型数据库,根据序列型和血清型之间的映射关系确定微生物基因组测序数据的血清型,以实现生物信息学分析鉴定的自动化,同时,能够针对不同平台产生的短读长和长读长测序数据进行定制的生物信息学分析,得到准确的分析结果。
-
公开(公告)号:CN118136095A
公开(公告)日:2024-06-04
申请号:CN202410274406.2
申请日:2024-03-11
Applicant: 南开大学
IPC: G16B15/00 , G06V10/80 , G06V10/774 , G16H70/60 , G16H30/00
Abstract: 本发明公开的基于表型引导的乳腺癌HER2分子状态预测方法及系统,包括:获取乳腺癌病理图像和乳腺癌HER2分子状态的形态表型特征;提取乳腺癌病理图像的实例特征;以乳腺癌病理图像的实例特征为键,以乳腺癌HER2分子状态的形态表型特征为查询条件,对乳腺癌病理图像的实例特征和乳腺癌HER2分子状态的形态表型特征进行交叉注意力特征融合,获得乳腺癌病理图像的切片层面表示;根据乳腺癌病理图像的切片层面表示,确定乳腺癌HER2分子状态预测结果,实现了对乳腺癌HER2分子状态的准确预测。
-
公开(公告)号:CN114974421B
公开(公告)日:2024-04-30
申请号:CN202210552055.8
申请日:2022-05-20
Applicant: 南开大学
IPC: G16B30/00 , G16B40/00 , G06F17/16 , G06F18/2135 , G06N3/045 , G06N3/0499 , G06N3/042 , G06N3/08
Abstract: 本发明提出了一种基于扩散‑降噪的单细胞转录组测序数据补插方法及系统,包括:获取单细胞转录组测序数据矩阵并进行预处理;对于预处理后的单细胞转录组测序数据矩阵中基因基于概率分布确定补插位点,对补插位点进行扩散操作,完成初步补插;对完成初步补插的单细胞转录组测序数据矩阵基于主成分分析进行白化;对原始获取的单细胞转录组测序数据矩阵进行加权处理,获得细胞间权重图;基于主成分分析白化后的单细胞转录组测序数据矩阵和细胞间权重图通过训练好的神经网路模型输出原始单细胞转录组测序数据。通过扩散‑降噪两阶段的补插处理,能够提高后续对不同细胞的识别的准确性。
-
公开(公告)号:CN114944190B
公开(公告)日:2024-04-19
申请号:CN202210512716.4
申请日:2022-05-12
Applicant: 南开大学
Abstract: 本发明公开了基于Hi‑C测序数据的TAD识别方法及系统;其中,所述方法包括:获取单条染色体的Hi‑C测序数据;对单条染色体的Hi‑C测序数据进行分段,生成若干个染色体片段;对每个染色体片段进行TAD结构识别;根据识别的TAD结构,识别假阳性结果。充分利用了整条染色体Hi‑C测序数据,提高了精度;同时引入随机重启游走算法和惩罚操作,通过惩罚系数有效的限制了基因变异带来的影响。
-
公开(公告)号:CN116386725A
公开(公告)日:2023-07-04
申请号:CN202310279457.X
申请日:2023-03-21
Applicant: 南开大学
Abstract: 本发明属于计算机技术领域,提供了一种联合病理组学特征的肿瘤差异基因表达谱预测方法及系统。模型训练方法包括,根据数据病理切片数据,得到数字病理切片的特定肿瘤区域的细胞核特征谱;根据转录组学数据,得到队列基因表达矩阵;根据队列基因表达矩阵和患者临床信息,确定癌症组织和正常组织样本以及癌症样本的临床诊断分期,并进行基因差异表达分析,得到特定肿瘤的差异基因表达谱和特定肿瘤分期的差异基因表达谱;以数字病理切片的特定肿瘤区域的细胞核特征谱为输入,以该特定肿瘤的差异基因表达谱和该特定肿瘤分期的差异基因表达谱为输出,训练生成式模型。本发明极大降低了样本测序成本,提高后续诊断预后效率。
-
公开(公告)号:CN116364180A
公开(公告)日:2023-06-30
申请号:CN202310339311.X
申请日:2023-03-30
Applicant: 南开大学
IPC: G16B20/30 , G16B40/00 , G06F18/231
Abstract: 本发明涉及空间转录组测序数据分析技术领域,提供了一种基于空间转录组的细胞类型无偏定位方法及系统,包括:通过空间聚类方法,将空间转录组数据中的采样点划分为若干个类别;通过解卷积法,得到每个采样点的细胞类型比例,并将某个细胞类型在某个采样点中的比例,作为该细胞类型在该采样点处的富集分数;基于富集分数,筛选出具有空间异质性的细胞类型;对于每个具有空间异质性的细胞类型,基于富集分数筛选出具有空间异质性的采样点,得到一个空间异质性点集,并将所述空间异质性点集与所有组织区域进行匹配,得到最佳匹配组织区域。使得空间转录组中大部分的细胞类型能够找到其空间聚集模式,发现空间中的细胞类型共定位。
-
公开(公告)号:CN115798581A
公开(公告)日:2023-03-14
申请号:CN202211200712.9
申请日:2022-09-29
Applicant: 南开大学
IPC: G16B20/30 , G16B40/20 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明属于生物酶工程领域,提供了一种基于深度学习的酶改造的理性设计方法,包括构建蛋白质晶体结构数据集;基于蛋白质晶体结构数据集添加以氨基酸残基为中心的原子微环境,进行蛋白质晶体结构数据集重构;根据重构后的蛋白质晶体结构数据集,利用预先训练好的氨基酸残基预测模型对重构后的蛋白质晶体结构数据集进行氨基酸残基预测;根据预测的氨基酸残基概率与实际的天然酶的的氨基酸概率的差异程度,确定酶功能优化的潜在位点。本发明以蛋白质晶体结构数据作为基本数据集,充分利用里蛋白质的理化性质,基于人工智能对酶的进行理性设计与改造,避免了人工筛选带来的不便。
-
公开(公告)号:CN115273988A
公开(公告)日:2022-11-01
申请号:CN202210939726.6
申请日:2022-08-05
Applicant: 南开大学
Abstract: 本发明提出了一种交互式基因组浏览分析及可视化方法及系统,自动化生物信息学分析步骤,构建数据库构建及比对测序数据,交互式基因组比较和浏览可视化,能够针对用户输入的测序数据,提供了一种新的数据库用于基因组测序数据检索和比对,并且将多个方面的分析功能联系起来,进行定制的生物信息学分析,获得准确的分析结果。
-
-
-
-
-
-
-
-
-