-
公开(公告)号:CN114944194B
公开(公告)日:2024-09-20
申请号:CN202210552099.0
申请日:2022-05-20
Applicant: 南开大学
Abstract: 本发明公开了一种推断空间转录组内细胞亚群表达模式的方法及系统,涉及生物信息学空间转录组测序数据分析技术领域。本发明包括对scRNA‑seq数据集进行质量控制和预处理,得到细胞亚群表达矩阵;对细胞亚群表达矩阵进行标准化和归一化;构建变分神经网络,以学习scRNA‑seq数据集中每个细胞亚群的隐变量分布;在训练好的隐变量分布中进行采样,生成细胞亚群的表达模式;基于所述的细胞亚群的表达模式,对空间转录组组织切片中所有空间域的表达模式进行解卷积,得到细胞亚群在空间域中分布的最大后验估计。本发明使空间转录组中解卷积法所需单细胞参考数据在降低维度的同时,保留大量有关信息,提高解卷积方法的运行速度和准确性,使细胞在组织切片内的分布更加精确。
-
公开(公告)号:CN118098342A
公开(公告)日:2024-05-28
申请号:CN202410249959.2
申请日:2024-03-05
Applicant: 南开大学
IPC: G16B15/30
Abstract: 本发明涉及合成生物学基因编辑技术领域,提供了一种CRISPR脱靶效应预测方法与系统。该方法包括,获取中靶脱靶序列对、中靶序列和脱靶序列;对中靶脱靶序列对、中靶序列和脱靶序列均进行词嵌入编码和位置编码处理,得到中靶脱靶序列对特征、中靶序列特征和脱靶序列特征;将中靶脱靶序列对特征、中靶序列特征和脱靶序列特征分别输入到三个网络分支中进行特征提取,得到第一特征、第二特征和第三特征;将第一特征、第二特征和第三特征进行融合,经全连接层,得到预测值。
-
公开(公告)号:CN116364188A
公开(公告)日:2023-06-30
申请号:CN202310330384.2
申请日:2023-03-30
Applicant: 南开大学
Abstract: 本发明涉及生物信息学技术领域,公开了一种肿瘤微环境中解耦耗竭性T细胞的系统,包括:对单细胞数据和空间转录组数据分别进行预处理;通过对预处理后的单细胞数据进行两次聚类分群和标记基因的计算,提取出肿瘤浸润性T细胞数据、耗竭性T细胞数据;对预处理后的肿瘤组织空间转录组数据进行聚类分群,得到若干个空间域;利用解卷积方法,在若干个空间域中识别出肿瘤浸润性T细胞的空间域,并在肿瘤浸润性T细胞的空间域中识别出耗竭性T细胞的空间域,并得到耗竭性T细胞在肿瘤浸润性T细胞中所占的比例。能够定位耗竭性T细胞在肿瘤微环境中的空间定位,从而进一步分析在不同肿瘤微环境下的结构与功能。
-
公开(公告)号:CN114974421A
公开(公告)日:2022-08-30
申请号:CN202210552055.8
申请日:2022-05-20
Applicant: 南开大学
Abstract: 本发明提出了一种基于扩散‑降噪的单细胞转录组测序数据补插方法及系统,包括:获取单细胞转录组测序数据矩阵并进行预处理;对于预处理后的单细胞转录组测序数据矩阵中基因基于概率分布确定补插位点,对补插位点进行扩散操作,完成初步补插;对完成初步补插的单细胞转录组测序数据矩阵基于主成分分析进行白化;对原始获取的单细胞转录组测序数据矩阵进行加权处理,获得细胞间权重图;基于主成分分析白化后的单细胞转录组测序数据矩阵和细胞间权重图通过训练好的神经网路模型输出原始单细胞转录组测序数据。通过扩散‑降噪两阶段的补插处理,能够提高后续对不同细胞的识别的准确性。
-
公开(公告)号:CN114944190A
公开(公告)日:2022-08-26
申请号:CN202210512716.4
申请日:2022-05-12
Applicant: 南开大学
Abstract: 本发明公开了基于Hi‑C测序数据的TAD识别方法及系统;其中,所述方法包括:获取单条染色体的Hi‑C测序数据;对单条染色体的Hi‑C测序数据进行分段,生成若干个染色体片段;对每个染色体片段进行TAD结构识别;根据识别的TAD结构,识别假阳性结果。充分利用了整条染色体Hi‑C测序数据,提高了精度;同时引入随机重启游走算法和惩罚操作,通过惩罚系数有效的限制了基因变异带来的影响。
-
公开(公告)号:CN113205856B
公开(公告)日:2022-07-12
申请号:CN202110693173.6
申请日:2021-06-22
Applicant: 南开大学
Abstract: 本公开提供了一种微生物宏基因组分箱方法及系统,包括:获取待分箱的微生物宏基因组序列;对所述宏基因组序列中每条序列进行特征提取,将提取的特征输入VAE‑GAN神经网络中进行训练,通过训练将提取的特征编码到VAE隐含向量中;基于所述VAE隐含向量中的均值变量,对所述宏基因组序列进行聚类,实现宏基因组的分箱;相对于现有方法,本公开所述方案采用了多种特征融合的方式,对宏基因组的序列特征进行深度挖掘,实现了对宏基因组序列的精确描述,同时,为了提高算法的处理效率,利用VAE‑GAN神经网络对所提取的特征进行特征降维,所述降维方法在降低特征维度的同时,充分保留了序列特征中的必要成分,良好的平衡了分箱精度与分箱时间的关系。
-
公开(公告)号:CN113257348A
公开(公告)日:2021-08-13
申请号:CN202110578344.0
申请日:2021-05-26
Applicant: 南开大学
Abstract: 本公开提供了一种宏转录组测序数据处理方法及系统,获取宏转录组测序数据;对获取的测序数据进行过滤;对过滤后的测序数据进行组装;根据组装后的测序数据和预设基于原核生物的基因结构特征的概率预测模型,得到测序数据中原核生物的基因预测结果;对得到的测序数据基因结构预测结果添加功能注释;根据基因预测结果的基因定量结果,对添加功能注释后的注释结果进行定量处理。本公开通过对测序数据的过滤、组装、基因预测和注释,实现了宏转录组测序数据更准确和快速的处理,实现了宏转录组基因的更精准和高效注释,提高了宏转录组测序数据的后续处理效率。
-
-
-
-
-
-