-
公开(公告)号:CN118248222A
公开(公告)日:2024-06-25
申请号:CN202410223199.8
申请日:2024-02-28
Applicant: 吉林大学
IPC: G16B40/00 , G16B40/30 , G06F18/15 , G06F18/211 , G06F18/2135 , G06F18/23213 , G06N3/0464 , G06N3/0455 , G06N3/044 , G06N3/042 , G06N3/088 , G06N3/048
Abstract: 本发明涉及一种计算机对空间转录组数据特征选择及聚类方法,隶属于科技部国家重点研发课题(2021YFF1201203),本课题重点研究生物医学知识图谱自动构建和更新技术体系,通过输入空间转录组数据,以变分自编码器作为基础模型结合K‑means聚类,可以有效的对空间转录组数据做聚类。这种方法可以很好的帮助我们理解基因在生物体内的空间分布,从而揭示其生物过程中的作用。
-
公开(公告)号:CN118212974A
公开(公告)日:2024-06-18
申请号:CN202410071603.4
申请日:2024-01-18
Applicant: 吉林大学
IPC: G16B15/30 , G16B40/00 , G16B50/10 , G06N5/022 , G06N3/0464 , G06N3/045 , G06F18/2415 , G06F18/25 , G06F18/15
Abstract: 一种基于多源特征交互的药物靶标相互作用预测方法属生物信息学和计算机融合技术领域,本发明包括:网络构建‑‑收集药物、靶标相关数据,构建药物靶标知识图谱;药物表示‑‑利用五种不同的特征提取方法获得药物的特征;蛋白质表示‑‑利用五种不同的特征提取方法获得蛋白质的特征;网络嵌入‑‑采用两种图表示学习算法,生成网络中药物和靶点的特征表示;特征交互和输出‑‑通过多头自注意力机制进行特征交互得到高维特征,并通过残差连接保留初始低维特征,经分类器获得潜在药物‑靶点相互作用的预测。本发明整合多源特征,能提高药物‑靶点相互作用预测的准确性,在药物发现和开发中具有应用价值。
-
公开(公告)号:CN117077781A
公开(公告)日:2023-11-17
申请号:CN202310844409.0
申请日:2023-07-11
Applicant: 吉林大学
IPC: G06N5/025 , G06N5/02 , G06F40/279
Abstract: 本发明涉及一种回调非线性计算知识表征体关系析取方法,涉及在生物医学领域,表征体关系表征是一个重要的工具,可以将大量的生物医学知识以一种结构化的方式进行表达和组织,从而帮助医生更好地理解和利用知识。表征体关系表征包含了丰富的知识信息和多样的数据类型,可以帮助医生进行生物医学知识的计算机化处理和分析。
-
公开(公告)号:CN116779039A
公开(公告)日:2023-09-19
申请号:CN202310202596.2
申请日:2023-03-06
Applicant: 吉林大学
Abstract: 本发明涉及一种计算机对包含针对标记序列分段生物信息的处理方法,本发明用自适应技术解决生物设备信息预测问题,在样本量较少的情况下能够提前进行重复的识别,对这些特征用方差选择法和互信息法进行处理,通过滑动事先约定的规则窗口法进行样本标记的构造,建立结合基本模型,进行源域和目标域信息的适配,以拉近源域和目标域之间的距离,得到更好的预测效果,添加了信息增强操作,对信息添加了高斯白噪声,有效地防止了模型过拟合。
-
公开(公告)号:CN114944198A
公开(公告)日:2022-08-26
申请号:CN202210561789.2
申请日:2022-05-23
Applicant: 吉林大学
Abstract: 本发明设计一种计算机处理采集设备数据的融合方法,先利用空间型相关性解释对空间转录组数据矩阵进行反卷积算法,利用单细胞信息点获得特异性基因,对单细胞信息点进行降维聚类之后,找到每个细胞信息簇中特异性表达的基因数据,对空间转录组数据矩阵进行反卷积操作,在获得了不同细胞类型的特异性基因数据之后,首先利用半监督主题模型对单细胞信息点进行训练,通过比较主题和细胞类型的相关性,来调整模型的参数;调完参数之后再将空间转录组数据矩阵放入到模型中训练,获得空间转录组数据矩阵中每个细胞信息捕获点S的主题分布情况,即细胞类型组成;然后根据细胞类型组成提高空间转录组数据矩阵图谱分辨率;本发明更有利于生物上的研究。
-
-
公开(公告)号:CN114944198B
公开(公告)日:2024-09-10
申请号:CN202210561789.2
申请日:2022-05-23
Applicant: 吉林大学
Abstract: 本发明设计一种计算机处理采集设备数据的融合方法,先利用空间型相关性解释对空间转录组数据矩阵进行反卷积算法,利用单细胞信息点获得特异性基因,对单细胞信息点进行降维聚类之后,找到每个细胞信息簇中特异性表达的基因数据,对空间转录组数据矩阵进行反卷积操作,在获得了不同细胞类型的特异性基因数据之后,首先利用半监督主题模型对单细胞信息点进行训练,通过比较主题和细胞类型的相关性,来调整模型的参数;调完参数之后再将空间转录组数据矩阵放入到模型中训练,获得空间转录组数据矩阵中每个细胞信息捕获点S的主题分布情况,即细胞类型组成;然后根据细胞类型组成提高空间转录组数据矩阵图谱分辨率;本发明更有利于生物上的研究。
-
公开(公告)号:CN118588159A
公开(公告)日:2024-09-03
申请号:CN202410734123.1
申请日:2024-06-07
Applicant: 吉林大学
IPC: G16B20/30 , G16B40/00 , G06F18/2415 , G06F18/23213 , G06N3/042
Abstract: 一种对空间转录组学数据进行空间域划分的方法属数据挖掘技术领域,本发明对基因表达数据集进行两种不同的预处理,使用空间位置信息构建邻接图,两者相乘可得到空间位置相关的基因表达,对其聚类,筛选其中高质量的结果作为伪标签,使用图神经网络完成伪标签半监督的空间域分类和自监督的基因重构训练。网络训练完成后,综合不同基因表达得到的空间域分类结果,然后得到空间域划分结果。通过解释训练好的空间域分类网络,可得到空间高可变基因。本发明主要解决当前空间域划分方法精细度不足,不够稳定和可解释性差的问题,能准确识别具有一定基因表达模式的空间区域,保留组织中复杂的精细结构,在不同平台的测序数据上表现稳定。
-
公开(公告)号:CN116756307A
公开(公告)日:2023-09-15
申请号:CN202310202595.8
申请日:2023-03-06
Applicant: 吉林大学
IPC: G06F16/35 , G06F16/33 , G06F18/2415 , G06F40/30 , G06N3/0464
Abstract: 本发明涉及一种使用连续词袋模型量子化数据分析方法,主要包含4个步骤,开发模式启动、分析筛选、关键字加缀、数据增强;本发明优势独特,在分析收集数据中选项语义相似度的过程的计算量低,且对于结果来说,解释性好,本发明中使用了基于深度学习的分类器,分类准确率高而且不会受到不平衡数据的影响,分类器的适用性强。
-
-
-
-
-
-
-
-
-