一种基于核低秩一致性的多视图子空间聚类方法

    公开(公告)号:CN119179913A

    公开(公告)日:2024-12-24

    申请号:CN202411244954.7

    申请日:2024-09-06

    Inventor: 张伟 余越

    Abstract: 本发明提供了一种基于核低秩一致性的多视图子空间聚类方法。该方法利用核函数将非线性数据映射到高维线性特征空间来挖掘数据中的非线性特征,同时采用低秩表征理论(Low rankrepresentation,LRR)获得低秩表征矩阵来捕捉线性空间数据的全局特征。进一步通过矩阵三因子分解理论将低秩表征稀疏矩阵分解为三个矩阵来实现不同视图之间的一致性。为了有效减少噪声的影响,采用Schatten‑p范数来约束不同视图下数据的共同表征矩阵。基于所建立的优化模型,采用交替方向乘子法(ADMM)来优化求解得到每个视图下的表征矩阵,然后通过对融合的表征矩阵进行角度校正得到样本间相似性矩阵,最后采用谱聚类方法对相似性矩阵进行聚类,从而实现对样本的聚类。大量的仿真实验结果表明,该方法可以显著提高对多视图数据的聚类效果,为多视图数据分析提供新的有效方法。

    一种基于单细胞RNA测序数据识别细胞类型的方法

    公开(公告)号:CN110797089B

    公开(公告)日:2023-05-16

    申请号:CN201911042318.5

    申请日:2019-10-30

    Abstract: 本发明提供了一种基于单细胞RNA测序数据识别细胞类型的方法。该方法有效地将高维矩阵低秩表示(Low Rank Representation)模型和图正则化理论结合起来,同时考虑数据的全局结构和局部结构特征来构建优化模型,通过采用交替方向乘子法(ADMM)来求解模型得到可靠的细胞与细胞间相似性矩阵,然后采用谱聚类方法对相似性矩阵进行聚类,从而实现对单细胞进行聚类,识别细胞类型。该方法可以显著提高单细胞RNA测序数据的聚类效果。

    一种基于低秩表征和改进谱聚类的单细胞RNA测序数据聚类方法

    公开(公告)号:CN115223659A

    公开(公告)日:2022-10-21

    申请号:CN202210934654.6

    申请日:2022-08-04

    Abstract: 本申请涉及一种基于低秩表征和改进谱聚类的单细胞RNA测序数据聚类方法,它包括如下步骤:基于单细胞RNA测序数据矩阵,建立联合低秩表示和自适应图正则化的数学模型;采用交替方向乘子法,构建增广拉格朗日函数,对每个变量进行单独优化,得到细胞与细胞间相似性矩阵S;采用谱聚类方法对相似性矩阵S进行聚类,得到对单细胞的分类。本发明可有效的将低秩表征来刻画数据全局结构,结合谱聚类模型将数据非线性关联特征自适应的结合起来建立优化模型,并且实现对单细胞的细胞类型分类;实验数值实验结果表明,本发明可以对单细胞RNA测序数据进行有效聚类。

    基于非负矩阵分解框架的预测蛋白质相互作用关系的方法

    公开(公告)号:CN115116551A

    公开(公告)日:2022-09-27

    申请号:CN202210743745.1

    申请日:2022-06-27

    Abstract: 本发明公开了一种基于非负矩阵分解框架的预测蛋白质相互作用关系的计算方法。该方法有效融合蛋白质相互作用数据的拓扑结构特征以及蛋白质的本体语义相似度信息;将这两种信息融入非负矩阵分解方法框架中,通过迭代求解非负矩阵分解的结果,得到蛋白质之间连接关系相似度矩阵;最后通过亚细胞定位信息矩阵进行过滤,得到未知连接关系的蛋白质之间相似度值,相似度越大,意味着这两个蛋白质之间存在相互作用的可能性越大。经测试验证,本发明提出的方法可以显著提高预测未知蛋白质相互作用关系的精度和效率。

    一种融合多数据特征预测关键蛋白质的计算方法

    公开(公告)号:CN109166604A

    公开(公告)日:2019-01-08

    申请号:CN201810958860.4

    申请日:2018-08-22

    Inventor: 张伟 徐佳

    Abstract: 本发明公开了一种融合多数据源预测关键蛋白质的计算方法。该方法通过分析关键蛋白质所体现的聚集性、共表达性、功能相似性、位置一致性的特征,有效融合蛋白质相互作用网络的边聚类系数、基因表达值的皮尔逊相关系数、基因本体术语的语义相似性指数以及蛋白质亚细胞定位统计特征。本发明方法简单易用,输入蛋白质相互作用关系数据、基因表达谱数据、基因本体术语信息数据以及蛋白质亚细胞定位数据信息这四种数据,经测试验证,和已有方法相比本发明提出的方法可以显著提高蛋白质相互作用网络中关键蛋白的预测精度和效率。

    一种识别蛋白质相互作用网络中关键蛋白质的方法

    公开(公告)号:CN105279397B

    公开(公告)日:2017-12-19

    申请号:CN201510701754.4

    申请日:2015-10-26

    Abstract: 本发明公开了一种识别蛋白质相互作用网络中关键蛋白质的方法,根据蛋白质相互作用数据,构建无向图G,计算图的边聚类系数,本发明与现有的技术相比,在考虑蛋白质相互作用网络拓扑结构特性的基础上,结合基因表达谱数据和基因功能注释信息数据,整合三组数据来预测关键蛋白,能有效的减少单个数据源数据噪声对预测准确性的影响,通过计算蛋白质相互作用网络的边聚类系数、基因表达值的皮尔逊相关系数以及基因功能相似性指数这三类数据所体现的关键蛋白特性结合起来预测网络中关键蛋白,本发明可以显著提高蛋白质相互作用网络中关键蛋白的识别准确度,并且可以一次预测出大量的关键蛋白质,解决了生物实验方法的昂贵成本和耗时的问题。

    一种融合多数据特征预测关键蛋白质的计算方法

    公开(公告)号:CN109166604B

    公开(公告)日:2021-07-02

    申请号:CN201810958860.4

    申请日:2018-08-22

    Inventor: 张伟 徐佳

    Abstract: 本发明公开了一种融合多数据源预测关键蛋白质的计算方法。该方法通过分析关键蛋白质所体现的聚集性、共表达性、功能相似性、位置一致性的特征,有效融合蛋白质相互作用网络的边聚类系数、基因表达值的皮尔逊相关系数、基因本体术语的语义相似性指数以及蛋白质亚细胞定位统计特征。本发明方法简单易用,输入蛋白质相互作用关系数据、基因表达谱数据、基因本体术语信息数据以及蛋白质亚细胞定位数据信息这四种数据,经测试验证,和已有方法相比本发明提出的方法可以显著提高蛋白质相互作用网络中关键蛋白的预测精度和效率。

    一种基于单细胞RNA测序数据识别细胞类型的方法

    公开(公告)号:CN110797089A

    公开(公告)日:2020-02-14

    申请号:CN201911042318.5

    申请日:2019-10-30

    Abstract: 本发明提供了一种基于单细胞RNA测序数据识别细胞类型的方法。该方法有效地将高维矩阵低秩表示(Low Rank Representation)模型和图正则化理论结合起来,同时考虑数据的全局结构和局部结构特征来构建优化模型,通过采用交替方向乘子法(ADMM)来求解模型得到可靠的细胞与细胞间相似性矩阵,然后采用谱聚类方法对相似性矩阵进行聚类,从而实现对单细胞进行聚类,识别细胞类型。该方法可以显著提高单细胞RNA测序数据的聚类效果。

Patent Agency Ranking