一种基于完全监督的局部分析文本数据降维方法
摘要:
本发明涉及文本降维技术领域,公开了一种基于完全监督的局部分析文本数据降维方法,通过K‑近邻法则对高位数据集进行分割,形成多个互相交叠的局部,通过探索局部邻域中的不同类别数据的几何信息,再利用完全监督局部分析算法构建完全监督局部目标函数,求解出局部排列矩阵,使得在降维过程中局部内同类数据点尽可能接近,不同类间尽可能分离,能有效学习局部内邻居几何结构,提高系统分类能力,再综合考虑各个局部的几何排列信息运用特征值求解方式获得全局投影矩阵,从而相应可以求解出高维数据集降维后的低维数据,这能有效解决外来样本问题。
0/0