发明公开
- 专利标题: 一种基于完全监督的局部分析文本数据降维方法
-
申请号: CN202211440178.9申请日: 2022-11-17
-
公开(公告)号: CN115757781A公开(公告)日: 2023-03-07
- 发明人: 陈健 , 张国凯 , 黄宇轩 , 舒放 , 林宇峰 , 刘鹏 , 高云嵩 , 陈烨翰
- 申请人: 广东电网有限责任公司 , 广东电网有限责任公司珠海供电局
- 申请人地址: 广东省广州市越秀区东风东路757号;
- 专利权人: 广东电网有限责任公司,广东电网有限责任公司珠海供电局
- 当前专利权人: 广东电网有限责任公司,广东电网有限责任公司珠海供电局
- 当前专利权人地址: 广东省广州市越秀区东风东路757号;
- 代理机构: 北京集佳知识产权代理有限公司
- 代理商 吴玲
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F18/2413 ; G06F18/214
摘要:
本发明涉及文本降维技术领域,公开了一种基于完全监督的局部分析文本数据降维方法,通过K‑近邻法则对高位数据集进行分割,形成多个互相交叠的局部,通过探索局部邻域中的不同类别数据的几何信息,再利用完全监督局部分析算法构建完全监督局部目标函数,求解出局部排列矩阵,使得在降维过程中局部内同类数据点尽可能接近,不同类间尽可能分离,能有效学习局部内邻居几何结构,提高系统分类能力,再综合考虑各个局部的几何排列信息运用特征值求解方式获得全局投影矩阵,从而相应可以求解出高维数据集降维后的低维数据,这能有效解决外来样本问题。