-
公开(公告)号:CN119149982B
公开(公告)日:2025-04-01
申请号:CN202411658867.6
申请日:2024-11-20
Applicant: 华侨大学
IPC: G06F18/211 , G06F16/35
Abstract: 本发明涉及一种标记松弛的多主题文本数据特征选择方法,涉及自然语言处理技术领域,方法包括:给定由特征空间和标记空间组成的多主题文本数据;使用非负标记松弛矩阵获得松弛后的标记空间;构建特征选择矩阵并进行分解得到结构化子空间和因子矩阵,挖掘特征之间和标记之间的结构化关系;构造损失函数并施加范数约束,对特征选择矩阵进行范数稀疏正则化,基于此构建总目标函数;再通过迭代求解总目标函数,获得最终特征选择矩阵;最后,利用最终特征选择矩阵选择特征以表征原始文本数据。本发明通过标记松弛、结构化子空间分解、稀疏正则化等技术手段,显著提高了多主题文本数据特征选择的准确性、解释性、泛化能力和计算效率。
-
公开(公告)号:CN119169386A
公开(公告)日:2024-12-20
申请号:CN202411339028.8
申请日:2024-09-25
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/771 , G06V10/774 , G06V10/766
Abstract: 本发明公开了一种基于显著性特征的多标记图像分类方法、装置及可读介质,包括:基于特征选择矩阵、特征空间矩阵和伪标记矩阵构造回归框架,结合牵引矩阵、非负标记稀疏矩阵、标记空间矩阵和伪标记矩阵构建拟合模型,通过伪标记矩阵构造标记相关性模型;构建特征选择矩阵的核范数模型,以构建目标函数,对目标函数进行求解,得到最终优化的特征选择矩阵;基于最终优化的特征选择矩阵确定图像特征子集,基于图像特征子集对图像分类模型进行训练,得到经训练的图像分类模型;将图像中与图像特征子集相对应的特征输入到经训练的图像分类模型中,得到图像分类结果,从而学习类别标记之间的相关性,减轻低密度标记对特征选择的影响。
-
公开(公告)号:CN117992765B
公开(公告)日:2024-06-28
申请号:CN202410397200.9
申请日:2024-04-03
Applicant: 华侨大学
IPC: G06F18/21 , G06F18/214 , G06F18/24 , G06F18/23
Abstract: 本发明提供了基于动态新兴标记的偏标签学习方法、装置、设备及介质,涉及数据处理领域,该方法中首先通过基于概率估计的候选标签置信度和基于特征诱导的候选标签置信度更新两阶段交替过程,利用训练实例的近邻信息来迭代构建标签置信度矩阵,进而完成偏标记消歧;然后通过迭代过程产生的类属特征构建分类模型,集成多个类属特征空间对待测样本进行分类,检测待测样本是否具有新兴标记;最后构建模型更新策略使得模型可以适应新兴标记数据。本发明将集成思想与邻域知识应用于基于动态新兴标记的偏标签学习算法,为动态新兴标记的偏标记环境提供了一个高性能的分类算法。
-
公开(公告)号:CN117171540A
公开(公告)日:2023-12-05
申请号:CN202311178500.X
申请日:2023-09-13
Applicant: 华侨大学
IPC: G06F18/2113 , G06F18/25
Abstract: 本发明涉及一种基于动态流标签的多标签特征选择方法、设备及介质,该方法中首先通过在特征空间上进行最近邻重构,将动态流标签的隐式标记重要性形式化为动态标签空间上的多项分布;然后将标签相关无缝集成到特征相关的目标函数中,并量化了标签相关性对特征的影响;最后构建了一种特征转换技术用于融合每个动态流标记所对应的类属特征。本发明将潜在的标记重要性与标记相关性联合学习应用于面向动态流标签的多标签特征选择方法,为模型训练提供了高质量的特征序列。
-
-
-