-
公开(公告)号:CN118484665A
公开(公告)日:2024-08-13
申请号:CN202410946482.3
申请日:2024-07-16
Applicant: 中国民用航空飞行学院
IPC: G06F18/213 , G06F18/2131 , G06F18/25 , G06F18/22 , G06F18/2431 , G06F18/2135 , G06F18/27 , G06F40/284 , G06F40/289 , G06F40/30 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06F16/45 , G06F16/483 , G06N3/048
Abstract: 本申请公开了一种基于NLP技术实现文本主题的智能提取方法及系统,属于NLP领域。该方法包括:接收输入的待提取文档,确定待提取文档的模态类型;确定目标NLP特征提取方法,使用此方法确定待提取文档对应的特征信息;将特征信息输入至预设的主题提取模型,确定至少两个备选主题;获取各备选主题的主题分布向量,计算各备选主题之间的相似度;确定达到预设的相似度阈值的备选主题的权重信息,计算目标主题的主题分布,对主题分布进行归一化以及主题映射,得到目标主题。本申请可以针对不同类型的文档采用适当的特征提取方法,从而保证了特征的全面性和准确性,通过计算备选主题的相似度并进行主题融合,可以得到更综合的主题。
-
公开(公告)号:CN118484665B
公开(公告)日:2024-09-27
申请号:CN202410946482.3
申请日:2024-07-16
Applicant: 中国民用航空飞行学院
IPC: G06F18/213 , G06F18/2131 , G06F18/25 , G06F18/22 , G06F18/2431 , G06F18/2135 , G06F18/27 , G06F40/284 , G06F40/289 , G06F40/30 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06F16/45 , G06F16/483 , G06N3/048
Abstract: 本申请公开了一种基于NLP技术实现文本主题的智能提取方法及系统,属于NLP领域。该方法包括:接收输入的待提取文档,确定待提取文档的模态类型;确定目标NLP特征提取方法,使用此方法确定待提取文档对应的特征信息;将特征信息输入至预设的主题提取模型,确定至少两个备选主题;获取各备选主题的主题分布向量,计算各备选主题之间的相似度;确定达到预设的相似度阈值的备选主题的权重信息,计算目标主题的主题分布,对主题分布进行归一化以及主题映射,得到目标主题。本申请可以针对不同类型的文档采用适当的特征提取方法,从而保证了特征的全面性和准确性,通过计算备选主题的相似度并进行主题融合,可以得到更综合的主题。
-