-
公开(公告)号:CN113553429B
公开(公告)日:2023-09-29
申请号:CN202110765666.6
申请日:2021-07-07
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/35 , G06F16/36 , G06F40/216 , G06F40/289 , G06F40/30
Abstract: 本发明涉及一种规范化标签体系构建及文本自动标注方法,涉及知识图谱、语义分析、文本生成等技术领域。在标签体系的构建方法中,采用隐含狄利克雷分布LDA进行主题聚类,同时融合上下位信息进行主题提取,该方法有效地提高了主题提取的准确率,相较于目前大部分标签,可以确保同一维度的标签处于同一层,不会出现如“体育、足球、跑步、球类运动”这种较为混乱的情况,这样大大增强了数据的规范性,且对于人物画像、知识图谱、推荐系统等应用也有积极的影响。
-
公开(公告)号:CN113553429A
公开(公告)日:2021-10-26
申请号:CN202110765666.6
申请日:2021-07-07
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/35 , G06F16/36 , G06F40/216 , G06F40/289 , G06F40/30 , G06K9/62
Abstract: 本发明涉及一种规范化标签体系构建及文本自动标注方法,涉及知识图谱、语义分析、文本生成等技术领域。在标签体系的构建方法中,采用隐含狄利克雷分布LDA进行主题聚类,同时融合上下位信息进行主题提取,该方法有效地提高了主题提取的准确率,相较于目前大部分标签,可以确保同一维度的标签处于同一层,不会出现如“体育、足球、跑步、球类运动”这种较为混乱的情况,这样大大增强了数据的规范性,且对于人物画像、知识图谱、推荐系统等应用也有积极的影响。
-