-
公开(公告)号:CN103744889A
公开(公告)日:2014-04-23
申请号:CN201310718033.5
申请日:2013-12-23
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30867
Abstract: 本发明的目的是提供一种用于对问题进行聚类处理的方法与装置;获取待聚类的目标问题与候选问题;根据所述目标问题与候选问题的问题特征,确定所述目标问题与候选问题的特征向量;根据所述目标问题与候选问题的特征向量,计算所述目标问题与候选问题的相似度;根据所述相似度,并结合分段阈值,判断是否将所述目标问题与候选问题聚为一类。与现有技术相比,本发明根据待聚类的目标问题与候选问题的问题特征,确定特征向量,进而计算该目标问题与候选问题的相似度,并结合分段阈值,判断是否将该目标问题与候选问题聚为一类,高效、准确地对问题进行聚类处理,整合了问题资源,提高了用户的检索体验。
-
公开(公告)号:CN103744889B
公开(公告)日:2019-02-22
申请号:CN201310718033.5
申请日:2013-12-23
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/28 , G06F16/9535 , G06K9/62
Abstract: 本发明的目的是提供一种用于对问题进行聚类处理的方法与装置;获取待聚类的目标问题与候选问题;根据所述目标问题与候选问题的问题特征,确定所述目标问题与候选问题的特征向量;根据所述目标问题与候选问题的特征向量,计算所述目标问题与候选问题的相似度;根据所述相似度,并结合分段阈值,判断是否将所述目标问题与候选问题聚为一类。与现有技术相比,本发明根据待聚类的目标问题与候选问题的问题特征,确定特征向量,进而计算该目标问题与候选问题的相似度,并结合分段阈值,判断是否将该目标问题与候选问题聚为一类,高效、准确地对问题进行聚类处理,整合了问题资源,提高了用户的检索体验。
-