-
公开(公告)号:CN104573031B
公开(公告)日:2018-06-05
申请号:CN201510018617.0
申请日:2015-01-14
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
Abstract: 一种微博突发事件检测方法,包括步骤:降维处理:基于LSH算法对微博数据流中的词汇进行映射处理;创建B‑Sketch模型:创建微博数据流中的B‑Sketch数据;推测突发事件:根据B‑Sketch数据计算微博数据流中的事件加速率a和事件中词的分布向量p,根据事件加速率a判断事件是否为突发事件。由于通过LSH算法将所有词汇映射到低维空间,降低了计算的复杂度,并基于B‑Sketch模型推测隐含的突发事件,使得能够快速有效的实时处理微博数据流,及早地检测出突发事件。
-
公开(公告)号:CN104573031A
公开(公告)日:2015-04-29
申请号:CN201510018617.0
申请日:2015-01-14
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
CPC classification number: G06F17/30684 , G06F17/30654
Abstract: 一种微博突发事件检测方法,包括步骤:降维处理:基于LSH算法对微博数据流中的词汇进行映射处理;创建B-Sketch模型:创建微博数据流中的B-Sketch数据;推测突发事件:根据B-Sketch数据计算微博数据流中的事件加速率a和事件中词的分布向量p,根据事件加速率a判断事件是否为突发事件。由于通过LSH算法将所有词汇映射到低维空间,降低了计算的复杂度,并基于B-Sketch模型推测隐含的突发事件,使得能够快速有效的实时处理微博数据流,及早地检测出突发事件。
-