-
公开(公告)号:CN115827861A
公开(公告)日:2023-03-21
申请号:CN202211504585.1
申请日:2022-11-29
Applicant: 电子科技大学长三角研究院(湖州)
Abstract: 本发明提供了一种支持短文本流在线聚类的上下文增强狄利克雷模型,其特征在于:包括以下步骤:步骤1,根据计算的概率,选择将到达的文档添加到模型的活动集群中,或者创建一个新的集群进行添加;步骤2,当模型中已有集群的文档到达的概率小于伪概率时,则将文档视为新主题的出现,从而创建新的集群;步骤3,随着文档的到来,模型对旧的集群(即过时的主题)进行检查并删除,从而使得当前分布的近期主题集群在模型中处于活跃状态,为了推断模型中的活跃簇数,在每个ρ时间单位间隔后重新采样来自最近ψ文档的随机文档数η。本发明具有模型效率高,稳健性强的优点。