-
公开(公告)号:CN116340499A
公开(公告)日:2023-06-27
申请号:CN202310164362.3
申请日:2023-02-24
Applicant: 北京大学重庆大数据研究院
IPC: G06F16/335 , G06F16/332 , G06F16/951 , G06F40/289 , G06F18/22 , G06N3/0455
Abstract: 本发明提供的一种新闻事件文本排序方法,包括以下步骤:S1.从目标网页中抓取同一事件的新闻的文本信息;S2.采用预先设定的分词模型对文本信息进行分词处理,然后进行去除停用词处理;S3.采用Bert模型构建词向量,并确定词向量的权重,并给予词向量和词向量的权重构建文本向量;S4.基于文本向量构建事件向量;S5.计算事件向量与每个文本向量之间的相似度,并对相似度按照由大到小的顺序进行排列。通过上述方法,能够对新闻事件的信息进行全面、有效的掌握,并且能够对新闻事件进行相应的排序,用户能够根据得到的排序结果获取重要度最高的新闻事件,从而利于用户快速掌握新闻事件的具体内容,方便使用。