一种针对千万级规模新闻评论的观点挖掘方法

    公开(公告)号:CN104778209A

    公开(公告)日:2015-07-15

    申请号:CN201510111752.X

    申请日:2015-03-13

    Abstract: 本发明公开了一种针对千万级规模新闻评论的观点挖掘方法。具体步骤如下:1)、统计千万级规模新闻评论的数量;2)、判断该数量是否大于或等于阈值K,如果是不予处理,否则进入步骤三;3)、利用中文分词工具,对数量小于阈值K的新闻标题和评论进行分词,进行词性标注;4)、根据分词结果对新闻评论聚类,得到类别标签;5)、对新闻评论进行关键词对提取;6)、统计新闻评论的比例和混杂度;7)、根据关键词对筛选并提取代表性文本。本发明利用中文分词工具,考虑汉语语言的用法和搭配关系,结合新闻标题的作用,处理千万级规模的新闻评论,具有高效性、鲁棒性和易用性等优点。

    基于社交信息数据的划分系统及方法

    公开(公告)号:CN111680072B

    公开(公告)日:2023-12-08

    申请号:CN202010375603.5

    申请日:2020-05-07

    Abstract: 本发明公开了一种基于社交信息数据的划分系统,包括:数据采集装置;数据解析装置,解析社交数据,获取社交信息并进行唯一标识;数据去重装置;多媒体数据转换装置,将去重后的社交信息的多媒体文件提取链接;海量对象存储装置,存储去重后的社交信息;基本数据存储装置,存储去重后的社交信息的标识;分词装置,将去重后的社交信息划分成多个关键词;全文检索装置,将划分的关键词汇总、去重、建立索引。本发明还公开了一种基于社交信息数据的划分方法。本发明还公开了一种电子设备及存储介质。本发明对接收的不同社交媒体的网络信息进行按条件分类显示,方便使用人员更直观的对不同社交媒体的网络信息进行审查。

    基于新闻客户端的突发事件预警信息分析系统及其方法

    公开(公告)号:CN116882401A

    公开(公告)日:2023-10-13

    申请号:CN202310510969.2

    申请日:2023-05-08

    Abstract: 本发明提供了一种基于新闻客户端的突发事件预警信息分析系统,包括:数据处理模块,其对原始文章数据进行格式化预处理;自定义标签模块,其用于获取突发预警标签;文本分析模块,其对格式化文本数据进行分析,提取出时间、地点、人物、机构和自定义的预警信息;图片分析模块,其对格式化图片数据进行分析,对特征目标区域的字符进行分割和分类;评论情绪分析模块,其用于对格式化评论数据进行分析,获得原始文章数据的情绪类型。本发明还提供了一种基于新闻客户端的突发事件预警信息分析方法。本发明能够快速分析新闻文章信息中时间、地点、人物、机构和主题信息,以及能够从文本正文、正文中图片和评论正负面情绪三个维度进行全方位识别分析。

    基于ERNIE模型的态度检测方法、装置及设备

    公开(公告)号:CN116681066A

    公开(公告)日:2023-09-01

    申请号:CN202310499505.6

    申请日:2023-05-06

    Inventor: 张翔宇 张旭 陈彤

    Abstract: 本发明公开了基于ERNIE模型的态度检测方法,其特征在于,包括:获取待测某信息下的原创文本及其评论、转发关系,得所述待测某信息下的原创文本及其对应的评论文本和转发文本;基于ERNIE模型,对所述原创文本、评论文本和转发文本的态度进行检测,得文本态度检测结果;获取所述原创文本、评论文本和转发文本对应的用户ID和发布时间,根据所述文本态度检测结果,采用时间衰减函数和最大概率和的规则,对待测用户的态度进行检测,得用户态度检测结果;以及,基于ERNIE模型的态度检测装置。本发明具有对态度的识别的精度高、泛化能力强等优点。

Patent Agency Ranking