-
公开(公告)号:CN110990711A
公开(公告)日:2020-04-10
申请号:CN201910392858.X
申请日:2019-05-13
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: G06F16/9536 , G06F16/958 , G06Q50/00 , G06N20/00
Abstract: 本发明公开了基于机器学习的微信公众号推荐算法,包括:为训练文本标注标签,获取训练文本的关键词及关键词向量,对关键词向量进行聚类计算,获得簇,并确定簇的中心向量;采集公众号文本,获取公众号文本的关键词及关键词向量,根据关键词向量与中心向量的相似度确定公众号文本对应的标签,获得标签分析结果;根据目标用户的历史行为确定目标用户的喜好标签;从标签分析结果中选取与喜好标签相关的标签,将相关的标签对应的公众号文本推荐给目标用户。本发明还提供了基于机器学习的微信公众号推荐系统。本发明能够根据分析用户喜好,进而自动推荐合适的公众号,避免用户受各种良莠不齐的公众号干扰,避免花费过多时间用于挑选公众号文章。
-
公开(公告)号:CN108880980A
公开(公告)日:2018-11-23
申请号:CN201810403059.3
申请日:2018-04-28
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
Abstract: 本发明公开一种基于微信群信息的数据分析系统,包括:信息采集模块,其每隔预设时间按发送顺序采集一批预设数量的微信群消息的html标签;数据分析模块,其将信息采集模块采集到的html标签通过正则解析得出其中包含的每条群消息的属性,所述群消息属性包括群编号、群消息编号;缓存去重模块,其将每条群消息属性包含的群编号和群消息编号进行哈希运算得到哈希值,再将相邻两批次中的每条群消息的哈希值对比,若有重复部分,则将后一批次中哈希值重复的群消息删除;多媒体提取模块;对象存储模块;关键词提取模块;群消息库模块。本发明具有能将采集到的微信群消息数据进行分析和统计,最后直观的展示出来,可以有效、直观的监测微信群的优点。
-
公开(公告)号:CN111680072B
公开(公告)日:2023-12-08
申请号:CN202010375603.5
申请日:2020-05-07
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: G06F16/2457 , G06F16/215 , G06F16/22 , G06F16/9536
Abstract: 本发明公开了一种基于社交信息数据的划分系统,包括:数据采集装置;数据解析装置,解析社交数据,获取社交信息并进行唯一标识;数据去重装置;多媒体数据转换装置,将去重后的社交信息的多媒体文件提取链接;海量对象存储装置,存储去重后的社交信息;基本数据存储装置,存储去重后的社交信息的标识;分词装置,将去重后的社交信息划分成多个关键词;全文检索装置,将划分的关键词汇总、去重、建立索引。本发明还公开了一种基于社交信息数据的划分方法。本发明还公开了一种电子设备及存储介质。本发明对接收的不同社交媒体的网络信息进行按条件分类显示,方便使用人员更直观的对不同社交媒体的网络信息进行审查。
-
公开(公告)号:CN113268673B
公开(公告)日:2023-06-02
申请号:CN202110443364.7
申请日:2021-04-23
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: G06F16/9536 , G06F40/253 , G06F40/284
Abstract: 本发明公开了一种互联网行动类信息线索分析的方法,包括:从互联网获取信息文本;将信息文本输入预训练的行动线索标注算法模型中,应用预训练的行动线索标注算法模型获取信息文本中的行动类信息线索单词;其中,所述行动类信息线索单词的实体类型包括自定义类型,所述行动线索标注算法模型对属于自定义类型的单词的权重进行增量运算。本发明可以对采集内容进行快速的语法分析,获取内容中用户关注的时间、地点、人物和活动等行动类线索信息,这样就可以对关键词信息进行标注或分类,最终让用户可以很清晰、明了的查看线索信息内容。
-
公开(公告)号:CN111680059A
公开(公告)日:2020-09-18
申请号:CN202010356697.1
申请日:2020-04-29
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: G06F16/245 , G06F16/9536 , G06F21/31
Abstract: 本发明公开了一种基于特定区域的活跃人员、常驻人员的分析方法,其包括:S1、采集特定区域内的账户信息;S2、对账户信息进行去重;根据人员记录库中的账户信息更新人员统计库中的账户ID、账户的出现时间、账户所在地的经纬度以及账户的出现次数;S3、基于人员统计库,将出现次数排名靠前的账户标识为活跃人员;S4、基于人员记录库,从活跃人员中分别过滤出有效人员、稳定人员,有效人员和稳定人员的并集为常驻人员。本发明可有效地统计和识别出某个特定区域的社交渠道上的活跃人员和常驻人员,进而实现更加高效和多方面的支持网络舆情的分析工作。
-
公开(公告)号:CN111046129A
公开(公告)日:2020-04-21
申请号:CN201910392857.5
申请日:2019-05-13
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: G06F16/31 , G06F16/953 , G06Q50/00
Abstract: 本发明公开了基于文本内容特征的公众号信息存储方法,包括:采集公众号文章,提取公众号文章的唯一标识和特征文本,并将特征文本转化为特征标识,并将公众号文章与特征标识关联存储;根据公众号文章确定索引字段,建立索引字段与公众号文章的关联关系,生成索引数据,所述索引字段至少包括唯一标识;为多个索引节点分别配置唯一标识范围,将索引数据按照其唯一标识存储至相应的索引节点。本发明还提供了基于文本内容特征的公众号信息检索系统。本发明能够避免大量相同文章同时显示,并且能够保证检索系统的稳定性和效率。
-
公开(公告)号:CN113268673A
公开(公告)日:2021-08-17
申请号:CN202110443364.7
申请日:2021-04-23
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: G06F16/9536 , G06F40/253 , G06F40/284
Abstract: 本发明公开了一种互联网行动类信息线索分析的方法,包括:从互联网获取信息文本;将信息文本输入预训练的行动线索标注算法模型中,应用预训练的行动线索标注算法模型获取信息文本中的行动类信息线索单词;其中,所述行动类信息线索单词的实体类型包括自定义类型,所述行动线索标注算法模型对属于自定义类型的单词的权重进行增量运算。本发明可以对采集内容进行快速的语法分析,获取内容中用户关注的时间、地点、人物和活动等行动类线索信息,这样就可以对关键词信息进行标注或分类,最终让用户可以很清晰、明了的查看线索信息内容。
-
公开(公告)号:CN111680072A
公开(公告)日:2020-09-18
申请号:CN202010375603.5
申请日:2020-05-07
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: G06F16/2457 , G06F16/215 , G06F16/22 , G06F16/9536
Abstract: 本发明公开了一种基于社交信息数据的划分系统,包括:数据采集装置;数据解析装置,解析社交数据,获取社交信息并进行唯一标识;数据去重装置;多媒体数据转换装置,将去重后的社交信息的多媒体文件提取链接;海量对象存储装置,存储去重后的社交信息;基本数据存储装置,存储去重后的社交信息的标识;分词装置,将去重后的社交信息划分成多个关键词;全文检索装置,将划分的关键词汇总、去重、建立索引。本发明还公开了一种基于社交信息数据的划分方法。本发明还公开了一种电子设备及存储介质。本发明对接收的不同社交媒体的网络信息进行按条件分类显示,方便使用人员更直观的对不同社交媒体的网络信息进行审查。
-
-
-
-
-
-
-