-
公开(公告)号:CN106294336A
公开(公告)日:2017-01-04
申请号:CN201510236795.0
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开一种用于微博的突发特征检测方法及装置,涉及网络信息挖掘技术领域,用以解决现有技术中微博信息噪音大、数据多样突发特征检测准确率低的问题。所述方法包括:根据信息流中有意义串的被检特征的瞬时爆发情况,检测出候选突发特征;将所述候选突发特征中的频繁伪突发特征和间歇性伪突发特征滤除。
-
公开(公告)号:CN105045803A
公开(公告)日:2015-11-11
申请号:CN201510278653.0
申请日:2015-05-27
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F17/30864 , G06F17/30887 , G06Q50/01
Abstract: 本发明公开了一种社交网络关系的采集方法及系统,所述方法包括:根据预设微博用户信息,通过模拟移动终端浏览器登录预设微博;设置目标微博用户的粉丝URL和/或关注URL;在登录预设微博的所述模拟移动终端浏览器中,根据设置的URL向微博服务器发请求,获得所述微博服务器返回的HTML界面;根据获得的HTML界面,获取所述目标微博用户的粉丝信息和/或所述目标微博用户的关注用户信息。本发明消除了微博服务器的访问频率限制,可以无限制的向服务器发送数据请求;降低了实现难度,不需要逆向分析和大量的调试。
-
公开(公告)号:CN104933475A
公开(公告)日:2015-09-23
申请号:CN201510275958.6
申请日:2015-05-27
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种网络转发行为预测方法及装置。该方法包括:计算待预测用户的转发行为与热点事件趋势的第一匹配度,并计算待预测微博与热点事件的第二匹配度;将第一匹配度、第二匹配度、以及待预测用户的信息输入到预先训练好的分类器中,输出待预测用户对待预测微博的动作类型。借助于本发明的技术方案,有效提高了微博转发行为预测的准确性。
-
公开(公告)号:CN104915397A
公开(公告)日:2015-09-16
申请号:CN201510284821.7
申请日:2015-05-28
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F16/951 , G06Q10/04
Abstract: 本发明提供一种微博传播趋势预测方法及装置,用于解决现有技术中对微博传播趋势预测的方法准确性较低的问题,该方法包括:获取待预测微博的基本属性特征以及传播过程特征;计算待预测微博与训练数据的基本属性特征、传播过程特征的相似度,并对待预测微博数据进行分类,得到待预测微博所属的传播过程类别,传播过程类别由训练数据的传播过程特征相似度聚类得到;为分类后的待预测微博选择对应的回归模型,对待预测微博的传播趋势进行预测,回归模型为预先根据各类训练数据建立的回归模型,该方案提高了微博传播趋势预测的准确性。
-
公开(公告)号:CN113704373B
公开(公告)日:2023-12-05
申请号:CN202110955784.3
申请日:2021-08-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/29 , G06F18/22 , G06F18/214 , H04W4/029
Abstract: 用户识别准确率较低,稳定性不高的问题。本申请提供了一种基于移动轨迹数据的用户识别方法、装置及存储介质,该方法包括:获取任意两条待判别的目标轨迹数据,其中,目标轨迹数据为从目标区域中提取出的路径信息,目标区域为用户访问过的区域;将目标轨迹数据的表征集合输入到目标模型内,判断目标轨迹数据是否来自同一用户,其中,目标模型是由初始判别模型训练得到的,输入初始判别模型的训练参数包括:任意两条初始轨迹数据之间的共现次数、任意两条初始轨迹数据之间的角度余弦值、任意两条初始轨迹数据之间的概率偏差值、任意两条
-
公开(公告)号:CN113722481B
公开(公告)日:2023-09-22
申请号:CN202110971648.3
申请日:2021-08-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06N3/0464
Abstract: 本申请涉及一种基于类别和实例增强的文本多事件检测方法与装置,其中,方法包括:获取待检测文本的文本表示数据。根据类别标签表示和文本表示数据,确定出待检测文本的每个字符的各第一中间结果,第一中间结果表示出其对应的字符是事件之一对应的触发词的概率。根据对各第一中间结果处理得到的综合文本特征和文本表示数据,得到待检测文本中的每个字符相对于每个事件的检测结果。在待检测本文对应于若干个事件的情况下,基于事件和触发词之间的对应关系,能够对一待检测文本中的表示出的多个事件进行检测,以基于事件之间的相关性,提升事件检测的准确率。
-
公开(公告)号:CN115718835A
公开(公告)日:2023-02-28
申请号:CN202211370652.5
申请日:2022-11-03
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F17/16
Abstract: 本申请涉及一种破除信息茧房问题的冷启动个性化推荐方法及装置,其中,方法包括:在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;利用目标兴趣矩阵在预设内容池中确定候选推荐集;利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。通过对照账号来预测用户账号的兴趣矩阵,然后用兴趣矩阵选出候选推荐集,最后结合目标账号的浏览记录确定推荐数据,解决了为冷启动阶段用户推荐的内容趋于同质化的问题。
-
公开(公告)号:CN111160005B
公开(公告)日:2022-06-24
申请号:CN201911168831.9
申请日:2019-11-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/211 , G06F40/289 , G06F40/30 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种基于事件演化知识本体的事件预测方法、装置及终端设备。其中,该方法包括:通过构建具备事件演化关系的事件演化本体知识库,从事件演化本体知识库中抽取出第一事件链和第一事件元组,采用远程监督的方式,利用第一事件元组和第一事件链对非结构化文本进行关系数据回标,得到具有事件演化关系的事件数据,利用事件数据训练以建立事件预测模型的方法,可以基于知识有效的快速获得大量已标注的训练数据,从而有效提升事件预测的准确度。
-
公开(公告)号:CN113722481A
公开(公告)日:2021-11-30
申请号:CN202110971648.3
申请日:2021-08-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06N3/04
Abstract: 本申请涉及一种基于类别和实例增强的文本多事件检测方法与装置,其中,方法包括:获取待检测文本的文本表示数据。根据类别标签表示和文本表示数据,确定出待检测文本的每个字符的各第一中间结果,第一中间结果表示出其对应的字符是事件之一对应的触发词的概率。根据对各第一中间结果处理得到的综合文本特征和文本表示数据,得到待检测文本中的每个字符相对于每个事件的检测结果。在待检测本文对应于若干个事件的情况下,基于事件和触发词之间的对应关系,能够对一待检测文本中的表示出的多个事件进行检测,以基于事件之间的相关性,提升事件检测的准确率。
-
公开(公告)号:CN107992474B
公开(公告)日:2021-04-27
申请号:CN201711193285.5
申请日:2017-11-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/284 , G06F16/2458 , G06F16/215
Abstract: 本发明涉及一种流式数据主题挖掘方法及其系统,该挖掘方法包括:对结构化数据进行筛选,得到主题数据,提取主题数据的主题实体和主题关键词,分别生成主题实体集合和主题关键词集合;提取候选新闻数据的新闻实体和新闻关键词,分别生成新闻实体集合和新闻关键词集合;分别计算得到实体相关度、关键词相关度和核心词相关度;计算候选新闻数据与主题数据的新闻主题相似度,并将新闻主题相似度大于预设阈值的候选新闻数据导入合格新闻数据集合。本发明能够从海量的实时流式数据中准确找到用户关注的特定主题的相关新闻,保证了该主题下新闻的实时性、准确性,以及该主题下新闻动态的变化过程,并对新闻内容进行了分析。
-
-
-
-
-
-
-
-
-