-
公开(公告)号:CN111581370B
公开(公告)日:2023-06-23
申请号:CN202010310036.5
申请日:2020-04-20
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F16/335 , G06F16/951 , G06F16/9536 , G06F40/242 , G06Q10/0637 , G06Q50/00
Abstract: 本发明公开了一种综合多通道数据来源的网络舆情热度评估方法,包括:步骤一、收集各通道的流数据;步骤二、量化流数据对于目标事件的敏感值和情绪标签;步骤三、基于敏感度和影响力量化得到主体指标值;步骤四、基于敏感消息数、各类情绪标签对应的消息数,量化得到内容指标值;步骤五、基于每日的消息数、用户数、群组数,量化得到传播指标值;步骤六、基于主体指标值、内容指标值、传播指标值,量化得到各通道的综合热度值,并计算得到目标事件当日的总热度值。本方法建立了普适的网络舆情热度评估指标体系,评估结果更准确全面。本发明还公开了一种综合多通道数据来源的网络舆情热度评估装置,本装置对网络舆情热度的评估更准确全面。
-
公开(公告)号:CN113312478B
公开(公告)日:2022-07-19
申请号:CN202110445975.5
申请日:2021-04-25
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06K9/62 , G06F40/216 , G06N5/02
Abstract: 本发明公开了基于阅读理解的观点挖掘方法,包括:构建领域情感观点知识库,其内包含领域情感观点词,每个领域情感观点词对应一个情感分类标签和一个立场分类标签;基于所述领域情感观点知识库和事件观点训练文本集,对预训练语言模型进行训练,获得情感预训练语言模型,所述情感预训练语言模型中嵌入有表示输入文本的情感和观点信息;从待抽取事件文本中抽取事件观点文本;将所述事件观点文本输入所述情感预训练语言模型中,并对其输出的内容进行编码、句子特征提取和分类,获得待抽取事件文本中观点的情感和立场;以及,基于阅读理解的观点挖掘装置。本发明具有使观点挖掘结果更加准确的优点。
-
公开(公告)号:CN113254632B
公开(公告)日:2022-07-22
申请号:CN202110437683.7
申请日:2021-04-22
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明公开了基于事件检测技术的时间线摘要自动生成方法,包括:S10、将新闻文本集合进行聚类,得到新闻事件的子事件文档集合,每个子事件文档集合对应一个子事件;S20、获取每个子事件文档集合的摘要;S30、对所述子事件进行筛选,自动确定时间线摘要长度L′,以及对应的L′个子事件;S40、获取所述L′个子事件对应的子事件文档集合的摘要,按照日期先后顺序对所述摘要进行排序,输出带有时间戳的摘要序列。以及,基于事件检测技术的时间线摘要自动生成装置,电子设备和存储介质。本发明具有能自动确定时间线摘要的长度,灵活性强,能够处理动态变化的新闻事件等优点。
-
公开(公告)号:CN113312478A
公开(公告)日:2021-08-27
申请号:CN202110445975.5
申请日:2021-04-25
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06K9/62 , G06F40/216 , G06N5/02
Abstract: 本发明公开了基于阅读理解的观点挖掘方法,包括:构建领域情感观点知识库,其内包含领域情感观点词,每个领域情感观点词对应一个情感分类标签和一个立场分类标签;基于所述领域情感观点知识库和事件观点训练文本集,对预训练语言模型进行训练,获得情感预训练语言模型,所述情感预训练语言模型中嵌入有表示输入文本的情感和观点信息;从待抽取事件文本中抽取事件观点文本;将所述事件观点文本输入所述情感预训练语言模型中,并对其输出的内容进行编码、句子特征提取和分类,获得待抽取事件文本中观点的情感和立场;以及,基于阅读理解的观点挖掘装置。本发明具有使观点挖掘结果更加准确的优点。
-
公开(公告)号:CN113254632A
公开(公告)日:2021-08-13
申请号:CN202110437683.7
申请日:2021-04-22
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明公开了基于事件检测技术的时间线摘要自动生成方法,包括:S10、将新闻文本集合进行聚类,得到新闻事件的子事件文档集合,每个子事件文档集合对应一个子事件;S20、获取每个子事件文档集合的摘要;S30、对所述子事件进行筛选,自动确定时间线摘要长度L′,以及对应的L′个子事件;S40、获取所述L′个子事件对应的子事件文档集合的摘要,按照日期先后顺序对所述摘要进行排序,输出带有时间戳的摘要序列。以及,基于事件检测技术的时间线摘要自动生成装置,电子设备和存储介质。本发明具有能自动确定时间线摘要的长度,灵活性强,能够处理动态变化的新闻事件等优点。
-
公开(公告)号:CN111581370A
公开(公告)日:2020-08-25
申请号:CN202010310036.5
申请日:2020-04-20
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F16/335 , G06F16/951 , G06F16/9536 , G06F40/242 , G06Q10/06 , G06Q50/00
Abstract: 本发明公开了一种综合多通道数据来源的网络舆情热度评估方法,包括:步骤一、收集各通道的流数据;步骤二、量化流数据对于目标事件的敏感值和情绪标签;步骤三、基于敏感度和影响力量化得到主体指标值;步骤四、基于敏感消息数、各类情绪标签对应的消息数,量化得到内容指标值;步骤五、基于每日的消息数、用户数、群组数,量化得到传播指标值;步骤六、基于主体指标值、内容指标值、传播指标值,量化得到各通道的综合热度值,并计算得到目标事件当日的总热度值。本方法建立了普适的网络舆情热度评估指标体系,评估结果更准确全面。本发明还公开了一种综合多通道数据来源的网络舆情热度评估装置,本装置对网络舆情热度的评估更准确全面。
-
公开(公告)号:CN119669939A
公开(公告)日:2025-03-21
申请号:CN202411761212.1
申请日:2024-12-03
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2431 , G06Q50/00 , G06F18/213
Abstract: 本发明公开了社交网络账号状态判定方法,包括:S1:获取目标账号的状态数据;S2:从所述状态数据中提取账号基本信息、账号粉丝信息和账号发言信息;S3:将所述账号基本信息、所述账号粉丝信息和所述账号发言信息与预设条件比较,根据比较结果确定所述目标账号的状态。本发明还公开了判定装置。本发明能够较准确地进行社交网络账号状态的判断。
-
公开(公告)号:CN116186191A
公开(公告)日:2023-05-30
申请号:CN202210320305.5
申请日:2022-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 北京理工大学
Abstract: 本发明涉及基于多维信息的任务匹配方法,属于基于大数据智能分析与挖掘技术领域。本发明是结合文本处理、机器学习方法、线性模型、动态规划等方法对相应文本进行处理,从而对文本所含“价值”进行分析,并借助大数据的手段将人工主观文本分析变为自动化完成,提高系统找到匹配结果的效率。本发明采用多种大数据分析的思想和多路召回的思想,对于同一任务会召回多个表单,每一个表单进行同样的操作,设置不同的权重,最后多路交集,从而可以取到更加准确的筛选结果,大大提高了工作效率。
-
公开(公告)号:CN115310000A
公开(公告)日:2022-11-08
申请号:CN202110432130.2
申请日:2021-04-21
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司
IPC: G06F16/9536 , G06F16/955 , G06Q50/00
Abstract: 本发明提供了一种信息处理方法、处理装置、电子设备和可读存储介质,方法包括:获取文本数据,根据文本数据得到目标统一资源定位符;将文本数据输入至目标业务的分类模型,得到文本数据的目标业务相关度;确定目标统一资源定位符的热度值;根据热度值和文本数据的目标业务相关度,确定目标统一资源定位符的推荐指数;根据推荐指数,输出目标统一资源定位符,通过运行该方法,可以为文本数据中的抽取得到的目标统一资源定位符标注推荐指数,并根据推荐指数输出目标统一资源定位符,以实现信源的推荐。
-
公开(公告)号:CN112668316A
公开(公告)日:2021-04-16
申请号:CN202011290565.X
申请日:2020-11-17
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F40/258 , G06F40/205 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种word文档关键信息抽取方法,其包括:步骤一、获取源word文档,遍历word文档的段落,对于任一段落,判断段落是否具有模板样式属性,若具有模板样式属性,则进入步骤二,否则进入步骤三;步骤二、根据段落的模板样式属性获取段落信息类别,并与预设的待抽取关键信息类别列表进行匹配,将段落抽取并输入至输出文件一中所属信息类别对应的区域;步骤三、基于预设的神经网络模型识别段落的信息类别,并与预设的待抽取关键信息类别列表进行匹配,将段落抽取并输入所属信息类别对应的区域。本发明利用了word文档中的模板样式属性的信息,从而极大地提高了word文档抽取关键信息地效率。
-
-
-
-
-
-
-
-
-