-
公开(公告)号:CN113946734A
公开(公告)日:2022-01-18
申请号:CN202110978180.0
申请日:2021-08-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/955 , G06F9/54
Abstract: 本发明公开了基于爬虫的数据采集系统,包括:URL管理器,用于获取URL链接;HTML下载器,用于根据所述URL链接下载HTML网页;HTML解析器,用于解析所述HTML网页的源代码,获得网页数据;数据存储器,用于存储所述网页数据。本发明使用方便,用户体验好。
-
公开(公告)号:CN105843854A
公开(公告)日:2016-08-10
申请号:CN201610150817.6
申请日:2016-03-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明提供一种面向网络数据的专题文档快速识别系统,通过与不同规则的高效匹配达到快速识别专题的目的。本发明主要由文档获取模块、文档结果存储模块、轮询监测模块、实时服务接口、历史服务接口、规则树构建模块、实时过滤处理模块和回溯过滤处理模块组成。本发明实现了对实时数据和历史有效数据同时进行处理的功能,能够对大量文档数据进行批量处理,能够在保证系统正常运行的前提下对处理算法进行动态热切换,能够在输入输出接口内容变动后依然可以保证系统的正常运行,弥补了目前一些文档识别系统无法随意更改、灵活性和复用性差等的缺陷,对需求变更有很强的适应性。
-
公开(公告)号:CN105608106A
公开(公告)日:2016-05-25
申请号:CN201510744624.9
申请日:2015-11-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明公开了一种面向智能终端的舆情分析方法。包括:获取用户预先设定的关键词,然后根据该关键词获取包括该关键词的新闻,再根据获取的新闻通过自然语言分析方法分析出新闻预警级别,然后再计算出用户当前的舆情健康指数,并向用户显示与舆情健康指数对应的应对策略。本发明方法能够对舆情信息进行自动分析、统计、聚类等操作,具有成本低、效率高、准确性高、安全性较高等优点。
-
公开(公告)号:CN111737590B
公开(公告)日:2023-09-12
申请号:CN202010442783.4
申请日:2020-05-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/33
Abstract: 本发明公开了社交关系挖掘方法、装置、电子设备以及存储介质。所述方法包括:获取群组的对话流数据;将所述对话流数据划分为多个对话队列,其中,各对话队列的时间跨度小于或等于时间阈值;根据各对话队列中对话信息的上下文相关度,确定构成真实对话场景的对话队列;提取所述构成真实对话场景的对话队列所对应的用户,作为具有社交关系的用户。基于该方法及装置,可以还原对话场景,进而更加精准地映射对话用户,挖掘用户社交关系。
-
公开(公告)号:CN110704186B
公开(公告)日:2022-05-24
申请号:CN201910908595.3
申请日:2019-09-25
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种基于混合计算资源的分布式计算系统,用以合理分配资源,满足计算任务多样性的需求,所述系统包括计算引擎层和资源调度层,其中:所述计算引擎层由多个构建在同一个Spark计算引擎上的深度学习框架组成,针对所述计算引擎层统一封装各个深度学习框架的访问接口;所述资源调度层包括多种异构计算资源,所述异构计算资源包括以下至少一项:CPU、GPU和FPGA;在所述资源调度层,根据待处理任务的任务类型划分不同的任务队列,根据不同物理机搭载的计算资源类型划分不同的逻辑集群,根据待处理任务的任务类,将任务队列中的任务分配到对应的逻辑集群中执行。
-
公开(公告)号:CN114297498A
公开(公告)日:2022-04-08
申请号:CN202111638795.5
申请日:2021-12-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/9536 , G06N3/04 , G06Q50/00
Abstract: 本发明通过网络技术处理领域的方法,实现了一种基于关键传播结构感知的意见领袖识别方法和装置。方法基于神经网络算法,设计用户双重特征提取模块和关键传播结构挖掘模块两个逻辑模块组成,通过输入微博中不同话题数据,得到输入数据中具有代表性特征的意见领袖及关联关系输出。本发明设计基于节点中心度的消息传递机制,充分结合了节点在拓扑结构中的重要性,构造了一个新的图神经网络模型提取社交网络中用户的特征。首次利用图分类任务挖掘不同事件中的关键结构信息,在挖掘社交网络中top‑k个意见领袖的同时能够从节点连通性、节点相似度、节点中心度三个角度学习意见领袖之间潜在的联系,构造网络中的关键传播结构。
-
公开(公告)号:CN110704186A
公开(公告)日:2020-01-17
申请号:CN201910908595.3
申请日:2019-09-25
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种基于混合计算资源的分布式计算系统,用以合理分配资源,满足计算任务多样性的需求,所述系统包括计算引擎层和资源调度层,其中:所述计算引擎层由多个构建在同一个Spark计算引擎上的深度学习框架组成,针对所述计算引擎层统一封装各个深度学习框架的访问接口;所述资源调度层包括多种异构计算资源,所述异构计算资源包括以下至少一项:CPU、GPU和FPGA;在所述资源调度层,根据待处理任务的任务类型划分不同的任务队列,根据不同物理机搭载的计算资源类型划分不同的逻辑集群,根据待处理任务的任务类,将任务队列中的任务分配到对应的逻辑集群中执行。
-
公开(公告)号:CN105843854B
公开(公告)日:2019-02-05
申请号:CN201610150817.6
申请日:2016-03-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/2455 , G06F16/31
Abstract: 本发明提供一种面向网络数据的专题文档快速识别系统,通过与不同规则的高效匹配达到快速识别专题的目的。本发明主要由文档获取模块、文档结果存储模块、轮询监测模块、实时服务接口、历史服务接口、规则树构建模块、实时过滤处理模块和回溯过滤处理模块组成。本发明实现了对实时数据和历史有效数据同时进行处理的功能,能够对大量文档数据进行批量处理,能够在保证系统正常运行的前提下对处理算法进行动态热切换,能够在输入输出接口内容变动后依然可以保证系统的正常运行,弥补了目前一些文档识别系统无法随意更改、灵活性和复用性差等的缺陷,对需求变更有很强的适应性。
-
公开(公告)号:CN114297498B
公开(公告)日:2024-10-15
申请号:CN202111638795.5
申请日:2021-12-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/9536 , G06N3/0464 , G06Q50/00
Abstract: 本发明通过网络技术处理领域的方法,实现了一种基于关键传播结构感知的意见领袖识别方法和装置。方法基于神经网络算法,设计用户双重特征提取模块和关键传播结构挖掘模块两个逻辑模块组成,通过输入微博中不同话题数据,得到输入数据中具有代表性特征的意见领袖及关联关系输出。本发明设计基于节点中心度的消息传递机制,充分结合了节点在拓扑结构中的重要性,构造了一个新的图神经网络模型提取社交网络中用户的特征。首次利用图分类任务挖掘不同事件中的关键结构信息,在挖掘社交网络中top‑k个意见领袖的同时能够从节点连通性、节点相似度、节点中心度三个角度学习意见领袖之间潜在的联系,构造网络中的关键传播结构。
-
公开(公告)号:CN112668316A
公开(公告)日:2021-04-16
申请号:CN202011290565.X
申请日:2020-11-17
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F40/258 , G06F40/205 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种word文档关键信息抽取方法,其包括:步骤一、获取源word文档,遍历word文档的段落,对于任一段落,判断段落是否具有模板样式属性,若具有模板样式属性,则进入步骤二,否则进入步骤三;步骤二、根据段落的模板样式属性获取段落信息类别,并与预设的待抽取关键信息类别列表进行匹配,将段落抽取并输入至输出文件一中所属信息类别对应的区域;步骤三、基于预设的神经网络模型识别段落的信息类别,并与预设的待抽取关键信息类别列表进行匹配,将段落抽取并输入所属信息类别对应的区域。本发明利用了word文档中的模板样式属性的信息,从而极大地提高了word文档抽取关键信息地效率。
-
-
-
-
-
-
-
-
-