-
公开(公告)号:CN111382181A
公开(公告)日:2020-07-07
申请号:CN202010183474.X
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F16/2455 , G06Q40/06 , G06Q40/04 , G06Q10/06
Abstract: 本发明涉及数据处理的技术领域,具体涉及一种基于股权穿透的指定企业派系归属分析方法及系统,包括对每个待分析企业信息数据进行采集存储,得到原始信息数据,信息数据包括股东信息数据;根据原始信息数据对每个待分析企业向上发散计算股权链路占比,并确定所述每个待分析企业的全部股东,所述全部股东包括最终股东;通过检索出与所述最终股东相关的关联待分析企业,生成与最终股东相关的第一派系信息数据;对第一派系信息数据进行合并,生成最终派系信息数据;通过对股东信息进行采集存储以及分析,从而计算出每个待分析企业的向上发散计算股权链路占比。对待分析企业进行了基于最终股东的集合划分,为企业关联分析提供支撑。
-
公开(公告)号:CN110557462B
公开(公告)日:2022-11-25
申请号:CN201910683148.2
申请日:2019-07-26
Applicant: 北京天元特通科技有限公司 , 国家计算机网络与信息安全管理中心
IPC: H04L61/2521 , H04L61/103 , H04L67/1061 , H04L67/14 , H04L67/56 , H04L67/566 , H04L9/40
Abstract: 本发明提供一种基于公共代理的分布式接入系统,主要由接入管理部件、数据处理部件以及代理资源管理部件构成;接入管理部件,接收用户数据,并对用户数据进行解析,获取五元组信息后进行地址翻译并建立连接追踪表,然后将用户数据传送给数据处理部件;代理资源管理部件,依据用户指定的代理资源使用策略,选出符合需求的代理,传送给数据处理部件;数据处理部件,建立与对应代理服务器的连接,并建立连接映射表,然后将用户数据进行封装后发送出去。该系统能够实现将可用的公共代理资源接入,解决了代理资源本身带来的不稳定问题,并且极大地节约了成本费用。
-
公开(公告)号:CN115473659A
公开(公告)日:2022-12-13
申请号:CN202110652291.2
申请日:2021-06-11
Applicant: 国家计算机网络与信息安全管理中心
Inventor: 张凯
Abstract: 本申请提供一种多渠道爬虫采集平台及其采集方法,采集平台包括数据库和集群主体;所述集群主体框架下至少包括一个爬虫集群,所述爬虫集群包括爬虫根节点以及由所述爬虫根节点延伸出的爬虫节点;所述爬虫节点包括采集模块、解析模块、提取模块以及网络访问模块;所述网络访问模块,包括基本网络访问模块和特殊网络访问模块;所述特殊网络访问模块用于通过Privoxy将收到的HTTP请求转给SOCKS5代理,由SOCKS5代理转发至ShadowSocks服务器,再转到网页进行访问;或者先通过Privoxy把收到的HTTP请求转给SOCKS5代理,再由所述SOCKS5代理转发到Tor代理服务器,所述Tor代理服务器再通过SOCKS5转发到ShadowSocks服务器,再通过所述ShadowSocks服务器通过Tor中继节点转到网页进行访问。本申请能够更高效获得网络数据。
-
公开(公告)号:CN102110197A
公开(公告)日:2011-06-29
申请号:CN200910243914.X
申请日:2009-12-25
Applicant: 中国科学院计算技术研究所
IPC: G06F21/00
Abstract: 本发明涉及多核处理器的计算环境中实现TMP的方法及其系统,包括:步骤1,计算环境中的节点在启动时,允许处理器的一个核工作,所述核运行高权限操作系统,所述处理器的其他核处于休眠状态;步骤2,所述工作的核进入正常工作状态后,写入TPM函数,形成用以实现TPM的功能的TPM模拟器;步骤3,所述处于休眠状态的核开始工作运行普通操作系统,由所述高权限操作系统为所述普通操作系统的启动提供TPM安全服务。本发明能够在系统中不存在TPM安全芯片的情况下,为系统的启动及后续应用的加载提供可信服务的能力。
-
公开(公告)号:CN116126553A
公开(公告)日:2023-05-16
申请号:CN202211689339.8
申请日:2022-12-27
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于编排执行的信息获取方法,包括:根据对目标信源的多层树状采集需求生成任务树,编排该任务树的初始配置;将该初始配置放入任务队列;由原子采集器获取该初始配置,根据该初始配置生成根采集任务;执行该根采集任务,生成该根采集任务的子任务的任务配置,将该任务配置放入任务队列,并输出该根采集任务的采集结果;由原子采集器获取任务配置,根据该任务配置生成当前任务;执行该当前任务,生成该当前任务的子任务的任务配置,将该任务配置放入任务队列,并输出该当前任务的采集结果;重复本步骤,直到完成该任务树。本发明还提出一种基于编排执行的信息获取系统,以及一种用于实现基于编排执行的信息获取的数据处理装置。
-
公开(公告)号:CN109815387B
公开(公告)日:2021-11-19
申请号:CN201811637869.1
申请日:2018-12-29
Applicant: 中国科学院计算技术研究所
IPC: G06F16/953
Abstract: 本发明涉及一种基于脚本的网页采集服务方法和系统,包括:客户端,服务前端和服务执行单元,服务执行单元处理服务请求的过程包括:根据脚本队列中采集脚本的顺序,调度脚本队列中位于队首的采集脚本作为执行脚本;解释执行执行脚本,当执行脚本执行到调用函数时,判断调用函数是否为采集函数,若是,则将采集网页的任务发给网页采集模块,对执行脚本指定的网址进行网页采集处理,得到网址的网页信息作为采集函数的返回值,否则执行调用函数调用的功能,并将执行结果作为调用函数的返回值。由此本发明可通过调用服务的方式处理复杂的网页采集任务,适应性更强。
-
公开(公告)号:CN110557428A
公开(公告)日:2019-12-10
申请号:CN201910646748.1
申请日:2019-07-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于Kubernetes的脚本解释型服务代理方法和系统,该方法包括:设置一客户端,用于生成代理脚本并作为服务请求;设置一Kubernetes系统,并在该Kubernetes系统中部署若干服务;设置一服务执行单元,用于处理该服务请求,并返回处理结果至该客户端;该方法包括:函数绑定步骤,该服务执行单元根据一预设协议,定期查询API SERVER,获取该Kubernetes系统中的服务,并为每一服务绑定一函数名称;服务调用步骤,该服务执行单元接收并解析执行该客户端发送的该服务请求中的代理脚本,并在执行脚本的过程中,依据函数名调用Kubernetes中的服务。本发明有效解决了复杂服务以及远程和不可靠环境下的访问问题。
-
公开(公告)号:CN102609460A
公开(公告)日:2012-07-25
申请号:CN201210011178.7
申请日:2012-01-13
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供了一种基于用户分类的微博客数据采集方法。该方法首先初始化用户进行用户分类的数据;对获得的用户特征进行提取,取得可用于进行用户确定的特征数据;对提取出的数据进行过滤,多过滤后的数据根据特征之间的关系进行用户类型确定;对不同类别的用户采用不同的策略进行数据采集。该方法能够保证微博客数据采集的完整性和实时性,并能进行自适应的调整,以适应网络数据的变化。
-
公开(公告)号:CN117332143A
公开(公告)日:2024-01-02
申请号:CN202311095566.2
申请日:2023-08-29
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9535 , G06F16/9536 , G06Q50/00
Abstract: 本发明提出一种网络用户心理测量基础数据补充采集方法、装置,方法包含:筛选出目标用户,并从所述目标用户的评论中筛选出目标评论作为评论对象;针对所述目标评论,生成对应的交互信息;依据所述目标用户的属性,预测最佳交互时间;将所述交互信息在所述最佳交互时间发布至所述目标评论下;获取目标用户对交互信息的回复评论数据作为补充的用户心理测量基础数据。该方法能够有效补充用户的心理测量基础数据,该数据可输入到心理识别模型,提升识别准确度。
-
公开(公告)号:CN116431329A
公开(公告)日:2023-07-14
申请号:CN202310226362.1
申请日:2023-03-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种GPU集群调度方法、装置,所述方法包括:租户提交任务至等待队列;获取集群中各个计算节点上的任务信息;从所述等待队列中选取满足第一预设条件的任务;依据所述任务与计算节点的亲和性,将满足第一预设条件的所述任务调度至选取满足第二预设条件的所述计算节点。该方法在提高GPU集群资源利用率的同时,兼顾多租户的公平性。
-
-
-
-
-
-
-
-
-