-
公开(公告)号:CN109815387A
公开(公告)日:2019-05-28
申请号:CN201811637869.1
申请日:2018-12-29
Applicant: 中国科学院计算技术研究所
IPC: G06F16/953
Abstract: 本发明涉及一种基于脚本的网页采集服务方法和系统,包括:客户端,服务前端和服务执行单元,服务执行单元处理服务请求的过程包括:根据脚本队列中采集脚本的顺序,调度脚本队列中位于队首的采集脚本作为执行脚本;解释执行执行脚本,当执行脚本执行到调用函数时,判断调用函数是否为采集函数,若是,则将采集网页的任务发给网页采集模块,对执行脚本指定的网址进行网页采集处理,得到网址的网页信息作为采集函数的返回值,否则执行调用函数调用的功能,并将执行结果作为调用函数的返回值。由此本发明可通过调用服务的方式处理复杂的网页采集任务,适应性更强。
-
公开(公告)号:CN102110197B
公开(公告)日:2013-04-03
申请号:CN200910243914.X
申请日:2009-12-25
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及多核处理器的计算环境中实现TMP的方法及其系统,包括:步骤1,计算环境中的节点在启动时,允许处理器的一个核工作,所述核运行高权限操作系统,所述处理器的其他核处于休眠状态;步骤2,所述工作的核进入正常工作状态后,写入TPM函数,形成用以实现TPM的功能的TPM模拟器;步骤3,所述处于休眠状态的核开始工作运行普通操作系统,由所述高权限操作系统为所述普通操作系统的启动提供TPM安全服务。本发明能够在系统中不存在TPM安全芯片的情况下,为系统的启动及后续应用的加载提供可信服务的能力。
-
公开(公告)号:CN110557428B
公开(公告)日:2021-08-24
申请号:CN201910646748.1
申请日:2019-07-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于Kubernetes的脚本解释型服务代理方法和系统,该方法包括:设置一客户端,用于生成代理脚本并作为服务请求;设置一Kubernetes系统,并在该Kubernetes系统中部署若干服务;设置一服务执行单元,用于处理该服务请求,并返回处理结果至该客户端;该方法包括:函数绑定步骤,该服务执行单元根据一预设协议,定期查询API SERVER,获取该Kubernetes系统中的服务,并为每一服务绑定一函数名称;服务调用步骤,该服务执行单元接收并解析执行该客户端发送的该服务请求中的代理脚本,并在执行脚本的过程中,依据函数名调用Kubernetes中的服务。本发明有效解决了复杂服务以及远程和不可靠环境下的访问问题。
-
公开(公告)号:CN116431279A
公开(公告)日:2023-07-14
申请号:CN202310257459.9
申请日:2023-03-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种面向GPU碎片资源的容器调度方法、装置,所述方法包括:获取GPU集群中待调度容器的资源需求;根据所述待调度容器的资源需求对所述GPU集群中的所有节点进行预选,获得预选节点列表;依据所述预选节点列表,确定出所述待调度容器的目标节点。该方法通过增强调度器对GPU碎片资源利用,提高了GPU集群的资源利用率。
-
公开(公告)号:CN104182482B
公开(公告)日:2018-05-22
申请号:CN201410382359.X
申请日:2014-08-06
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种新闻列表页判断方法及筛选新闻列表页的方法,该方法包括获取网页,判断所述网页是否为新闻网页;如果所述网页不是新闻网页,则在所述网页中采集子网页对各个子网页重复本判定流程;如果所述网页是新闻网页并且被判定为频道内新闻网页,则判断所述网页的父网页是否为新闻网页;如果所述父网页不是新闻网页,则记录所述网页与所述父网页的关联信息;以及根据所述关联信息判断出新闻列表页等步骤。利用本发明提供的方法找到新闻列表页之后,现有的新闻采集器可以直接将新闻列表页作为起始页采集新闻内容,从而提高新闻数据的采集效率。
-
公开(公告)号:CN102609460B
公开(公告)日:2015-02-04
申请号:CN201210011178.7
申请日:2012-01-13
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供了一种基于用户分类的微博客数据采集方法。该方法首先初始化用户进行用户分类的数据;对获得的用户特征进行提取,取得可用于进行用户确定的特征数据;对提取出的数据进行过滤,多过滤后的数据根据特征之间的关系进行用户类型确定;对不同类别的用户采用不同的策略进行数据采集。该方法能够保证微博客数据采集的完整性和实时性,并能进行自适应的调整,以适应网络数据的变化。
-
公开(公告)号:CN104182482A
公开(公告)日:2014-12-03
申请号:CN201410382359.X
申请日:2014-08-06
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F17/30873 , G06F17/30867 , G06F17/30876
Abstract: 本发明提供一种新闻列表页判断方法及筛选新闻列表页的方法,该方法包括获取网页,判断所述网页是否为新闻网页;如果所述网页不是新闻网页,则在所述网页中采集子网页对各个子网页重复本判定流程;如果所述网页是新闻网页并且被判定为频道内新闻网页,则判断所述网页的父网页是否为新闻网页;如果所述父网页不是新闻网页,则记录所述网页与所述父网页的关联信息;以及根据所述关联信息判断出新闻列表页等步骤。利用本发明提供的方法找到新闻列表页之后,现有的新闻采集器可以直接将新闻列表页作为起始页采集新闻内容,从而提高新闻数据的采集效率。
-
公开(公告)号:CN1787007A
公开(公告)日:2006-06-14
申请号:CN200510130688.6
申请日:2005-12-21
Applicant: 中国科学院计算技术研究所
IPC: G06Q40/00
Abstract: 本发明涉及网络信息处理技术领域,是一种在股评论坛中利用股评人对某只股票发表股评的前后股市行情的变化,来挖掘股评托的方法。本发明从股评论坛中抽取出某段时间内每个股评人的股评,然后以该股评出笼前后相应股票的行情序列为窗口,用股评托行为模式与窗口中的股评行情序列进行匹配,基于匹配的频率计算股评人是股评托的概率。在股评论坛中挖掘股评托,能够帮助个人投资者认清股评论坛中股评托的真面目,帮助证券业的管理者发现危险分子加以预警,甚至清除出行业队伍,从而保证证券市场的健康发展。目前对我国股评托的行为研究几乎没有。
-
-
-
-
-
-
-