一种基于软件定义的公共互联网接入系统和方法

    公开(公告)号:CN105119787B

    公开(公告)日:2018-10-23

    申请号:CN201510432281.2

    申请日:2015-07-21

    Abstract: 本发明提供一种基于软件定义的公共互联网接入系统和方法,接入系统包括客户端、接入代理模块、网络适配器、用户中心和调度中心;用户通过客户端与用户中心和调度中心连接,同时还通过客户端与接入代理模块连接,接入代理模块通过网络适配器与公共互联网接入资源连接。本发明实现了将互联网变成按需分配的公共基础设施的目标,满足全国任何用户终端、业务系统、云计算平台对的公共互联网接入资源的访问需求;实现了全网数据转发的集中控制和基于软件定义的数据转发,可实现数据包按照预先编排的转发策略转发到全国任意互联网入口;实现了业务系统与物理位置的分离,可以有效解决复杂业务系统分布式跨地域部署建设成本高、维护成本高的问题。

    一种基于Spark计算框架的数据获取方法和装置

    公开(公告)号:CN108536808A

    公开(公告)日:2018-09-14

    申请号:CN201810296682.3

    申请日:2018-04-04

    Abstract: 本发明公开了一种基于Spark计算框架的数据获取方法和装置。该方法包括:在接收到表对象访问请求之后,获取Spark的计算资源信息以及MPP集群中待访问的数据表的数据分布信息;根据计算资源信息和数据分布信息,生成多个Partition;其中,每个Partition对应数据表中的部分数据;通过生成的多个Partition,从MPP集群中获取数据表。本发明充分利用MPP集群的数据存储特性,通过多个Partition,直接从MPP的存储节点快速获取数据集。进一步地,在计算资源充足的情况下,可以对存储节点的数据表进行进一步的拆分,以达到提高并行度,提升数据导入性能的目的。可以根据MPP集群的数据分布情况,优先从本地存储中获取数据,减少数据传输开销、节约网络带宽、减少网络延迟、提高计算性能。

    一种数据持久化方法和装置

    公开(公告)号:CN108519987A

    公开(公告)日:2018-09-11

    申请号:CN201810158889.4

    申请日:2018-02-24

    Abstract: 本发明公开了一种数据持久化方法和装置。该方法包括:从Kafka中的预设Topic内,获取预先被转换为统一数据类型的数据;选择目标存储引擎;通过Flume将所述Topic内的数据加载到所述目标存储引擎,以便对所述数据执行持久化操作;其中,在所述目标存储引擎执行持久化操作之前,将所述数据从统一数据类型转换为所述数据原来的数据类型。本发明提供一种基于Kafka和Flume的支持多存储引擎的数据持久化方法,在本发明中,使用同一数据类型,通过一次数据序列化(转换为统一数据类型)实现了多存储引擎的统一加载,通过一次反序列化(转换为原数据类型),实现多存储引擎的高效数据持久化。

    一种数据共享方法和装置
    84.
    发明公开

    公开(公告)号:CN108512902A

    公开(公告)日:2018-09-07

    申请号:CN201810159206.7

    申请日:2018-02-24

    Abstract: 本发明公开了一种数据共享方法和装置。该方法包括:获取数据源对应的第一元数据和数据目的对应的第二元数据;根据所述第一元数据和所述第二元数据,配置整形流程文件;根据所述第一元数据、所述第二元数据、所述整形流程文件以及预先配置的数据传输路径,生成共享场景配置文件;根据所述共享场景配置文件传输数据,实现所述数据源和所述数据目之间的数据共享。本发明通过简单配置便可构建数据共享的快速传输通道,在传输通道中,可根据元数据定义及整形流程进行自动整形,数据规范化,可以对多源数据灵活整形,使数据共享过程规范化,并且有效提高了数据共享方案的通用性和传输效率。

    一种面向SparkSql的HDFS小文件实时合并实现方法

    公开(公告)号:CN108256115A

    公开(公告)日:2018-07-06

    申请号:CN201810142899.9

    申请日:2018-02-11

    Abstract: 本发明提供了一种面向SparkSql的HDFS小文件实时合并的实现方法,属于大数据处理技术领域。定期筛选HDFS中待合并的小文件,对得到的待合并小文件,生成合并小文件的Spark任务,并提交至Yarn上执行;对完成小文件合并的结果信息放置于待替换列表中;结合Zookeeper保持SparkSql在使用合并后文件替换被合并文件时维持正常运行;根据SparkSql实时检索数据库表的情况,在Zookeeper中注册和注销相应数据库表的读状态;在文件替换时,通过网络在SparkSql中进行文件元数据缓存增量更新。本发明可以在保持SparkSql正常运行的情况下,实现实时合并HDFS小文件,有效的提高SparkSql的检索效率,在大数据处理领域具有很强的实用性和应用范围,具有很广泛的应用前景。

    一种基于策略感知的虚拟机迁移方法

    公开(公告)号:CN104050038B

    公开(公告)日:2018-04-10

    申请号:CN201410301165.2

    申请日:2014-06-27

    Abstract: 本发明提供一种基于策略感知的虚拟机迁移方法,该方法包括以下步骤:I、确定安全策略的中间件;II、确定前端服务器和后端服务器的资源需求和配置需求;III、构建flow安全图;IV、生成可达矩阵;V、增加策略映射函数,实现虚拟机迁移IP地址变更后的安全策略转换;VI、虚拟机迁移。该方法通过在虚拟机迁移过程中加入安全策略迁移感知机制,避免虚拟机迁移导致的策略违反和安全漏洞。

    一种方差优化直方图的构建方法和装置

    公开(公告)号:CN107391560A

    公开(公告)日:2017-11-24

    申请号:CN201710428418.6

    申请日:2017-06-08

    Inventor: 史亮 王勇 张鸿

    CPC classification number: G06F16/9024

    Abstract: 本发明提供了一种方差优化直方图的构建方法和装置,该方法按内存大小和查询精度设定样本数目K和直方图桶的个数B,有新元素出现时,为使样本数目保持在K,以在线数据采样方法优化内存空间的数据样本;根据优化的内存空间数据样本,动态构建方差优化直方图;该装置包括优化单元和构建单元。本发明提供的技术方案降低了数据规模与分布特征的影响,能有效减少数据倾斜或数据分布的不均匀带来的区间检索误差。

    一种识别网络图中关键节点的分布式方法

    公开(公告)号:CN106649893A

    公开(公告)日:2017-05-10

    申请号:CN201510706040.2

    申请日:2015-10-27

    Abstract: 本发明涉及一种识别网络图中关键节点的分布式方法,包括:采用点切分方式将网络图切分到n台机器上;选择工作节点,分别对所述工作节点的消息和所述工作节点的后继节点的消息进行初始化;更新所述工作节点的后继节点的消息;确定所述工作节点的后继节点的单点依赖;根据网络图中节点的单点依赖确定节点的桥接中心度,本发明采用Graphlab框架来实现,不仅支持基于消息的编程模型,而且支持共享内存风格的“收集-更新-扩散”模型,能够获得更快的运行速度,并且随着集群规模的扩大,可以支持在更大规模的图中计算关键节点。

Patent Agency Ranking