一种实现不同数据源之间数据处理的方法及装置

    公开(公告)号:CN103916368B

    公开(公告)日:2017-11-21

    申请号:CN201210593327.5

    申请日:2012-12-31

    Abstract: 本发明提供一种实现不同数据源之间数据处理的方法及装置。所述方法包括:解析用户发出的数据处理命令,其中所述数据处理命令中所涉及的数据包括第一数据源和第二数据源中的数据;根据所述数据处理命令进行任务分解,分解后的所述数据处理命令包括对所述第一数据源中的数据操作的第一命令、对所述第二数据源中的数据操作的第二命令以及对所述第一数据源中的数据和所述第二数据源中的数据组合操作的第三命令;向所述第一数据源下发执行所述第一命令,向所述第二数据源下发执行所述第二命令,并根据所述第一命令和所述第二命令的执行结果,执行所述第三命令。本发明所述方法和装置能够实现不同数据源之间的透明访问,提高数据处理的效率。

    一种分布式互联网行为分析方法、装置及系统

    公开(公告)号:CN103905266A

    公开(公告)日:2014-07-02

    申请号:CN201210581807.X

    申请日:2012-12-27

    Abstract: 本发明公开了一种分布式互联网行为分析方法、装置及系统,通过将个性化较强日志分析装置分布式部署在各省,将共同通用的网页分析装置集中建设。这样,每个日志分析装置可以灵活的选用日志分析方式,避免了在网络上传输海量的日志数据,提高了网络分析的效率,减少了网络分析的时间。同时避免了网页分析装置的重复建设,降低了网络建设成本。

    一种数据处理方法、设备和系统

    公开(公告)号:CN103902614A

    公开(公告)日:2014-07-02

    申请号:CN201210584674.1

    申请日:2012-12-28

    CPC classification number: G06F17/30442 G06F17/30545

    Abstract: 本发明实施例公开了一种数据处理方法、设备和系统,该方法包括:分片服务器接收主服务器转发的数据查询请求,其中携带有用于指示请求读取的数据所在行的key字段和用于指示请求读取的数据所在列的列表字段;所述分片服务器根据所述key字段和列表字段在自身存储的数据中查询对应的列数据,并将查询到的列数据以数组的形式返回给所述主服务器。在本发明中,降低了分布式列存储数据库系统中数据处理的性能消耗,提高了数据处理效率。

    SQL脚本的结构化元数据生成方法及数据地图生成方法

    公开(公告)号:CN102339295B

    公开(公告)日:2014-01-29

    申请号:CN201010238389.5

    申请日:2010-07-23

    Abstract: 本发明公开了一种SQL脚本的结构化元数据生成方法以及数据地图生成方法,其中,该方法包括:根据SQL脚本数据流语义结构生成一组SQL脚本元模型;根据元模型对SQL脚本的数据处理逻辑进行结构化描述;根据数据处理逻辑的结构化描述,生成SQL脚本元数据。本发明可以将SQL脚本的数据转换处理逻辑进行结构化描述,在此基础上提供相应的辅助分析功能和分层数据地图图形展现,从而提供数据链路辅助分析和血统分析、数据地图展现和细节数据处理逻辑图形化展现,解决现有技术中SQL脚本所包含的数据流信息无法在元数据中体现出来,导致元数据的数据加工链路不连贯,无法进行有效的分析的缺陷。

    去隐私化处理方法和装置
    25.
    发明公开

    公开(公告)号:CN103177007A

    公开(公告)日:2013-06-26

    申请号:CN201110434172.6

    申请日:2011-12-22

    Abstract: 本发明公开了一种去隐私化处理方法及装置,其中,该方法包括:在由源数据获取的客户隐私数据之中提取索引字段,调用去隐私化映射关系表;根据去隐私化映射关系表中的映射规则,将索引字段映射为去隐私化映射关系表中的映射编码,完成对客户隐私数据的去隐私化处理。本发明的去隐私化处理方法和装置,去隐私化处理引擎设计在ETL模块中,一方面充分利用ETL模块现有的系统资源,避免占用数据仓库以及数据集市的系统资源;另一方面因为ETL模块是经营分析系统所有数据的统一入口,ETL模块对所有客户隐私数据执行去隐私化处理能够保证所有操作的统一性。

    一种基于云计算的数据挖掘方法、系统及装置

    公开(公告)号:CN102567396A

    公开(公告)日:2012-07-11

    申请号:CN201010616075.4

    申请日:2010-12-30

    Abstract: 本发明公开了一种基于云计算的数据挖掘方法、系统及装置,用以解决现有数据挖掘过程中效率低,无法满足海量数据处理需求的问题。该系统当PDM服务器接收到web服务器拆分后的用户的数据挖掘请求对应的每个子任务后,根据保存的并行算法,确定每个子任务对应的并行作业任务,向云平台集群控制节点发送该并行作业任务,将接收到的云平台集群控制节点返回的挖掘数据进行整合后提供个web服务器。由于在本发明实施例中该数据挖掘的过程通过web方式实现,因此该数据挖掘的方法可以同时为多个用户提供,并且该数据挖掘的过程中基于并行作业任务进行挖掘,因此有效的提高了数据挖掘的效率。

Patent Agency Ranking