-
公开(公告)号:CN102054001A
公开(公告)日:2011-05-11
申请号:CN200910236744.2
申请日:2009-10-28
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种数据挖掘系统中数据预处理的方法、系统及装置,其中,数据预处理对应具有设定执行次序的多个预处理方式,主要技术方案包括:确定数据预处理对应的当前预处理方式;在确定若根据当前预处理方式处理得到的处理结果无需合并并且当前预处理方式不为数据预处理的最后一个预处理方式时,在各操作节点根据当前预处理方式处理待处理数据后,控制各操作节点对得到的处理结果根据当前预处理方式的下一预处理方式进行处理。根据该技术方案,减少了不同节点之间由于待处理数据的读取以及处理结果的写入而需要的传输过程,提高了数据挖掘系统中数据预处理的效率,提高了整个数据挖掘系统的性能。
-
公开(公告)号:CN101799807A
公开(公告)日:2010-08-11
申请号:CN200910077659.6
申请日:2009-02-10
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种异构数据表的合并方法及其系统,本发明方法包括:为多个异构数据表分别分配表标识,并将表标识添加到相应数据表中的所有数据记录;根据设置的关键字字段,将具有相同关键字字段值但具有不同表标识的数据记录合并为新的数据记录,并将所述新的数据记录中的表标识删除;将删除了表标识的数据记录存储到新的数据表中。采用本发明,可实现异构数据表的数据合并处理,并可提高数据合并操作的效率。
-
公开(公告)号:CN101799748A
公开(公告)日:2010-08-11
申请号:CN200910077994.6
申请日:2009-02-06
Applicant: 中国移动通信集团公司
Abstract: 本发明公开了一种确定数据样本的类别的方法及其系统。本发明方法包括:并行执行多个第一Map任务,其中,每个Map任务获取待分类数据样本集中的部分数据样本,计算该部分数据样本中每个数据样本与训练样本集中的训练样本的相似度,并针对每个数据样本取降序排序的前K个相似度所对应的类别;执行Reduce任务,所述Reduce任务分别对每个数据样本的K个相似度所对应的类别进行汇总,将每个数据样本中占多数的类别确定为该数据样本的类别。采用本发明,可提高数据样本分类处理的效率。
-
公开(公告)号:CN106611008B
公开(公告)日:2020-06-12
申请号:CN201510703822.0
申请日:2015-10-26
Applicant: 中国移动通信集团公司
IPC: G06F16/955
Abstract: 本发明公开了一种互联网内容标签的管理方法,包括创建内容标签库,所述方法还包括:获取不同网站对应的第一内容标签树,分别确定各个第一内容标签树所属类别的类别标签;基于所述类别标签将所述第一内容标签树的内容标签与所述内容标签库中的内容标签按预设的匹配规则进行匹配,并依据匹配结果更新所述内容标签库。本发明还公开了一种互联网内容标签的管理装置。
-
公开(公告)号:CN104750690B
公开(公告)日:2018-03-23
申请号:CN201310728889.0
申请日:2013-12-25
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种查询处理方法、装置及系统,包括:查询路由器将待处理的查询请求发送给多个查询引擎;接收每个查询引擎发送的对该查询请求进行处理的预判响应时间,该预判响应时间为查询引擎根据自身对应的存储引擎中存储的数据表的属性信息,预判的通过扫描该数据表对该查询请求进行处理所需的时间;向预判响应时间最小的查询引擎发送对该查询请求的处理指令。采用本发明实施例提供的方案,相比现有技术,提高了对查询的处理效率。
-
公开(公告)号:CN102546730B
公开(公告)日:2016-08-03
申请号:CN201010623339.9
申请日:2010-12-30
Applicant: 中国移动通信集团公司
Inventor: 高丹 , 徐萌 , 邓超 , 江志雄 , 罗治国 , 孙少陵 , 陶涛 , 段云峰 , 何鸿凌 , 谢帆 , 赵静 , 张韬 , 吴明 , 励崖卉 , 王之恒 , 邓青 , 周福伟
IPC: H04L29/08
Abstract: 本发明公开了一种数据处理方法、装置及系统。其中数据处理方法包括:云计算平台将获取的数据进行处理,并将处理后的数据发送至数据处理服务器;所述数据处理服务器将所述云计算平台处理后的数据传输到数据仓库中。本发明的数据处理方法、装置及系统,通过云计算平台对数据进行抽取、处理,数据处理服务器将处理后的数据传输到数据仓库中,提高数据处理量,实现了海量数据处理,并且不会对现有架构进行太多改动,保持云平台的相对独立性,易于改造。云计算平台成本低、投资小、利旧率高,可以缓解系统扩容压力,降低系统成本。
-
公开(公告)号:CN104753712A
公开(公告)日:2015-07-01
申请号:CN201310752991.4
申请日:2013-12-31
Applicant: 中国移动通信集团公司
IPC: H04L12/24
Abstract: 本发明发明涉及通信技术领域,尤其涉及一种告警上报方法、告警上报节点及告警上报系统。本发明的内容包括:告警上报节点将采集到的告警信息发送给同一分组内的主告警上报节点,以使所述主告警上报节点上报所述告警信息;所述告警上报节点在预设时间段内没有接收到所述主告警上报节点发送的响应消息,将所述告警信息发送给同一分组内的从告警上报节点,以使所述从告警上报节点上报所述告警信息。本发明实施例在主告警上报节点故障时,通过同一分组内的从告警上报节点上报告警信息,可保证告警信息的可靠上报。
-
公开(公告)号:CN104699381A
公开(公告)日:2015-06-10
申请号:CN201310666439.3
申请日:2013-12-10
Applicant: 中国移动通信集团公司
Inventor: 高丹
IPC: G06F3/0484
Abstract: 本发明涉及一种输入方式切换方法、输入法系统和电子设备,以解决文字输出效率比较低的问题;提供一种输入方式自动切换方案。本发明实施例的输入方式切换方法包括:确定用户通过键盘输入的字符;在字符的个数值大于第一阈值,确定在当前输入方式下字符对应的文字信息;在文字信息包含英文字母,或者在输入法系统的词库中不存在文字信息中汉字对应词组,针对输入法系统的其他每种输入方式,分别执行:若在该种输入方式下字符对应的文字信息不包含英文字母、且在该种输入方式下文字信息中汉字对应词组存在于输入法系统的词库中,则将该种输入方式作为候选目标输入方式;根据候选目标输入方式,确定目标输入方式,将当前输入方式切换为目标输入方式。
-
公开(公告)号:CN101799748B
公开(公告)日:2013-02-13
申请号:CN200910077994.6
申请日:2009-02-06
Applicant: 中国移动通信集团公司
Abstract: 本发明公开了一种确定数据样本的类别的方法及其系统。本发明方法包括:并行执行多个第一Map任务,其中,每个Map任务获取待分类数据样本集中的部分数据样本,计算该部分数据样本中每个数据样本与训练样本集中的训练样本的相似度,并针对每个数据样本取降序排序的前K个相似度所对应的类别;执行Reduce任务,所述Reduce任务分别对每个数据样本的K个相似度所对应的类别进行汇总,将每个数据样本中占多数的类别确定为该数据样本的类别。采用本发明,可提高数据样本分类处理的效率。
-
公开(公告)号:CN102571321A
公开(公告)日:2012-07-11
申请号:CN201010623542.6
申请日:2010-12-30
Applicant: 中国移动通信集团公司
Abstract: 本发明实施例公开了一种数据加密传输的方法和设备,通过应用本发明实施例所提出的技术方案,在发送端设备和接收端设备上同时设置对称密钥对缓存池,并利用其中的对称密钥信息组进行对称密钥的传输,在发送端设备和接收端设备上的对称密钥对缓存池中保存有相同的对称密钥信息组时,可以节省掉对对称密钥进行分对称解密的时间,提高数据传输的效率。
-
-
-
-
-
-
-
-
-