一种数据挖掘系统中数据预处理的方法、系统及装置

    公开(公告)号:CN102054001A

    公开(公告)日:2011-05-11

    申请号:CN200910236744.2

    申请日:2009-10-28

    Abstract: 本发明公开了一种数据挖掘系统中数据预处理的方法、系统及装置,其中,数据预处理对应具有设定执行次序的多个预处理方式,主要技术方案包括:确定数据预处理对应的当前预处理方式;在确定若根据当前预处理方式处理得到的处理结果无需合并并且当前预处理方式不为数据预处理的最后一个预处理方式时,在各操作节点根据当前预处理方式处理待处理数据后,控制各操作节点对得到的处理结果根据当前预处理方式的下一预处理方式进行处理。根据该技术方案,减少了不同节点之间由于待处理数据的读取以及处理结果的写入而需要的传输过程,提高了数据挖掘系统中数据预处理的效率,提高了整个数据挖掘系统的性能。

    一种确定数据样本类别的方法及其系统

    公开(公告)号:CN101799748A

    公开(公告)日:2010-08-11

    申请号:CN200910077994.6

    申请日:2009-02-06

    Abstract: 本发明公开了一种确定数据样本的类别的方法及其系统。本发明方法包括:并行执行多个第一Map任务,其中,每个Map任务获取待分类数据样本集中的部分数据样本,计算该部分数据样本中每个数据样本与训练样本集中的训练样本的相似度,并针对每个数据样本取降序排序的前K个相似度所对应的类别;执行Reduce任务,所述Reduce任务分别对每个数据样本的K个相似度所对应的类别进行汇总,将每个数据样本中占多数的类别确定为该数据样本的类别。采用本发明,可提高数据样本分类处理的效率。

    一种互联网内容标签的管理方法及装置

    公开(公告)号:CN106611008B

    公开(公告)日:2020-06-12

    申请号:CN201510703822.0

    申请日:2015-10-26

    Abstract: 本发明公开了一种互联网内容标签的管理方法,包括创建内容标签库,所述方法还包括:获取不同网站对应的第一内容标签树,分别确定各个第一内容标签树所属类别的类别标签;基于所述类别标签将所述第一内容标签树的内容标签与所述内容标签库中的内容标签按预设的匹配规则进行匹配,并依据匹配结果更新所述内容标签库。本发明还公开了一种互联网内容标签的管理装置。

    一种查询处理方法、装置及系统

    公开(公告)号:CN104750690B

    公开(公告)日:2018-03-23

    申请号:CN201310728889.0

    申请日:2013-12-25

    Abstract: 本发明公开了一种查询处理方法、装置及系统,包括:查询路由器将待处理的查询请求发送给多个查询引擎;接收每个查询引擎发送的对该查询请求进行处理的预判响应时间,该预判响应时间为查询引擎根据自身对应的存储引擎中存储的数据表的属性信息,预判的通过扫描该数据表对该查询请求进行处理所需的时间;向预判响应时间最小的查询引擎发送对该查询请求的处理指令。采用本发明实施例提供的方案,相比现有技术,提高了对查询的处理效率。

    一种告警上报方法、告警上报节点及告警上报系统

    公开(公告)号:CN104753712A

    公开(公告)日:2015-07-01

    申请号:CN201310752991.4

    申请日:2013-12-31

    Abstract: 本发明发明涉及通信技术领域,尤其涉及一种告警上报方法、告警上报节点及告警上报系统。本发明的内容包括:告警上报节点将采集到的告警信息发送给同一分组内的主告警上报节点,以使所述主告警上报节点上报所述告警信息;所述告警上报节点在预设时间段内没有接收到所述主告警上报节点发送的响应消息,将所述告警信息发送给同一分组内的从告警上报节点,以使所述从告警上报节点上报所述告警信息。本发明实施例在主告警上报节点故障时,通过同一分组内的从告警上报节点上报告警信息,可保证告警信息的可靠上报。

    一种输入方式切换方法、输入法系统和电子设备

    公开(公告)号:CN104699381A

    公开(公告)日:2015-06-10

    申请号:CN201310666439.3

    申请日:2013-12-10

    Inventor: 高丹

    Abstract: 本发明涉及一种输入方式切换方法、输入法系统和电子设备,以解决文字输出效率比较低的问题;提供一种输入方式自动切换方案。本发明实施例的输入方式切换方法包括:确定用户通过键盘输入的字符;在字符的个数值大于第一阈值,确定在当前输入方式下字符对应的文字信息;在文字信息包含英文字母,或者在输入法系统的词库中不存在文字信息中汉字对应词组,针对输入法系统的其他每种输入方式,分别执行:若在该种输入方式下字符对应的文字信息不包含英文字母、且在该种输入方式下文字信息中汉字对应词组存在于输入法系统的词库中,则将该种输入方式作为候选目标输入方式;根据候选目标输入方式,确定目标输入方式,将当前输入方式切换为目标输入方式。

    一种确定数据样本类别的方法及其系统

    公开(公告)号:CN101799748B

    公开(公告)日:2013-02-13

    申请号:CN200910077994.6

    申请日:2009-02-06

    Abstract: 本发明公开了一种确定数据样本的类别的方法及其系统。本发明方法包括:并行执行多个第一Map任务,其中,每个Map任务获取待分类数据样本集中的部分数据样本,计算该部分数据样本中每个数据样本与训练样本集中的训练样本的相似度,并针对每个数据样本取降序排序的前K个相似度所对应的类别;执行Reduce任务,所述Reduce任务分别对每个数据样本的K个相似度所对应的类别进行汇总,将每个数据样本中占多数的类别确定为该数据样本的类别。采用本发明,可提高数据样本分类处理的效率。

Patent Agency Ranking