-
公开(公告)号:CN115686867A
公开(公告)日:2023-02-03
申请号:CN202211514368.0
申请日:2022-11-30
Applicant: 北京市大数据中心
Abstract: 本公开提供了一种基于云计算的数据挖掘方法、装置、系统、设备以及介质,其中,该方法包括:获取待挖掘数据;确定所述待挖掘数据的数据挖掘任务,并将所述数据挖掘任务拆分为多个子任务;其中,每个所述子任务用于对部分待挖掘数据进行数据挖掘处理,且每个所述子任务中包含对应的待挖掘数据的数据挖掘算法;获取所述多个云计算节点的节点配置信息,并基于所述节点配置信息确定与每个所述子任务相匹配的第一云计算节点;通过所述第一云计算节点对所述子任务进行处理,得到数据挖掘结果。
-
公开(公告)号:CN115964450A
公开(公告)日:2023-04-14
申请号:CN202211511652.2
申请日:2022-11-29
Applicant: 北京百度网讯科技有限公司 , 北京市大数据中心
Abstract: 本公开提供了一种地图瓦片预览方法、装置、电子设备及介质,涉及数据处理技术领域,尤其涉及地图导航、大数据技术领域。具体实现方案为:接收第一终端发送的瓦片预览请求,其中瓦片预览请求包括目标瓦片在目标地图中的目标位置,以及目标地图的目标切分方式标识,目标地图为用户上传的地图。然后在预先存储的各切分方式标识中存在目标切分方式标识时,根据各切分方式标识与定位算法标识之间的预设对应关系,确定目标切分方式标识对应的目标定位算法标识,并获取目标定位算法。之后利用目标定位算法,定位目标瓦片的存储路径,并获取目标瓦片,并向第一终端返回目标瓦片,以使得第一终端显示目标瓦片。从而实现了为用户上传的地图提供预览功能。
-
公开(公告)号:CN115935977A
公开(公告)日:2023-04-07
申请号:CN202211409921.4
申请日:2022-11-10
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F40/289 , G06F40/284 , G06F40/295 , G06F18/22
Abstract: 本公开提出一种文本主题识别方法、装置及电子设备。该文本主题识别方法包括:获取待识别文本,并对待识别文本进行分词处理,得到第一候选词;将第一候选词与分词词典中的第二候选词进行匹配;从匹配失败的第一候选词中,确定第一主题词;从匹配成功的第一候选词中,确定与知识库中的关键词相匹配的第一候选词为第二主题词;基于第一主题词和第二主题词,确定待识别文本的主题。在文本中包括新型词汇时,本公开能够对新型词汇进行识别,并提取到准确的文本主题。
-
公开(公告)号:CN117040848A
公开(公告)日:2023-11-10
申请号:CN202311008675.6
申请日:2023-08-10
Applicant: 北京市大数据中心
IPC: H04L9/40
Abstract: 本发明公开了一种基于哈希运算的数据一致性校验方法及系统,涉及数据处理技术领域。包括:原始数据提供者S将原始数据D1上传至一致性校验平台P;一致性校验平台P对原始数据D1进行计算,形成原始数据一致性信息矩阵M1;原始数据提供者S生成拷贝数据D2,并将拷贝数据D2以及原始数据一致性信息矩阵M1发送至数据使用者R;数据使用者R登录到一致性校验平台P,计算拷贝数据D2的拷贝数据一致性信息矩阵M2,并通过一致性校验平台P对原始数据一致性信息矩阵M1以及拷贝数据一致性信息矩阵M2进行比较,得到一致性校验结果。本发明能够通过哈希值记录数据的位置信息和数字信息,方便地比较原始数据和拷贝数据的一致性。
-
公开(公告)号:CN116910042A
公开(公告)日:2023-10-20
申请号:CN202310771013.8
申请日:2023-06-28
Applicant: 北京旷视科技有限公司 , 北京市大数据中心
IPC: G06F16/215 , G06F40/186 , G06F18/22
Abstract: 本申请实施例提供了一种数据清洗方法、设备、介质及程序产品,旨在实现对多种类的目标数据的数据清洗功能。所述方法包括:接收目标数据;确定所述目标数据所对应的目标模板,所述目标模板用于编辑所述目标数据;确定所述目标模板所对应的第一校验配置信息;根据所述第一校验配置信息,对所述目标数据进行数据清洗。
-
公开(公告)号:CN115658325A
公开(公告)日:2023-01-31
申请号:CN202211444453.4
申请日:2022-11-18
Applicant: 北京市大数据中心
Abstract: 本公开提供了一种数据处理方法、装置、多核处理器、电子设备以及介质,其中,该方法包括:获取待处理的多媒体数据,并确定所述多媒体数据的数据处理任务;其中,所述数据处理任务包含多个子任务;在多个功能模块中确定与所述数据处理任务相匹配的多个目标功能模块,并确定所述多个目标功能模块之间的模块层级信息;其中,所述模块层级信息用于指示各目标功能模块对所述多个子任务的处理顺序,每个所述目标功能模块用于处理一个子任务;通过所述多个目标功能模块按照所述模块层级信息处理所述多个子任务中的相匹配子任务,并基于任务处理结果确定所述多媒体数据的数据处理结果。
-
-
-
-
-