-
公开(公告)号:CN119248887A
公开(公告)日:2025-01-03
申请号:CN202411784495.1
申请日:2024-12-06
Applicant: 北京市大数据中心 , 数据堂(北京)科技股份有限公司
IPC: G06F16/27 , G06F16/2458 , G06F21/64 , G06F21/62 , G06F18/22
Abstract: 本发明涉及电数字数据处理的领域,尤其是涉及一种基于联邦机制的多主体共治数据协同方法、装置、电子设备及介质,方法包括如下步骤:获取数据信息和预先写入在区块链中的计算模型,通过计算模型对数据信息进行计算,获得计算结果,并生成数据目录,将数据目录写入区块链;区块链中的分析模型对数据目录进行分析,发掘数据目录的关系和隐性关系;通过切片算法将数据目录中的数据进行数据切片,数据切片后的数据存储在切片数据集中,应用算法获取切片数据集中的数据重新整合。本发明兼顾隐私保护、数据安全与流通效率的分布式数据治理范式,构建了面向跨域场景的体系化治理框架,实现了对“数据孤岛”的数据的高效利用。
-
公开(公告)号:CN118070337A
公开(公告)日:2024-05-24
申请号:CN202410302564.4
申请日:2024-03-15
Applicant: 北京市大数据中心 , 中电长城网际系统应用有限公司
IPC: G06F21/62 , G06F18/213
Abstract: 本申请公开一种隐私信息的度量方法、设备、介质和产品,涉及信息安全技术领域。方法包括:获取客户端发送的目标数据;确定目标数据对应的隐私参数,隐私参数是表征目标数据中包括的隐私信息的顺序特征、数量特征和权重特征中的至少一种的参数;根据目标数据对应的隐私参数,计算获得隐私熵;使用隐私熵度量目标数据包含的隐私信息的程度。根据本申请中的实施例,能够提升用户的隐私安全性。
-
公开(公告)号:CN115691137B
公开(公告)日:2024-04-30
申请号:CN202211357946.4
申请日:2022-11-01
Applicant: 北京航空航天大学 , 北京市大数据中心 , 北京市西城区科学技术和信息化局(北京市西城区大数据管理局)
IPC: G08G1/01 , G06Q10/04 , G06Q50/40 , G06N3/0442 , G06N3/08
Abstract: 本发明提供了一种基于因果马尔科夫模型的多模态数据预测方法,属于智能交通技术领域。本发明方法包括:采集研究区域的区域数据和多模态交通数据,将时间点、区域兴趣点和天气信息视为背景特征变量,将区域吸引力因子、自行车需求因子、出租车需求因子、公交车需求因子、交通速度因子视为物理概念变量,将自行车流量、出租车流量、公交车流量、区域速度视为多模态交通数据观测变量,利用因果马尔科夫过程描述多模态交通量的生成过程;利用神经网络求解因果马尔科夫过程,训练搭建的神经网络,用于多模态交通数据观测。本发明能够有效地预测多模态交通流,并提升了预测准确度,可进一步用于指导管理人员制定相关交通诱导策略。
-
公开(公告)号:CN117786768A
公开(公告)日:2024-03-29
申请号:CN202410199786.8
申请日:2024-02-23
Applicant: 数据堂(北京)科技股份有限公司 , 北京市大数据中心
Abstract: 本发明提供了一种联邦数据学习的安全参数交换方法,属于数据安全技术领域。本发明采用第三方签名保护参数服务器的参数汇聚安全,目前还没有保护服务器的专利,本发明创新提出通过对参数服务器中的参数在读写、落盘和网络传输三个方面进行监控,来确保参数服务器进行安全的明文参数汇聚。本发明还通过采用RSA算法保护不安全环境下密码和参数安全通信,确保通信链路的安全,使链路劫持失效。本发明还采用加密强度可配置的训练节点参数加密措施,针对不同的训练节点的采用不同的加密强度,满足实际应用的各种安全场景要求,对训练节点进行安全保护。
-
公开(公告)号:CN117708658A
公开(公告)日:2024-03-15
申请号:CN202410161414.6
申请日:2024-02-05
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
Abstract: 本公开提出一种数据实体间关系传递性质的确定方法、装置和设备,该方法包括:获取训练数据集合,构建目标关联关系的实体关联度评分模型,根据实体关联度评分模型构建惩罚函数,根据训练数据集合对惩罚函数进行模型训练以得到目标单位向量,根据实体关联度评分模型或目标单位向量确定第一数据实体与多个候选数据实体之间的识别结果,其中,识别结果用于指示第一数据实体与候选数据实体之间是否存在目标关联关系。由此,能够更准确、更全面、更深入地识别数据实体间关联关系,充分挖掘城市级大数据聚合价值。
-
公开(公告)号:CN115952150A
公开(公告)日:2023-04-11
申请号:CN202211610209.0
申请日:2022-12-14
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/21 , G06F16/22 , G06F16/2458
Abstract: 本申请涉及一种多源异构的数据融合方法及装置,涉及数据处理技术领域,方法包括:获取待融合数据,对待融合数据中各字段赋予不同的权重算子,根据预先设定的数据关联规则和待融合数据中各字段的权重算子对待融合数据进行关联融合,得到待处理数据,最后对待处理数据进行标准化处理。本申请中综合考虑多种因素,对待融合数据中各字段赋予不同的权重算子,如对预期准确度高的字段赋予相对较高的权重算子,对预期准确度低的字段赋予相对较低的权重算子,在进行关联融合时使融合数据对数据的紧密依赖程度更高,从而得到的融合数据更加准确、可靠。
-
公开(公告)号:CN113434880A
公开(公告)日:2021-09-24
申请号:CN202110726139.4
申请日:2021-06-29
Applicant: 北京市大数据中心 , 北京数牍科技有限公司
Abstract: 本发明公开了一种面向多层级区块链政务数据的高效访问方法与系统,属于数据安全共享技术领域。该方法由多节点操控的访问系统实现,访问系统包括:创建层级结构进行系统初始化并设置属性集的技术服务平台、对数据进行双层加密的政务部门节点以及对数据提出访问的联盟成员节点;该方法基于区块链和属性加密技术,能够保证不同层级的政务部门节点进行高效的数据上链存储与安全访问操作,同时将数据的相关操作记录留存在区块链上。基于区块链技术的分布式信任特性,实现政务数据的时效性、不可篡改性、可溯源性。属性加密技术使用属性集来描述用户身份,同时使用解密策略来定义访问权限,从而实现政务数据的细粒度访问,满足多层级的数据访问要求。
-
公开(公告)号:CN119418142B
公开(公告)日:2025-05-16
申请号:CN202510026855.X
申请日:2025-01-08
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
Abstract: 本申请公开了一种基于深度学习的多模态数据特征处理方法、系统及介质,主要涉及多模态数据技术领域,用以解决由于传统技术无法识别多种类型的数据图像,进而无法在用户查找数据时提供多类型数据图像的问题。包括:获取各个类型的数据图像,将数据图像转化为结构化数据,确定对应的特征提取算法,获得特征数据;根据对齐因子,获取同属于相同对齐因子的特征数据,拼接成一个特征向量,获得降维后的数据矩阵;通过降维后的数据矩阵和对应的标签数据,训练预设深度学习模型;根据用户检索信息对应的降维后的数据矩阵;将降维后的数据矩阵作为训练好的预设深度学习模型的输入,获得标签数据;进而获取标签数据对应的各个类型的数据图像。
-
公开(公告)号:CN119378495B
公开(公告)日:2025-04-18
申请号:CN202411942600.X
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F40/16 , G06F40/194 , G06F40/30 , G06N3/0455
Abstract: 本发明提出的一种数据目录匹配优化与生成方法、系统、装置及介质,属于数据处理技术领域。所述方法包括:获取待治理的文本数据,形成待优化数据和资源数据,并进行数据预处理;使用SBERT模型对预处理后的数据进行向量化处理,生成句子的嵌入向量;通过对句子的嵌入向量之间进行相似度度量,识别出相关的内容,基于相似度度量结果推荐数据目录项;基于推荐的数据目录项,进行质量校验和反馈。本发明通过对系统自定义文本数据以及数据目录文本的向量化处理并通过SBERT模型进行相似度计算以及智能化推荐,实现了对复杂信息系统目录匹配结果的完善与优化。
-
公开(公告)号:CN119418142A
公开(公告)日:2025-02-11
申请号:CN202510026855.X
申请日:2025-01-08
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
Abstract: 本申请公开了一种基于深度学习的多模态数据特征处理方法、系统及介质,主要涉及多模态数据技术领域,用以解决由于传统技术无法识别多种类型的数据图像,进而无法在用户查找数据时提供多类型数据图像的问题。包括:获取各个类型的数据图像,将数据图像转化为结构化数据,确定对应的特征提取算法,获得特征数据;根据对齐因子,获取同属于相同对齐因子的特征数据,拼接成一个特征向量,获得降维后的数据矩阵;通过降维后的数据矩阵和对应的标签数据,训练预设深度学习模型;根据用户检索信息对应的降维后的数据矩阵;将降维后的数据矩阵作为训练好的预设深度学习模型的输入,获得标签数据;进而获取标签数据对应的各个类型的数据图像。
-
-
-
-
-
-
-
-
-