-
公开(公告)号:CN119443105A
公开(公告)日:2025-02-14
申请号:CN202510039582.2
申请日:2025-01-10
Applicant: 北京市大数据中心
IPC: G06F40/295 , G06N3/096 , G06F16/35 , G06N20/10
Abstract: 本发明提供基于迁移学习模型的实体关系抽取方法、装置、设备及介质,属于数据处理技术领域,获取原始数据,对原始数据进行预处理、标注,生成训练数据集,再构建实体关系;利用机器学习算法在知识图谱中构建实体关系处理任务;构建迁移学习模型,基于迁移学习模型将源域或源任务中的知识迁移学习到目标域或目标任务中,来初始化或辅助目标领域模型的训练;将机器学习算法与迁移学习模型相融合,通过利用源领域丰富的标注数据和领域知识,可以提取出对目标领域有用的特征表示,并将其应用于目标领域的任务中,能够更快地学习到有用的特征,从而提高实体识别和关系抽取等任务的准确率。
-
公开(公告)号:CN119357754A
公开(公告)日:2025-01-24
申请号:CN202411911075.5
申请日:2024-12-24
Applicant: 北京市大数据中心 , 数据堂(北京)科技股份有限公司
IPC: G06F18/24 , G06N3/0455 , G06N3/098
Abstract: 本申请公开了一种联邦数据管控下的基于规则对齐的激励方法及装置,其首先指定联邦数据管控规则,同时从第一联邦节点和第二联邦节点获取用户的行为数据,并采用基于深度学习的数据处理技术对用户行为数据进行时序分析,以分别捕捉到第一联邦节点和第二联邦节点的用户行为特征,进而,通过将第一联邦节点用户行为特征和第二联邦节点用户行为特征分别与联邦数据管控规则进行语义关联分析,从而智能确定联邦节点的激励结果。这样,通过量化用户行为与联邦数据管控规则的一致性来调整联邦学习过程中各节点的权重分配,实现了对联邦学习参与者的公平激励,能够有效促进联邦学习环境中数据资源的高效利用,提高联邦学习的整体性能和隐私性。
-
公开(公告)号:CN119248887A
公开(公告)日:2025-01-03
申请号:CN202411784495.1
申请日:2024-12-06
Applicant: 北京市大数据中心 , 数据堂(北京)科技股份有限公司
IPC: G06F16/27 , G06F16/2458 , G06F21/64 , G06F21/62 , G06F18/22
Abstract: 本发明涉及电数字数据处理的领域,尤其是涉及一种基于联邦机制的多主体共治数据协同方法、装置、电子设备及介质,方法包括如下步骤:获取数据信息和预先写入在区块链中的计算模型,通过计算模型对数据信息进行计算,获得计算结果,并生成数据目录,将数据目录写入区块链;区块链中的分析模型对数据目录进行分析,发掘数据目录的关系和隐性关系;通过切片算法将数据目录中的数据进行数据切片,数据切片后的数据存储在切片数据集中,应用算法获取切片数据集中的数据重新整合。本发明兼顾隐私保护、数据安全与流通效率的分布式数据治理范式,构建了面向跨域场景的体系化治理框架,实现了对“数据孤岛”的数据的高效利用。
-
公开(公告)号:CN118070337A
公开(公告)日:2024-05-24
申请号:CN202410302564.4
申请日:2024-03-15
Applicant: 北京市大数据中心 , 中电长城网际系统应用有限公司
IPC: G06F21/62 , G06F18/213
Abstract: 本申请公开一种隐私信息的度量方法、设备、介质和产品,涉及信息安全技术领域。方法包括:获取客户端发送的目标数据;确定目标数据对应的隐私参数,隐私参数是表征目标数据中包括的隐私信息的顺序特征、数量特征和权重特征中的至少一种的参数;根据目标数据对应的隐私参数,计算获得隐私熵;使用隐私熵度量目标数据包含的隐私信息的程度。根据本申请中的实施例,能够提升用户的隐私安全性。
-
公开(公告)号:CN117994538A
公开(公告)日:2024-05-07
申请号:CN202410070203.1
申请日:2024-01-17
Applicant: 北京市大数据中心
Abstract: 本申请公开一种非结构化数据的管理方法、系统、装置及存储介质,用于提高图像的标注效率。本申请发明包括:基于人工标注的图像集获取标注任务集合;确定标注任务集合中每个任务的特征集;在待标注图像上建立与目标任务相关联的虚拟标注;确定每个目标任务中的特征与特征集的相似度;设置预设阈值,将相似度大于或等于预设阈值对应的目标任务关联的虚拟标注实体映射到待标注图像上,将相似度小于预设阈值对应的第二任务关联的虚拟标注附加上审核浮窗;将待标注图像送由审核人员审核;判断审核人员是否点击审核浮窗的确定框,若是,将第二任务的虚拟标注映射到待标注图像上;当审核人员点击审核浮窗的否定框时,取消第二任务及其关联的虚拟标注。
-
公开(公告)号:CN117786768A
公开(公告)日:2024-03-29
申请号:CN202410199786.8
申请日:2024-02-23
Applicant: 数据堂(北京)科技股份有限公司 , 北京市大数据中心
Abstract: 本发明提供了一种联邦数据学习的安全参数交换方法,属于数据安全技术领域。本发明采用第三方签名保护参数服务器的参数汇聚安全,目前还没有保护服务器的专利,本发明创新提出通过对参数服务器中的参数在读写、落盘和网络传输三个方面进行监控,来确保参数服务器进行安全的明文参数汇聚。本发明还通过采用RSA算法保护不安全环境下密码和参数安全通信,确保通信链路的安全,使链路劫持失效。本发明还采用加密强度可配置的训练节点参数加密措施,针对不同的训练节点的采用不同的加密强度,满足实际应用的各种安全场景要求,对训练节点进行安全保护。
-
公开(公告)号:CN117708658A
公开(公告)日:2024-03-15
申请号:CN202410161414.6
申请日:2024-02-05
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
Abstract: 本公开提出一种数据实体间关系传递性质的确定方法、装置和设备,该方法包括:获取训练数据集合,构建目标关联关系的实体关联度评分模型,根据实体关联度评分模型构建惩罚函数,根据训练数据集合对惩罚函数进行模型训练以得到目标单位向量,根据实体关联度评分模型或目标单位向量确定第一数据实体与多个候选数据实体之间的识别结果,其中,识别结果用于指示第一数据实体与候选数据实体之间是否存在目标关联关系。由此,能够更准确、更全面、更深入地识别数据实体间关联关系,充分挖掘城市级大数据聚合价值。
-
公开(公告)号:CN115866059B
公开(公告)日:2023-08-01
申请号:CN202310058530.0
申请日:2023-01-13
Applicant: 北京微芯区块链与边缘计算研究院 , 北京市大数据中心
IPC: H04L67/60 , H04L67/61 , H04L67/104
Abstract: 本发明公开了一种区块链节点调度方法和装置,属于区块链技术领域。其方法包括发送节点创建请求至区块链节点管理模块;区块链节点管理模块发送节点调度请求至区块链节点调度模块;区块链节点调度模块接收节点调度请求,并通过规则运算,获取节点部署的资源信息,并将节点部署的资源信息返回给区块链节点管理模块;区块链节点管理模块根据节点与资源的对应管理,发送节点部署请求至区块链节点部署模块;区块链节点部署模块根据节点部署请求将节点部署到相应的服务器上,并将节点部署结果返回给区块链节点管理模块。通过本发明解决了节点部署时,系统资源没有得到充分利用或剩余资源不足的问题。
-
公开(公告)号:CN115952150A
公开(公告)日:2023-04-11
申请号:CN202211610209.0
申请日:2022-12-14
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/21 , G06F16/22 , G06F16/2458
Abstract: 本申请涉及一种多源异构的数据融合方法及装置,涉及数据处理技术领域,方法包括:获取待融合数据,对待融合数据中各字段赋予不同的权重算子,根据预先设定的数据关联规则和待融合数据中各字段的权重算子对待融合数据进行关联融合,得到待处理数据,最后对待处理数据进行标准化处理。本申请中综合考虑多种因素,对待融合数据中各字段赋予不同的权重算子,如对预期准确度高的字段赋予相对较高的权重算子,对预期准确度低的字段赋予相对较低的权重算子,在进行关联融合时使融合数据对数据的紧密依赖程度更高,从而得到的融合数据更加准确、可靠。
-
公开(公告)号:CN113486368A
公开(公告)日:2021-10-08
申请号:CN202110663306.5
申请日:2021-06-15
Applicant: 北京市大数据中心 , 北京数牍科技有限公司
Abstract: 本发明涉及信息安全技术领域,特别是指一种基于区块链技术的输入数据可信性验证方法及装置,方法包括:获取所有参与者节点的实际数据,通过智能合约分别进行加密,将加密后的实际数据存储至区块链;对输入数据进行加密,将加密后的输入数据分享给给所有参与者节点;对每个秘密份额分别进行加密,并将加密后的秘密份额广播给所有参与者节点;获取所有参与者节点接收到的加密后的秘密份额,通过智能合约对加密后的秘密份额进行数据恢复,得到待验证数据;根据待验证数据与区块链中的加密后的实际数据,通过智能合约对输入数据进行验证。采用本发明,可以验证输入数据的可信性,确保数据真实可信,避免参与方输入错误数据这一现象出现。
-
-
-
-
-
-
-
-
-