-
公开(公告)号:CN113486368B
公开(公告)日:2025-02-14
申请号:CN202110663306.5
申请日:2021-06-15
Applicant: 北京市大数据中心 , 北京数牍科技有限公司
Abstract: 本发明涉及信息安全技术领域,特别是指一种基于区块链技术的输入数据可信性验证方法及装置,方法包括:获取所有参与者节点的实际数据,通过智能合约分别进行加密,将加密后的实际数据存储至区块链;对输入数据进行加密,将加密后的输入数据分享给给所有参与者节点;对每个秘密份额分别进行加密,并将加密后的秘密份额广播给所有参与者节点;获取所有参与者节点接收到的加密后的秘密份额,通过智能合约对加密后的秘密份额进行数据恢复,得到待验证数据;根据待验证数据与区块链中的加密后的实际数据,通过智能合约对输入数据进行验证。采用本发明,可以验证输入数据的可信性,确保数据真实可信,避免参与方输入错误数据这一现象出现。
-
公开(公告)号:CN119357378A
公开(公告)日:2025-01-24
申请号:CN202411301360.5
申请日:2024-09-18
Applicant: 北京市大数据中心
IPC: G06F16/335 , G06F40/279 , G06F18/214 , G06N3/0499 , G06N3/096
Abstract: 本发明属于企业关系抽取技术领域,具体提供一种基于领域自适应的迁移学习实体关系抽取方法、装置、设备及存储介质,所述方法包括:选择一个或多个源领域;采用深度学习模型在选定的源领域上进行预训练,学习源领域内的已标注企业关系数据集;选择具有未标注或部分标注的企业关系数据的目标领域,使用领域自适应算法调整预训练的模型参数,适应目标领域的数据特征和分布;在完成目标领域数据特征和分布的领域适应后,部署迁移学习算法对调整后的深度学习模型进行微调;验证微调后深度学习模型在目标领域的性能;在目标领域中应用经过微调的深度学习模型识别和抽取文本中的企业关系及其关系。确保了抽取的企业关系及其关系数据的高质量和一致性。
-
公开(公告)号:CN117786768B
公开(公告)日:2024-05-14
申请号:CN202410199786.8
申请日:2024-02-23
Applicant: 数据堂(北京)科技股份有限公司 , 北京市大数据中心
Abstract: 本发明提供了一种联邦数据学习的安全参数交换方法,属于数据安全技术领域。本发明采用第三方签名保护参数服务器的参数汇聚安全,目前还没有保护服务器的专利,本发明创新提出通过对参数服务器中的参数在读写、落盘和网络传输三个方面进行监控,来确保参数服务器进行安全的明文参数汇聚。本发明还通过采用RSA算法保护不安全环境下密码和参数安全通信,确保通信链路的安全,使链路劫持失效。本发明还采用加密强度可配置的训练节点参数加密措施,针对不同的训练节点的采用不同的加密强度,满足实际应用的各种安全场景要求,对训练节点进行安全保护。
-
公开(公告)号:CN116012027A
公开(公告)日:2023-04-25
申请号:CN202211614436.0
申请日:2022-12-15
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06Q30/0201 , G06F16/22 , G06F16/2457
Abstract: 本申请涉及数据处理技术领域,尤其涉及一种数据全生命周期打标方法及系统,方法包括:确定打标对象;基于多种维度,生成打标对象的全生命周期中的各个数据服务阶段各自对应的标签;建立标签与打标对象的关联关系。本申请中的技术方案,对作为打标对象的数据进行从数据汇聚接入、存储、稽核、清洗、融合、服务到销毁整个全生命周期各个阶段的打标,将数据从产生到销毁的每个阶段从多种维度进行数据标签化,展示数据的“一生画像”,确保对数据进行使用时可以全程跟踪数据的处理过程,并快速精准溯源到原始数据。
-
公开(公告)号:CN115982272A
公开(公告)日:2023-04-18
申请号:CN202211488843.1
申请日:2022-11-25
Applicant: 北京市大数据中心
IPC: G06F16/27 , G06F16/2458 , G06F16/23
Abstract: 本申请公开了一种城市大数据管理的数据标注方法、装置及计算机存储介质,用于提高数据标注的精度。本申请方法包括:获取待标注的第一数据集,所述第一数据集为城市大数据管理数据库中待标注的数据;将所述第一数据集输入目标数据标注模型,以使得目标数据标注模型生成所述第一数据集中的第一数据的预标注标签;将所述第一数据及所述预标注标签上传至区块链平台;通过所述区块链平台向数据标注修订端发送所述第一数据及所述预标注标签,以使得所述数据标注修订端修订错误的预标注标签,并生成修订结果;将所述修订结果上传至所述区块链平台;通过区块链平台向数据标注质检端发送所述修订结果,以使得所述数据标注质检端质检所述修订结果的准确性,并生成质检报告上传至所述区块链平台。
-
公开(公告)号:CN115712855A
公开(公告)日:2023-02-24
申请号:CN202211482745.7
申请日:2022-11-24
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F18/24 , G06F18/214 , G06F18/213 , G06N3/04 , G06N3/08
Abstract: 本申请关于一种基于自学习的标签规则产生方法及装置。具体方案为:通过响应于接收到目标数据,对目标数据进行特征提取,以得到特征数据;确定特征数据的所属类型;将特征数据和特征数据的所属类型输入至预训练的预测器中;获取预测器输出的标签规则;基于标签规则对特征数据进行打标签。本申请提升了数据标签化的工作效率和精准度。
-
公开(公告)号:CN113450119A
公开(公告)日:2021-09-28
申请号:CN202110713346.6
申请日:2021-06-25
Applicant: 北京市大数据中心 , 中国农业科学院农业信息研究所
Abstract: 本发明涉及区块链技术领域,特别是指一种目录区块链联合可信中继器的跨链对接方法及系统,方法由目录区块链联合可信中继器的跨链对接系统实现,该系统包括目录区块链、可信中继器以及多个应用链,可信中继器由目录区块链SDK模块、TEE和应用链SDK模块共同组成;方法包括:目录区块链对跨链交易事务申请进行验证;目录区块链通过TEE向第一应用链发出交易许可,第一应用链SDK模块调用第一应用链,在TEE的运行环境中完成子事务;TEE向第二应用链发出交易许可,第二应用链SDK模块调用第二应用链,在TEE的运行环境中完成子事务,以此完成第一应用链和与第二应用链跨链事务。本发明采用目录区块链联合可信中继器跨接方式,实现轻客户端的高效跨链对接。
-
公开(公告)号:CN113434875A
公开(公告)日:2021-09-24
申请号:CN202110668763.3
申请日:2021-06-16
Abstract: 本发明涉及区块链和属性基加密技术领域,特别是指一种基于区块链的轻量化访问方法及系统,方法由基于区块链的轻量化访问系统实现,方法包括:属性管理机构设定相关参数;数据所有者设定访问控制策略,基于CP‑ABE算法对数据进行加密,生成密文,将密文存储至数据服务提供方;数据服务提供方将密文和密文存储地址信息以交易Txstorage发送到区块链网络上;数据所有者将关键字、密文存储地址和访问控制策略以交易Txauthorization发送到区块链网络上;属性管理机构按照数据使用者的属性集ω,通过交易Txsecretkey向数据使用者颁发属性私钥;数据使用者通过数据访问交易TxAccess获取密文,通过属性私钥对密文进行解密,得到明文。采用本发明,可以提高计算效率和通信效率。
-
公开(公告)号:CN119378554A
公开(公告)日:2025-01-28
申请号:CN202411942602.9
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F40/295 , G06F40/16 , G06F40/289
Abstract: 本发明属于命名实体识别技术领域,具体涉及一种基于深度学习的实体标注与识别方法及装置,所述方法包括:获取训练文本并采用BIO标注法对训练文本进行标注;将标注好的训练文本进行处理;将处理后的文本输入预训练好的BERT‑CRF模型,完成模型在命名实体识别上的微调;将待识别的文本A输入微调后的BERT‑CRF模型得到各类别的实体集合;利用训练好的LDA模型对待识别的文本A进行主题分析,得到文本A的主题以及所述主题下概率大于设定值的关键词;对所述的各类别的实体集合进行核验,将集合中与主体和关键词不匹配的实体进行修正。能够对实体进行人工的修正,提升了命名实体识别的准确率。
-
公开(公告)号:CN119378495A
公开(公告)日:2025-01-28
申请号:CN202411942600.X
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F40/16 , G06F40/194 , G06F40/30 , G06N3/0455
Abstract: 本发明提出的一种数据目录匹配优化与生成方法、系统、装置及介质,属于数据处理技术领域。所述方法包括:获取待治理的文本数据,形成待优化数据和资源数据,并进行数据预处理;使用SBERT模型对预处理后的数据进行向量化处理,生成句子的嵌入向量;通过对句子的嵌入向量之间进行相似度度量,识别出相关的内容,基于相似度度量结果推荐数据目录项;基于推荐的数据目录项,进行质量校验和反馈。本发明通过对系统自定义文本数据以及数据目录文本的向量化处理并通过SBERT模型进行相似度计算以及智能化推荐,实现了对复杂信息系统目录匹配结果的完善与优化。
-
-
-
-
-
-
-
-
-