-
公开(公告)号:CN116883055A
公开(公告)日:2023-10-13
申请号:CN202310897580.8
申请日:2023-07-21
Applicant: 北京市大数据中心
IPC: G06Q30/0201 , G06Q10/0631 , G06F17/18 , G06F17/16 , G06F9/50
Abstract: 本发明公开了一种基于多元线性回归的云迁移成本预估方法和系统,属于系统迁移技术领域,方法包括:确定云迁移成本的影响因素;从待迁移数据中挑选出多个预迁移数据进行预迁移,并统计各个预迁移数据的云迁移成本以及各个影响因素下的量化值;构建多元线性回归模型;根据各个预迁移数据的云迁移成本以及各个影响因素下的量化值,对多元线性回归模型进行求解;当多元线性回归模型存在多组解时,确定出最优解;对多元线性回归模型进行拟合度检验;通过多元线性回归模型预估待迁移数据的云迁移成本。可以通过多元线性回归模型可以对云迁移成本进行预估,无需人工参与,减少云迁移成本预估过程的主观性,提升云迁移成本预估的一致性与准确性。
-
公开(公告)号:CN119378554A
公开(公告)日:2025-01-28
申请号:CN202411942602.9
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F40/295 , G06F40/16 , G06F40/289
Abstract: 本发明属于命名实体识别技术领域,具体涉及一种基于深度学习的实体标注与识别方法及装置,所述方法包括:获取训练文本并采用BIO标注法对训练文本进行标注;将标注好的训练文本进行处理;将处理后的文本输入预训练好的BERT‑CRF模型,完成模型在命名实体识别上的微调;将待识别的文本A输入微调后的BERT‑CRF模型得到各类别的实体集合;利用训练好的LDA模型对待识别的文本A进行主题分析,得到文本A的主题以及所述主题下概率大于设定值的关键词;对所述的各类别的实体集合进行核验,将集合中与主体和关键词不匹配的实体进行修正。能够对实体进行人工的修正,提升了命名实体识别的准确率。
-
公开(公告)号:CN119149563A
公开(公告)日:2024-12-17
申请号:CN202411168544.9
申请日:2024-08-23
Applicant: 北京市大数据中心
IPC: G06F16/242 , G06F16/2455 , G06F16/25
Abstract: 本公开的实施例公开了基于RESTful接口的数据治理方法、装置、设备和可读介质。该方法的一具体实施方式包括:接收目标终端发送的数据需求信息;将数据需求信息输入至预先训练的解析模型中;确定对应数据需求信息的至少一个目标数据源和数据标准信息,将数据标准信息作为目标标准信息;生成查询请求信息,以及根据查询请求信息,对至少一个目标数据源进行查询处理;对至少一个目标数据进行数据转换处理,以生成转换后数据组;将转换后数据组发送至预设存储介质进行存储;对目标终端进行鉴权处理,以生成鉴权结果,以及将鉴权结果存储至高速缓存中。该实施方式提高了数据的时效性,避免了存储资源的浪费。
-
公开(公告)号:CN119358667A
公开(公告)日:2025-01-24
申请号:CN202411302658.8
申请日:2024-09-18
Applicant: 北京市大数据中心
IPC: G06N5/04 , G06N5/022 , G06N3/0442 , G06N3/0464 , G06N3/08 , G06F40/295 , G06F40/30
Abstract: 本发明提供一种知识推理与关系生成方法、装置、设备及存储介质,属于城市级多源数据处理技术领域,收集城市运行管理的各领域数据;提取数据治理后各类数据中的文本特征;识别文本特征中的实体;抽取文本特征中实体之间的关系,将识别的实体以及抽取的实体之间的关系存储到图数据库,形成初始知识图谱;利用预设的知识推理引擎,生成治理后各领域数据对应新的实体与关系;基于新的实体与关系更新所述的初始知识图谱,得到城市级数据知识图谱。本发明通过结合演化算法的全局搜索能力和深度学习的特征提取能力,自动挖掘和生成知识图谱中实体之间的潜在关系,提高知识图谱的覆盖率和准确性。
-
公开(公告)号:CN116954505A
公开(公告)日:2023-10-27
申请号:CN202310920258.2
申请日:2023-07-25
Applicant: 北京市大数据中心
IPC: G06F3/06
Abstract: 本发明公开了一种基于层次分析法的数据云迁移方法和系统,属于数据迁移技术领域,方法包括:对待迁移数据进行分类;确定云迁移评估准则;构建层次分析模型;建立准则判断矩阵和类别判断矩阵;计算各个评估准则的重要性权重;计算各类待迁移数据在各个评估准则下的重要性权重;根据各个评估准则的重要性权重以及各类待迁移数据在各个评估准则下的重要性权重,计算各类待迁移数据的整体权重;根据各类待迁移数据的整体权重,确定各类待迁移数据的迁移顺序。本发明可以确定各类待迁移数据的迁移顺序,便于对于新业务迁移成本进行准确的量化预测,便于系统资源整合,降低迁移成本,提升迁移效率。
-
公开(公告)号:CN116894680A
公开(公告)日:2023-10-17
申请号:CN202310903874.7
申请日:2023-07-21
Applicant: 北京市大数据中心
IPC: G06Q30/0201 , G06F16/2458 , G06F17/18 , G06N20/00
Abstract: 本发明公开了一种基于博弈优化的数据定价方法和系统,属于大数据资产技术领域,方法包括:当买卖双方处于完全信息场景时,构建第一讨价还价模型;当买卖双方处于不完全信息场景时,若买卖双方之间无交易平台介入,构建第二讨价还价模型;当买卖双方处于不完全信息场景时,若买卖双方之间存在交易平台介入,构建第三讨价环节模型;根据实际情况,对第一讨价还价模型、第二讨价还价模型或者第三讨价还价模型进行求解,确定出大数据资产的最终定价。在本发明中,根据买卖双方的实际情况,选择合适的讨价还价模型确定大数据资产的最终定价,对大数据资产进行动态定价,可以准确反映大数据资产的实际价值,客观确定出合理的成交价格。
-
公开(公告)号:CN116843470A
公开(公告)日:2023-10-03
申请号:CN202310945364.6
申请日:2023-07-28
Applicant: 北京市大数据中心
Abstract: 本发明公开了一种基于微分博弈的数据交易收益分配方法和系统,属于数据交易技术领域,方法包括:确定政府与企业进行数据交易时的目标函数;获取政府与企业开放共享数据的最优努力程度,计算稳定状态下的数据开放共享存量;确定最优数据交易存量;获取政府与企业的收益分配方案矩阵;确定负理想收益分配方案,并以负理想收益分配方案作为收益分配的起点;建立动态收益分配方案;引入动态收益分配机制,得到动态分配收益函数;通过动态分配收益函数,分配政府与企业进行数据交易时各自收益。可以保证政府与企业进行数据交易时的收益分配机制的时间一致性,提升收益分配的稳定性,推动政府和企业间的数据开放共享合作公平稳定。
-
公开(公告)号:CN116017333A
公开(公告)日:2023-04-25
申请号:CN202211605899.0
申请日:2022-12-14
Applicant: 北京市大数据中心
Abstract: 本申请实施例提供了基于大数据信令处理的人口识别方法、系统及存储介质。该方法包括:根据终端用户的信令数据信息识别用户注册信息和通讯表数据筛选出第一标记用户并提取信令时间数据和信令标识地数据获取基站动态扇区交互信息,提取基站扇区标识动态响应数据并根据基站扇区栅格动态分布模型获取对应基站扇区动态栅格数据计算获得时间周期内的轨迹密度数据,根据轨迹密度数据进行阈值对比筛选人口属性类别;从而基于大数据信令技术对终端用户信令数据处理获取基站扇区数据和栅格数据计算获得轨迹密度数据对人口属性进行识别,实现根据信令数据进行用户轨迹驻停情况识别判断所属人口属性技术,提高对区域内流动人口属性识别判断的精准度。
-
公开(公告)号:CN119357399A
公开(公告)日:2025-01-24
申请号:CN202411395579.6
申请日:2024-10-08
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/353 , G06F16/31 , G06F18/10 , G06F18/213 , G06F18/241 , G06N3/0464 , G06N3/0985
Abstract: 本公开提出了一种数据处理方法、装置、电子设备及存储介质,涉及数据处理技术领域,该方法包括:获取待处理的目标数据;对目标数据按照预设的处理规则进行预处理;将预处理后的目标数据进行特征提取,以获取多个目标特征;基于候选特征进行分类,并按照分类将对目标数据进行上链存储。由此通过分类,可以将目标数据按照分类进行分开存储,方便后续从区块链中进行数据获取时,可根据需求直接从对应分类进行数据获取,提升用户的使用体验。
-
公开(公告)号:CN119273260A
公开(公告)日:2025-01-07
申请号:CN202411803953.1
申请日:2024-12-10
Applicant: 北京市大数据中心 , 数据堂(北京)科技股份有限公司
IPC: G06Q10/083 , G06Q10/087 , G06Q30/018 , G06Q40/04 , H04L67/1097
Abstract: 本发明涉及计算机系统的领域,尤其是涉及一种基于联邦控制的多源数据协同方法、装置、电子设备及介质,基于联邦控制的多源数据协同方法包括如下步骤:通过共识机制将整体目标拆解为多个子目标,并分配给区块链网络中的各个节点;通过链上投票消除节点间的冲突;通过去中心化博弈模型平衡节点之间的博弈和合作,通过基于去中心化竞价的激励机制分配节点获得奖励;通过跨链合约和基于跨链合约的数据流通框架,构建节点间信任关系;通过激励相容性的数据协同合约,统一跨链交互中供应方与需求方的交互规则。本发明具有减少供给和需求之间理解不一致的情况,便于对异质空间跨域进行管控的效果。
-
-
-
-
-
-
-
-
-