-
公开(公告)号:CN119357399A
公开(公告)日:2025-01-24
申请号:CN202411395579.6
申请日:2024-10-08
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/353 , G06F16/31 , G06F18/10 , G06F18/213 , G06F18/241 , G06N3/0464 , G06N3/0985
Abstract: 本公开提出了一种数据处理方法、装置、电子设备及存储介质,涉及数据处理技术领域,该方法包括:获取待处理的目标数据;对目标数据按照预设的处理规则进行预处理;将预处理后的目标数据进行特征提取,以获取多个目标特征;基于候选特征进行分类,并按照分类将对目标数据进行上链存储。由此通过分类,可以将目标数据按照分类进行分开存储,方便后续从区块链中进行数据获取时,可根据需求直接从对应分类进行数据获取,提升用户的使用体验。
-
公开(公告)号:CN117828053A
公开(公告)日:2024-04-05
申请号:CN202311866715.0
申请日:2023-12-29
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/332 , G06F40/279 , G06F40/30 , G06N5/04 , G06N20/00 , G06Q50/18
Abstract: 本公开提供一种非结构化文本处理方法、装置、设备及存储介质,涉及自然语言理解技术领域。在本公开的一些实施例中,获取待处理的法律文书页面和非结构化问题文本;对所述法律文书页面进行文本识别,得到法律文书文本;将所述法律文书文本输入已经训练得到的生成式特征提取模型中,得到所述法律文书文本对应的语义解答文本;将所述非结构化问题文本和语义解答文本输入生成式语言模型中,得到所述非结构化问题文本对应的问题解答文本,提高非结构化问题文本的解答文本的准确率。
-
公开(公告)号:CN115952150A
公开(公告)日:2023-04-11
申请号:CN202211610209.0
申请日:2022-12-14
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/21 , G06F16/22 , G06F16/2458
Abstract: 本申请涉及一种多源异构的数据融合方法及装置,涉及数据处理技术领域,方法包括:获取待融合数据,对待融合数据中各字段赋予不同的权重算子,根据预先设定的数据关联规则和待融合数据中各字段的权重算子对待融合数据进行关联融合,得到待处理数据,最后对待处理数据进行标准化处理。本申请中综合考虑多种因素,对待融合数据中各字段赋予不同的权重算子,如对预期准确度高的字段赋予相对较高的权重算子,对预期准确度低的字段赋予相对较低的权重算子,在进行关联融合时使融合数据对数据的紧密依赖程度更高,从而得到的融合数据更加准确、可靠。
-
公开(公告)号:CN120045633A
公开(公告)日:2025-05-27
申请号:CN202510525900.6
申请日:2025-04-25
Applicant: 北京市大数据中心 , 中国电信股份有限公司北京分公司 , 北京邮电大学
IPC: G06F16/29 , G06F16/28 , G06F18/2321 , G06N3/0455 , G06N3/084 , G06N3/0464 , G06N3/045 , G06N3/0499
Abstract: 本发明涉及一种基于空间网格编码和大语言模型的时空数据预测方法,属于人工智能与时空数据分析领域。其包括以下步骤:根据地理区域的空间范围,将区域划分为网格单元,并采用编码方法对网格单元进行处理,每个单元通过唯一标识符进行标识;基于用户的停留记录,构建时空依赖模型,将每次停留表示为元组,通过分析历史停留序列和上下文停留序列,预测用户的下一个位置;结合大语言模型,设计时空指令优化提示模板,通过引入网格编码和上下文感知推理,指导模型分析历史数据和上下文数据,生成下一个位置预测,并为每个预测提供解释。本发明通过网格编码和层次化建模,增强模型泛化能力,实现精准时空行为预测。
-
公开(公告)号:CN116883055A
公开(公告)日:2023-10-13
申请号:CN202310897580.8
申请日:2023-07-21
Applicant: 北京市大数据中心
IPC: G06Q30/0201 , G06Q10/0631 , G06F17/18 , G06F17/16 , G06F9/50
Abstract: 本发明公开了一种基于多元线性回归的云迁移成本预估方法和系统,属于系统迁移技术领域,方法包括:确定云迁移成本的影响因素;从待迁移数据中挑选出多个预迁移数据进行预迁移,并统计各个预迁移数据的云迁移成本以及各个影响因素下的量化值;构建多元线性回归模型;根据各个预迁移数据的云迁移成本以及各个影响因素下的量化值,对多元线性回归模型进行求解;当多元线性回归模型存在多组解时,确定出最优解;对多元线性回归模型进行拟合度检验;通过多元线性回归模型预估待迁移数据的云迁移成本。可以通过多元线性回归模型可以对云迁移成本进行预估,无需人工参与,减少云迁移成本预估过程的主观性,提升云迁移成本预估的一致性与准确性。
-
公开(公告)号:CN119378554A
公开(公告)日:2025-01-28
申请号:CN202411942602.9
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F40/295 , G06F40/16 , G06F40/289
Abstract: 本发明属于命名实体识别技术领域,具体涉及一种基于深度学习的实体标注与识别方法及装置,所述方法包括:获取训练文本并采用BIO标注法对训练文本进行标注;将标注好的训练文本进行处理;将处理后的文本输入预训练好的BERT‑CRF模型,完成模型在命名实体识别上的微调;将待识别的文本A输入微调后的BERT‑CRF模型得到各类别的实体集合;利用训练好的LDA模型对待识别的文本A进行主题分析,得到文本A的主题以及所述主题下概率大于设定值的关键词;对所述的各类别的实体集合进行核验,将集合中与主体和关键词不匹配的实体进行修正。能够对实体进行人工的修正,提升了命名实体识别的准确率。
-
公开(公告)号:CN119149563A
公开(公告)日:2024-12-17
申请号:CN202411168544.9
申请日:2024-08-23
Applicant: 北京市大数据中心
IPC: G06F16/242 , G06F16/2455 , G06F16/25
Abstract: 本公开的实施例公开了基于RESTful接口的数据治理方法、装置、设备和可读介质。该方法的一具体实施方式包括:接收目标终端发送的数据需求信息;将数据需求信息输入至预先训练的解析模型中;确定对应数据需求信息的至少一个目标数据源和数据标准信息,将数据标准信息作为目标标准信息;生成查询请求信息,以及根据查询请求信息,对至少一个目标数据源进行查询处理;对至少一个目标数据进行数据转换处理,以生成转换后数据组;将转换后数据组发送至预设存储介质进行存储;对目标终端进行鉴权处理,以生成鉴权结果,以及将鉴权结果存储至高速缓存中。该实施方式提高了数据的时效性,避免了存储资源的浪费。
-
公开(公告)号:CN119358667A
公开(公告)日:2025-01-24
申请号:CN202411302658.8
申请日:2024-09-18
Applicant: 北京市大数据中心
IPC: G06N5/04 , G06N5/022 , G06N3/0442 , G06N3/0464 , G06N3/08 , G06F40/295 , G06F40/30
Abstract: 本发明提供一种知识推理与关系生成方法、装置、设备及存储介质,属于城市级多源数据处理技术领域,收集城市运行管理的各领域数据;提取数据治理后各类数据中的文本特征;识别文本特征中的实体;抽取文本特征中实体之间的关系,将识别的实体以及抽取的实体之间的关系存储到图数据库,形成初始知识图谱;利用预设的知识推理引擎,生成治理后各领域数据对应新的实体与关系;基于新的实体与关系更新所述的初始知识图谱,得到城市级数据知识图谱。本发明通过结合演化算法的全局搜索能力和深度学习的特征提取能力,自动挖掘和生成知识图谱中实体之间的潜在关系,提高知识图谱的覆盖率和准确性。
-
公开(公告)号:CN116954505A
公开(公告)日:2023-10-27
申请号:CN202310920258.2
申请日:2023-07-25
Applicant: 北京市大数据中心
IPC: G06F3/06
Abstract: 本发明公开了一种基于层次分析法的数据云迁移方法和系统,属于数据迁移技术领域,方法包括:对待迁移数据进行分类;确定云迁移评估准则;构建层次分析模型;建立准则判断矩阵和类别判断矩阵;计算各个评估准则的重要性权重;计算各类待迁移数据在各个评估准则下的重要性权重;根据各个评估准则的重要性权重以及各类待迁移数据在各个评估准则下的重要性权重,计算各类待迁移数据的整体权重;根据各类待迁移数据的整体权重,确定各类待迁移数据的迁移顺序。本发明可以确定各类待迁移数据的迁移顺序,便于对于新业务迁移成本进行准确的量化预测,便于系统资源整合,降低迁移成本,提升迁移效率。
-
公开(公告)号:CN116894680A
公开(公告)日:2023-10-17
申请号:CN202310903874.7
申请日:2023-07-21
Applicant: 北京市大数据中心
IPC: G06Q30/0201 , G06F16/2458 , G06F17/18 , G06N20/00
Abstract: 本发明公开了一种基于博弈优化的数据定价方法和系统,属于大数据资产技术领域,方法包括:当买卖双方处于完全信息场景时,构建第一讨价还价模型;当买卖双方处于不完全信息场景时,若买卖双方之间无交易平台介入,构建第二讨价还价模型;当买卖双方处于不完全信息场景时,若买卖双方之间存在交易平台介入,构建第三讨价环节模型;根据实际情况,对第一讨价还价模型、第二讨价还价模型或者第三讨价还价模型进行求解,确定出大数据资产的最终定价。在本发明中,根据买卖双方的实际情况,选择合适的讨价还价模型确定大数据资产的最终定价,对大数据资产进行动态定价,可以准确反映大数据资产的实际价值,客观确定出合理的成交价格。
-
-
-
-
-
-
-
-
-