-
公开(公告)号:CN116012027A
公开(公告)日:2023-04-25
申请号:CN202211614436.0
申请日:2022-12-15
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06Q30/0201 , G06F16/22 , G06F16/2457
Abstract: 本申请涉及数据处理技术领域,尤其涉及一种数据全生命周期打标方法及系统,方法包括:确定打标对象;基于多种维度,生成打标对象的全生命周期中的各个数据服务阶段各自对应的标签;建立标签与打标对象的关联关系。本申请中的技术方案,对作为打标对象的数据进行从数据汇聚接入、存储、稽核、清洗、融合、服务到销毁整个全生命周期各个阶段的打标,将数据从产生到销毁的每个阶段从多种维度进行数据标签化,展示数据的“一生画像”,确保对数据进行使用时可以全程跟踪数据的处理过程,并快速精准溯源到原始数据。
-
公开(公告)号:CN115776491A
公开(公告)日:2023-03-10
申请号:CN202211474612.5
申请日:2022-11-23
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
Abstract: 本公开提出一种数据共享方法和数据共享系统,方法包括:对分布式集群中的第二服务节点中的第一数据库进行感知,以感知第一数据库中是否存在发生更新和/或新增的目标业务数据;对第二服务节点进行环境检测,以得到第二服务节点的第一网络状态和第一数据库的第一运行状态;响应于第一网络状态为在线状态、第一运行状态为非异常状态且第一数据库中存在目标业务数据,则从第一数据库中获取目标业务数据,并将目标业务数据汇聚至第一服务节点中的第二数据库;向分布式集群中的第三服务节点推送第二数据库中存储的目标业务数据。由此,基于感知发生更新和/或新增的目标业务数据的存在,实现对目标业务数据的共享,并提高数据共享的及时性。
-
公开(公告)号:CN115712855A
公开(公告)日:2023-02-24
申请号:CN202211482745.7
申请日:2022-11-24
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F18/24 , G06F18/214 , G06F18/213 , G06N3/04 , G06N3/08
Abstract: 本申请关于一种基于自学习的标签规则产生方法及装置。具体方案为:通过响应于接收到目标数据,对目标数据进行特征提取,以得到特征数据;确定特征数据的所属类型;将特征数据和特征数据的所属类型输入至预训练的预测器中;获取预测器输出的标签规则;基于标签规则对特征数据进行打标签。本申请提升了数据标签化的工作效率和精准度。
-
公开(公告)号:CN119357348A
公开(公告)日:2025-01-24
申请号:CN202411301357.3
申请日:2024-09-18
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/3329 , G06F40/279 , G06F40/30 , G06N3/084
Abstract: 本发明提出的一种基于复杂网络语义的意图匹配方法、系统、装置及介质,所述方法包括:收集需求领域的问答数据集,对问答数据进行清洗、实体链接和词嵌入处理;基于LoRA对BERT模型进行调整和训练,在每轮训练中,进行向前传播、计算损失、反向传播和更新BERT模型参数;获取用户输入的问题数据,对问题数据进行处理和特征提取,输入到BERT模型中,生成意图匹配的最佳结果;通过收集用户输入的问答数据,定期更新BERT模型。本发明利用LoRA技术微调BERT模型,让模型在特定领域中进行训练,能够有效增强模型在特定领域中语义意图识别能力。
-
公开(公告)号:CN116957038A
公开(公告)日:2023-10-27
申请号:CN202310580227.7
申请日:2023-05-22
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06N3/08 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06F18/10 , G06F18/213 , G06F123/02
Abstract: 本公开提出了一种神经网络模型的训练方法、装置、电子设备及存储介质,涉及深度学习技术领域,包括:获取训练数据集,其中,所述训练数据集中包含待预测城市在指定时期内的新增异常数据;将所述训练数据集输入至预先构建的预测模型中进行迭代训练,直至迭代次数达到预设阈值停止训练,其中,所述预测模型是CNN模型和双向长短期记忆模型融合构建的模型;基于预先选择的误差函数模型对所述预测模型进行评估,直至所述预测模型所对应的误差值满足预设条件,确定所述预测模型为训练完成的预测模型。由此,可以使得训练生成的预测模型能够对新增阳性人数进行预测,实现对数据时序特征的提取,同时实现对预测精度的提高,有助于对数据进行精确化管理。
-
公开(公告)号:CN116340313A
公开(公告)日:2023-06-27
申请号:CN202211617773.5
申请日:2022-12-15
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/22 , G06F16/242 , G06F16/27
Abstract: 本发明提供了一种基于多级目录的数据共享请求的处理方法以及装置,该方法包括:接收到客户端发送的数据共享请求;基于所述数据共享请求的字段从职能目录中获取到目标职能;获取到所述所述目标职能关联的数据目录;基于所述数据目录获取到所述数据共享请求的目标数据;将所述目标数据向所述客户端进行反馈。解决了现有技术中目录编制应用性差的技术问题。
-
公开(公告)号:CN117708658A
公开(公告)日:2024-03-15
申请号:CN202410161414.6
申请日:2024-02-05
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
Abstract: 本公开提出一种数据实体间关系传递性质的确定方法、装置和设备,该方法包括:获取训练数据集合,构建目标关联关系的实体关联度评分模型,根据实体关联度评分模型构建惩罚函数,根据训练数据集合对惩罚函数进行模型训练以得到目标单位向量,根据实体关联度评分模型或目标单位向量确定第一数据实体与多个候选数据实体之间的识别结果,其中,识别结果用于指示第一数据实体与候选数据实体之间是否存在目标关联关系。由此,能够更准确、更全面、更深入地识别数据实体间关联关系,充分挖掘城市级大数据聚合价值。
-
公开(公告)号:CN115952150A
公开(公告)日:2023-04-11
申请号:CN202211610209.0
申请日:2022-12-14
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/21 , G06F16/22 , G06F16/2458
Abstract: 本申请涉及一种多源异构的数据融合方法及装置,涉及数据处理技术领域,方法包括:获取待融合数据,对待融合数据中各字段赋予不同的权重算子,根据预先设定的数据关联规则和待融合数据中各字段的权重算子对待融合数据进行关联融合,得到待处理数据,最后对待处理数据进行标准化处理。本申请中综合考虑多种因素,对待融合数据中各字段赋予不同的权重算子,如对预期准确度高的字段赋予相对较高的权重算子,对预期准确度低的字段赋予相对较低的权重算子,在进行关联融合时使融合数据对数据的紧密依赖程度更高,从而得到的融合数据更加准确、可靠。
-
公开(公告)号:CN116362661A
公开(公告)日:2023-06-30
申请号:CN202211614446.4
申请日:2022-12-15
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06Q10/0875 , G06F16/23 , G06F16/27
Abstract: 本发明涉及一种基于区块链的物流数据共享方法、装置及计算机设备,所述方法包括将上链信息写入预构建的区块链平台中;上链信息包括物流相关数据;完成上链后,根据物流变动实时更新物流相关数据,并展示更新后的物流相关数据;对更新后的物流相关数据进行统计分析,以供智能合约调用方判断物流风险。本发明基于区块链技术将已经有平台数据采集上链;采集最新数据并将实时数据上链;提供标准的区块链应用和web端管理能力,供物流企业使用;企业管理者可通过数据看板实时了解最新数据,对风险进行提前预判,本申请以区块链技术锚定构建多维度的数字网络实现物流数据的共享,加强贸易可信,增强信用管理,帮助中小企业提升经营能力。
-
公开(公告)号:CN115935977A
公开(公告)日:2023-04-07
申请号:CN202211409921.4
申请日:2022-11-10
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F40/289 , G06F40/284 , G06F40/295 , G06F18/22
Abstract: 本公开提出一种文本主题识别方法、装置及电子设备。该文本主题识别方法包括:获取待识别文本,并对待识别文本进行分词处理,得到第一候选词;将第一候选词与分词词典中的第二候选词进行匹配;从匹配失败的第一候选词中,确定第一主题词;从匹配成功的第一候选词中,确定与知识库中的关键词相匹配的第一候选词为第二主题词;基于第一主题词和第二主题词,确定待识别文本的主题。在文本中包括新型词汇时,本公开能够对新型词汇进行识别,并提取到准确的文本主题。
-
-
-
-
-
-
-
-
-