-
公开(公告)号:CN119378495A
公开(公告)日:2025-01-28
申请号:CN202411942600.X
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F40/16 , G06F40/194 , G06F40/30 , G06N3/0455
Abstract: 本发明提出的一种数据目录匹配优化与生成方法、系统、装置及介质,属于数据处理技术领域。所述方法包括:获取待治理的文本数据,形成待优化数据和资源数据,并进行数据预处理;使用SBERT模型对预处理后的数据进行向量化处理,生成句子的嵌入向量;通过对句子的嵌入向量之间进行相似度度量,识别出相关的内容,基于相似度度量结果推荐数据目录项;基于推荐的数据目录项,进行质量校验和反馈。本发明通过对系统自定义文本数据以及数据目录文本的向量化处理并通过SBERT模型进行相似度计算以及智能化推荐,实现了对复杂信息系统目录匹配结果的完善与优化。
-
公开(公告)号:CN119357348A
公开(公告)日:2025-01-24
申请号:CN202411301357.3
申请日:2024-09-18
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/3329 , G06F40/279 , G06F40/30 , G06N3/084
Abstract: 本发明提出的一种基于复杂网络语义的意图匹配方法、系统、装置及介质,所述方法包括:收集需求领域的问答数据集,对问答数据进行清洗、实体链接和词嵌入处理;基于LoRA对BERT模型进行调整和训练,在每轮训练中,进行向前传播、计算损失、反向传播和更新BERT模型参数;获取用户输入的问题数据,对问题数据进行处理和特征提取,输入到BERT模型中,生成意图匹配的最佳结果;通过收集用户输入的问答数据,定期更新BERT模型。本发明利用LoRA技术微调BERT模型,让模型在特定领域中进行训练,能够有效增强模型在特定领域中语义意图识别能力。
-
公开(公告)号:CN119149563A
公开(公告)日:2024-12-17
申请号:CN202411168544.9
申请日:2024-08-23
Applicant: 北京市大数据中心
IPC: G06F16/242 , G06F16/2455 , G06F16/25
Abstract: 本公开的实施例公开了基于RESTful接口的数据治理方法、装置、设备和可读介质。该方法的一具体实施方式包括:接收目标终端发送的数据需求信息;将数据需求信息输入至预先训练的解析模型中;确定对应数据需求信息的至少一个目标数据源和数据标准信息,将数据标准信息作为目标标准信息;生成查询请求信息,以及根据查询请求信息,对至少一个目标数据源进行查询处理;对至少一个目标数据进行数据转换处理,以生成转换后数据组;将转换后数据组发送至预设存储介质进行存储;对目标终端进行鉴权处理,以生成鉴权结果,以及将鉴权结果存储至高速缓存中。该实施方式提高了数据的时效性,避免了存储资源的浪费。
-
公开(公告)号:CN118070336A
公开(公告)日:2024-05-24
申请号:CN202410302528.8
申请日:2024-03-15
Applicant: 北京市大数据中心 , 中电长城网际系统应用有限公司
IPC: G06F21/62
Abstract: 本发明提供一种隐私数据处理方法,在根据隐私数据计算生成目标用户的目标隐私数据之后,确定计算生成目标隐私数据的行为序列,行为序列包括至少一个行为;根据行为的行为属性,确定各行为的风险标识和行为序列的风险标识;其中,行为属性表示行为的隐私泄露风险;通过记录隐私计算参与方主体在计算生成隐私计算结果的过程中产生的行为,分析该行为进行隐私泄露的可能性,并对该行为进行风险标识,能够对隐私风险进行前置管理,解决隐私风险管理存在滞后性的问题。本发明还提供一种隐私数据处理装置和计算机可读介质。
-
公开(公告)号:CN118070335A
公开(公告)日:2024-05-24
申请号:CN202410302388.4
申请日:2024-03-15
Applicant: 北京市大数据中心 , 中电长城网际系统应用有限公司
IPC: G06F21/62
Abstract: 本申请公开一种隐私数据的处理方法、系统、设备、介质和产品,涉及信息安全技术领域。方法包括:获取客户端的隐私数据及其对应的处理需求;根据隐私数据对应的处理需求,对预设处理算法集合中的多个处理算法进行筛选,获得待处理算法集合,其中,待处理算法集合包括多个待处理算法,待处理算法为与目标厂商松耦合的数据处理算法,目标厂商为客户端对应的厂商;对多个待处理算法进行融合,获得目标处理算法;使用目标处理算法对隐私数据进行处理,获得目标数据。根据本申请中的实施例,能够提升对隐私数据的处理效率。
-
公开(公告)号:CN117812540A
公开(公告)日:2024-04-02
申请号:CN202311853064.1
申请日:2023-12-29
Applicant: 北京市大数据中心
Abstract: 本申请实施例提供了一种基于手机信令数据的共享单车识别方法、系统及介质,该方法包括:基于物联网卡获取信令数据,将信令数据进行预处理,剔除冗余数据,得到处理后的信令数据;将处理后的信令数据进行分析,得到物联网卡移动轨迹,计算物联网卡的移动轨迹指标;根据物联网卡移动轨迹指标分析获取物联网卡的多项行为指标,分析不同物联网卡各项指标的差异分布情况,得到指标差异分布信息;将指标差异分布信息与运营商基站的运维信息进行交互,得到交互信息;根据交互信息筛选出属于共享单车的物联网卡,并识别共享单车;基于信令数据计算分析不同卡的移动行为轨迹,根据指标差异分布信息能够识别出全部品牌出共享单车。
-
公开(公告)号:CN116743748A
公开(公告)日:2023-09-12
申请号:CN202310681014.3
申请日:2023-06-09
Applicant: 北京微芯区块链与边缘计算研究院 , 北京市大数据中心
IPC: H04L67/10 , H04L61/3015 , H04L9/32 , H04L9/40
Abstract: 本发明公开了一种联盟链资源整合方法和系统,方法包括:域名所有者根据定义的域名规范注册域名,并添加所述联盟链资源信息,生成所述联盟链资源信息对应的地址,将所述联盟链资源信息和对应的所述地址存储上链,并将所述地址进行拼接,得到拼接地址,将所述拼接地址返回给所述域名所有者,所述域名所有者将所述拼接地址与注册的所述域名进行绑定,用户填写域名一,经验证后根据所述域名一解析对应的地址一,根据所述地址一从资源链上获取相应的信息。本发明公开的方法,能使联盟链资源具有统一的域名标识,并能通过域名进行准确的定位,获取资源,从而实现不同联盟链框架下资源的整合、互通。
-
-
-
-
-
-