-
公开(公告)号:CN119316229B
公开(公告)日:2025-02-28
申请号:CN202411845229.5
申请日:2024-12-16
Applicant: 北京市大数据中心 , 数据堂(北京)科技股份有限公司
IPC: H04L9/40
Abstract: 本发明涉及数据共享技术领域,且公开了一种基于前置节点的联邦数据共享方法和装置,其中方法包括:前置节点将获取到的联邦数据上传至私有链,前置节点上传本地区的基础公共服务信息到私有链,前置节点计算联邦数据特征,并上链请求验证,其他节点根据本地区实际情况,反馈验证值或对联邦数据进行修正,监管机构定期对整个链上的节点进行性能监管和数据统计分析,本发明通过在前置节点上进行数据预处理和加密,确保了数据在传输过程中的安全性和隐私性,前置节点作为中介,可以优化数据传输流程,提高处理效率,减轻链上节点的负载。
-
公开(公告)号:CN119357378A
公开(公告)日:2025-01-24
申请号:CN202411301360.5
申请日:2024-09-18
Applicant: 北京市大数据中心
IPC: G06F16/335 , G06F40/279 , G06F18/214 , G06N3/0499 , G06N3/096
Abstract: 本发明属于企业关系抽取技术领域,具体提供一种基于领域自适应的迁移学习实体关系抽取方法、装置、设备及存储介质,所述方法包括:选择一个或多个源领域;采用深度学习模型在选定的源领域上进行预训练,学习源领域内的已标注企业关系数据集;选择具有未标注或部分标注的企业关系数据的目标领域,使用领域自适应算法调整预训练的模型参数,适应目标领域的数据特征和分布;在完成目标领域数据特征和分布的领域适应后,部署迁移学习算法对调整后的深度学习模型进行微调;验证微调后深度学习模型在目标领域的性能;在目标领域中应用经过微调的深度学习模型识别和抽取文本中的企业关系及其关系。确保了抽取的企业关系及其关系数据的高质量和一致性。
-
公开(公告)号:CN117786768B
公开(公告)日:2024-05-14
申请号:CN202410199786.8
申请日:2024-02-23
Applicant: 数据堂(北京)科技股份有限公司 , 北京市大数据中心
Abstract: 本发明提供了一种联邦数据学习的安全参数交换方法,属于数据安全技术领域。本发明采用第三方签名保护参数服务器的参数汇聚安全,目前还没有保护服务器的专利,本发明创新提出通过对参数服务器中的参数在读写、落盘和网络传输三个方面进行监控,来确保参数服务器进行安全的明文参数汇聚。本发明还通过采用RSA算法保护不安全环境下密码和参数安全通信,确保通信链路的安全,使链路劫持失效。本发明还采用加密强度可配置的训练节点参数加密措施,针对不同的训练节点的采用不同的加密强度,满足实际应用的各种安全场景要求,对训练节点进行安全保护。
-
公开(公告)号:CN116668114A
公开(公告)日:2023-08-29
申请号:CN202310625125.2
申请日:2023-05-30
Applicant: 北京航空航天大学 , 北京中盾安信科技发展有限公司 , 北京市大数据中心
Abstract: 本发明公开了一种综合码引擎以及综合码引擎的生码验码方法,包含下列模块:接入网关模块、综合码模块、接入管理前端模块和接入管理后端模块;该系统通过统一的接入规范、标准化的服务接口以及简单易用的UI界面来提供城市码平台的接入注册、查询以及城市平台之间链路路由权限管理。向各个城市服务平台提供综合码全段、身份段赋码验码能力,提供综合码跨域互通互认的城市平台间协作基本能力要素。构建多地城市码通信的中央路由节点以此建立跨域码交换与数据共享的通道,实现城市码跨域互通,支撑跨域数据共享。依托可信身份认证平台,建设多级数字身份体系,提供综合码用码过程中的身份认证能力,解决多个城市码身份不互认问题。
-
公开(公告)号:CN115982272A
公开(公告)日:2023-04-18
申请号:CN202211488843.1
申请日:2022-11-25
Applicant: 北京市大数据中心
IPC: G06F16/27 , G06F16/2458 , G06F16/23
Abstract: 本申请公开了一种城市大数据管理的数据标注方法、装置及计算机存储介质,用于提高数据标注的精度。本申请方法包括:获取待标注的第一数据集,所述第一数据集为城市大数据管理数据库中待标注的数据;将所述第一数据集输入目标数据标注模型,以使得目标数据标注模型生成所述第一数据集中的第一数据的预标注标签;将所述第一数据及所述预标注标签上传至区块链平台;通过所述区块链平台向数据标注修订端发送所述第一数据及所述预标注标签,以使得所述数据标注修订端修订错误的预标注标签,并生成修订结果;将所述修订结果上传至所述区块链平台;通过区块链平台向数据标注质检端发送所述修订结果,以使得所述数据标注质检端质检所述修订结果的准确性,并生成质检报告上传至所述区块链平台。
-
公开(公告)号:CN115691137A
公开(公告)日:2023-02-03
申请号:CN202211357946.4
申请日:2022-11-01
Applicant: 北京航空航天大学 , 北京市大数据中心 , 北京市西城区科学技术和信息化局(北京市西城区大数据管理局)
IPC: G08G1/01 , G06Q10/04 , G06Q50/30 , G06N3/0442 , G06N3/08
Abstract: 本发明提供了一种基于因果马尔科夫模型的多模态数据预测方法,属于智能交通技术领域。本发明方法包括:采集研究区域的区域数据和多模态交通数据,将时间点、区域兴趣点和天气信息视为背景特征变量,将区域吸引力因子、自行车需求因子、出租车需求因子、公交车需求因子、交通速度因子视为物理概念变量,将自行车流量、出租车流量、公交车流量、区域速度视为多模态交通数据观测变量,利用因果马尔科夫过程描述多模态交通量的生成过程;利用神经网络求解因果马尔科夫过程,训练搭建的神经网络,用于多模态交通数据观测。本发明能够有效地预测多模态交通流,并提升了预测准确度,可进一步用于指导管理人员制定相关交通诱导策略。
-
公开(公告)号:CN119378554A
公开(公告)日:2025-01-28
申请号:CN202411942602.9
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F40/295 , G06F40/16 , G06F40/289
Abstract: 本发明属于命名实体识别技术领域,具体涉及一种基于深度学习的实体标注与识别方法及装置,所述方法包括:获取训练文本并采用BIO标注法对训练文本进行标注;将标注好的训练文本进行处理;将处理后的文本输入预训练好的BERT‑CRF模型,完成模型在命名实体识别上的微调;将待识别的文本A输入微调后的BERT‑CRF模型得到各类别的实体集合;利用训练好的LDA模型对待识别的文本A进行主题分析,得到文本A的主题以及所述主题下概率大于设定值的关键词;对所述的各类别的实体集合进行核验,将集合中与主体和关键词不匹配的实体进行修正。能够对实体进行人工的修正,提升了命名实体识别的准确率。
-
公开(公告)号:CN119378495A
公开(公告)日:2025-01-28
申请号:CN202411942600.X
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F40/16 , G06F40/194 , G06F40/30 , G06N3/0455
Abstract: 本发明提出的一种数据目录匹配优化与生成方法、系统、装置及介质,属于数据处理技术领域。所述方法包括:获取待治理的文本数据,形成待优化数据和资源数据,并进行数据预处理;使用SBERT模型对预处理后的数据进行向量化处理,生成句子的嵌入向量;通过对句子的嵌入向量之间进行相似度度量,识别出相关的内容,基于相似度度量结果推荐数据目录项;基于推荐的数据目录项,进行质量校验和反馈。本发明通过对系统自定义文本数据以及数据目录文本的向量化处理并通过SBERT模型进行相似度计算以及智能化推荐,实现了对复杂信息系统目录匹配结果的完善与优化。
-
公开(公告)号:CN119358689A
公开(公告)日:2025-01-24
申请号:CN202411942597.1
申请日:2024-12-27
Applicant: 北京市大数据中心
Abstract: 本发明提出的一种面向多元关系场景的知识推理方法、系统、装置及介质,属于知识图谱的构建和多元关系推理技术领域。所述方法包括:识别文本中的实体,并将实体链接到知识图谱中的对应节点上;从文本中抽取实体间的关系,确定关系类型,并生成多元关系数据;对多元关系数据进行建模,并使用嵌入技术将知识图谱中的实体和实体间的关系映射到连续的向量空间以预测出未知的实体间未知的实体和实体间的关系,并更新知识图谱;利用图结构进行逻辑推理,从知识图谱中学习推理规则,搜索特定的路径以发现实体间的新关系。本发明能够快速准确构建实体间的多元关系和确定这些关系的类型,并扩展传统的知识图谱,以更好地表示实体之间的复杂关系。
-
公开(公告)号:CN119357348A
公开(公告)日:2025-01-24
申请号:CN202411301357.3
申请日:2024-09-18
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/3329 , G06F40/279 , G06F40/30 , G06N3/084
Abstract: 本发明提出的一种基于复杂网络语义的意图匹配方法、系统、装置及介质,所述方法包括:收集需求领域的问答数据集,对问答数据进行清洗、实体链接和词嵌入处理;基于LoRA对BERT模型进行调整和训练,在每轮训练中,进行向前传播、计算损失、反向传播和更新BERT模型参数;获取用户输入的问题数据,对问题数据进行处理和特征提取,输入到BERT模型中,生成意图匹配的最佳结果;通过收集用户输入的问答数据,定期更新BERT模型。本发明利用LoRA技术微调BERT模型,让模型在特定领域中进行训练,能够有效增强模型在特定领域中语义意图识别能力。
-
-
-
-
-
-
-
-
-