-
公开(公告)号:CN117874293A
公开(公告)日:2024-04-12
申请号:CN202410024477.7
申请日:2024-01-05
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/84 , G06F40/289 , G06F40/295 , G06F16/33 , G06N20/00
Abstract: 本申请提出一种文本转换模型的训练方法、非结构化文本数据的处理方法和装置,其中,具体的实施方案为:获取预训练好的文本转换模型,其中,文本转换模型是基于通用领域下的非结构化文本和对应的结构化文本训练得到的;获取目标业务领域下的非结构化文本样本;对非结构化文本样本进行结构化处理,以得到非结构化文本样本对应的结构化文本样本;根据非结构化文本样本以及对应的结构化文本样本,对文本转换模型进行训练,以得到适配于目标业务领域的目标文本转换模型,由此,基于预训练好的文本转换模型,无需大量的非结构化文本训练数据,即可得到适配于目标业务领域的目标文本转换模型,提高了目标文本转换模型进行文本转换的准确率。
-
公开(公告)号:CN116362661A
公开(公告)日:2023-06-30
申请号:CN202211614446.4
申请日:2022-12-15
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06Q10/0875 , G06F16/23 , G06F16/27
Abstract: 本发明涉及一种基于区块链的物流数据共享方法、装置及计算机设备,所述方法包括将上链信息写入预构建的区块链平台中;上链信息包括物流相关数据;完成上链后,根据物流变动实时更新物流相关数据,并展示更新后的物流相关数据;对更新后的物流相关数据进行统计分析,以供智能合约调用方判断物流风险。本发明基于区块链技术将已经有平台数据采集上链;采集最新数据并将实时数据上链;提供标准的区块链应用和web端管理能力,供物流企业使用;企业管理者可通过数据看板实时了解最新数据,对风险进行提前预判,本申请以区块链技术锚定构建多维度的数字网络实现物流数据的共享,加强贸易可信,增强信用管理,帮助中小企业提升经营能力。
-
公开(公告)号:CN119358647A
公开(公告)日:2025-01-24
申请号:CN202411301362.4
申请日:2024-09-18
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06N5/022
Abstract: 本发明涉及知识图谱技术领域,具体提供一种基于角色感知的图谱构建方法、系统、终端及存储介质,包括:从事件数据中抽取时间、地点和人物,并将抽取的时间、地点和人物作为角色,建立角色之间的关系;将事件数据中的实体构建为角色,以角色作为虚拟实体节点,以角色之间的多元关系作为边,通过构建角色向量和模式矩阵构建知识图谱;构建评分函数和损失函数,基于评分函数和损失函数,按最小化损失函数的策略对所述知识图谱进行训练。本发明可方便的在模型加入时空因子,提升图谱预测准确度。
-
公开(公告)号:CN113947087B
公开(公告)日:2022-04-15
申请号:CN202111558564.3
申请日:2021-12-20
Applicant: 太极计算机股份有限公司 , 贾晓丰 , 江茜 , 张晰
IPC: G06F40/295 , G06K9/62 , G06F40/30 , G06F16/35
Abstract: 本公开提出一种基于标签的关系构建方法、装置、电子设备及存储介质,该方法包括确定实体标识;从多个数据集合中解析得到与实体标识对应的多个候选实体,多个数据集合包括:多个业务域的数据集合、多个渠道的数据集合,以及多种类型的数据集合;从多个候选实体之中选取出部分候选实体作为目标实体;确定与多个目标实体对应的多个目标标签;根据多个目标标签,确定多个目标实体之间的目标实体关系。通过本公开能够实现对候选实体及实体关系的智能匹配,减少歧义对候选实体识别的影响,有效提升对目标实体与目标实体关系识别的准确度,进而提高目标实体与目标实体关系的识别效果。
-
公开(公告)号:CN113947087A
公开(公告)日:2022-01-18
申请号:CN202111558564.3
申请日:2021-12-20
Applicant: 太极计算机股份有限公司 , 贾晓丰 , 江茜 , 张晰
IPC: G06F40/295 , G06K9/62 , G06F40/30 , G06F16/35
Abstract: 本公开提出一种基于标签的关系构建方法、装置、电子设备及存储介质,该方法包括确定实体标识;从多个数据集合中解析得到与实体标识对应的多个候选实体,多个数据集合包括:多个业务域的数据集合、多个渠道的数据集合,以及多种类型的数据集合;从多个候选实体之中选取出部分候选实体作为目标实体;确定与多个目标实体对应的多个目标标签;根据多个目标标签,确定多个目标实体之间的目标实体关系。通过本公开能够实现对候选实体及实体关系的智能匹配,减少歧义对候选实体识别的影响,有效提升对目标实体与目标实体关系识别的准确度,进而提高目标实体与目标实体关系的识别效果。
-
公开(公告)号:CN113946635A
公开(公告)日:2022-01-18
申请号:CN202111561005.8
申请日:2021-12-20
Applicant: 太极计算机股份有限公司 , 贾晓丰 , 江茜 , 张晰
IPC: G06F16/28 , G06F16/2458 , G06F16/29
Abstract: 本公开提出一种基于时空特征的关系收敛方法、装置、设备及存储介质,该方法包括获取多个初始时间数据、多个初始空间数据,以及多个事件数据;对多个初始时间数据分别进行预处理,以得到多个目标时间数据;对多个初始空间数据分别进行预处理,以得到多个目标空间数据;结合时空推理和数据挖掘方法,对多个目标时间数据和多个目标空间数据以及多个事件数据进行时空融合处理,以得到目标收敛关系,目标收敛关系用于描述多个目标时间数据、多个目标空间数据以及多个事件数据之间的关联关系。通过本公开能够准确地确定不同维度数据之间的目标收敛关系,有效提升大规模复杂维度数据之间强关系的收敛准确度。
-
公开(公告)号:CN119358689A
公开(公告)日:2025-01-24
申请号:CN202411942597.1
申请日:2024-12-27
Applicant: 北京市大数据中心
Abstract: 本发明提出的一种面向多元关系场景的知识推理方法、系统、装置及介质,属于知识图谱的构建和多元关系推理技术领域。所述方法包括:识别文本中的实体,并将实体链接到知识图谱中的对应节点上;从文本中抽取实体间的关系,确定关系类型,并生成多元关系数据;对多元关系数据进行建模,并使用嵌入技术将知识图谱中的实体和实体间的关系映射到连续的向量空间以预测出未知的实体间未知的实体和实体间的关系,并更新知识图谱;利用图结构进行逻辑推理,从知识图谱中学习推理规则,搜索特定的路径以发现实体间的新关系。本发明能够快速准确构建实体间的多元关系和确定这些关系的类型,并扩展传统的知识图谱,以更好地表示实体之间的复杂关系。
-
公开(公告)号:CN118070335A
公开(公告)日:2024-05-24
申请号:CN202410302388.4
申请日:2024-03-15
Applicant: 北京市大数据中心 , 中电长城网际系统应用有限公司
IPC: G06F21/62
Abstract: 本申请公开一种隐私数据的处理方法、系统、设备、介质和产品,涉及信息安全技术领域。方法包括:获取客户端的隐私数据及其对应的处理需求;根据隐私数据对应的处理需求,对预设处理算法集合中的多个处理算法进行筛选,获得待处理算法集合,其中,待处理算法集合包括多个待处理算法,待处理算法为与目标厂商松耦合的数据处理算法,目标厂商为客户端对应的厂商;对多个待处理算法进行融合,获得目标处理算法;使用目标处理算法对隐私数据进行处理,获得目标数据。根据本申请中的实施例,能够提升对隐私数据的处理效率。
-
公开(公告)号:CN117812540A
公开(公告)日:2024-04-02
申请号:CN202311853064.1
申请日:2023-12-29
Applicant: 北京市大数据中心
Abstract: 本申请实施例提供了一种基于手机信令数据的共享单车识别方法、系统及介质,该方法包括:基于物联网卡获取信令数据,将信令数据进行预处理,剔除冗余数据,得到处理后的信令数据;将处理后的信令数据进行分析,得到物联网卡移动轨迹,计算物联网卡的移动轨迹指标;根据物联网卡移动轨迹指标分析获取物联网卡的多项行为指标,分析不同物联网卡各项指标的差异分布情况,得到指标差异分布信息;将指标差异分布信息与运营商基站的运维信息进行交互,得到交互信息;根据交互信息筛选出属于共享单车的物联网卡,并识别共享单车;基于信令数据计算分析不同卡的移动行为轨迹,根据指标差异分布信息能够识别出全部品牌出共享单车。
-
公开(公告)号:CN119443105A
公开(公告)日:2025-02-14
申请号:CN202510039582.2
申请日:2025-01-10
Applicant: 北京市大数据中心
IPC: G06F40/295 , G06N3/096 , G06F16/35 , G06N20/10
Abstract: 本发明提供基于迁移学习模型的实体关系抽取方法、装置、设备及介质,属于数据处理技术领域,获取原始数据,对原始数据进行预处理、标注,生成训练数据集,再构建实体关系;利用机器学习算法在知识图谱中构建实体关系处理任务;构建迁移学习模型,基于迁移学习模型将源域或源任务中的知识迁移学习到目标域或目标任务中,来初始化或辅助目标领域模型的训练;将机器学习算法与迁移学习模型相融合,通过利用源领域丰富的标注数据和领域知识,可以提取出对目标领域有用的特征表示,并将其应用于目标领域的任务中,能够更快地学习到有用的特征,从而提高实体识别和关系抽取等任务的准确率。
-
-
-
-
-
-
-
-
-