-
公开(公告)号:CN119415571A
公开(公告)日:2025-02-11
申请号:CN202510026856.4
申请日:2025-01-08
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/2457 , G06F16/242 , G06F16/22
Abstract: 本发明提供基于权重分配和实体标注的数据发现方法、系统、设备及介质,属于数据搜索处理技术领域,对数据进行预处理操作;根据数据的实际特征,采用机器学习算法动态调整各数据项的权重;配置自适应权重分配模型,并采用多层实体标注方式对数据中的实际特征进行标注;构建倒排索引检索模型,根据自适应权重分配模型,提取每个数据项提取特征,分配相应的权重,并进行评分计算,根据得分,进行排序,反馈给用户;通过收集并分析用户搜索数据,动态调整自适应权重分配、搜索与排序算法及索引性能优化策略,并迭代执行评估与优化,结合用户反馈机制形成闭环。本发明能够准确反映不同特征对搜索结果的重要性。能够更好地满足用户多样化的搜索需求。
-
公开(公告)号:CN119358647A
公开(公告)日:2025-01-24
申请号:CN202411301362.4
申请日:2024-09-18
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06N5/022
Abstract: 本发明涉及知识图谱技术领域,具体提供一种基于角色感知的图谱构建方法、系统、终端及存储介质,包括:从事件数据中抽取时间、地点和人物,并将抽取的时间、地点和人物作为角色,建立角色之间的关系;将事件数据中的实体构建为角色,以角色作为虚拟实体节点,以角色之间的多元关系作为边,通过构建角色向量和模式矩阵构建知识图谱;构建评分函数和损失函数,基于评分函数和损失函数,按最小化损失函数的策略对所述知识图谱进行训练。本发明可方便的在模型加入时空因子,提升图谱预测准确度。
-
公开(公告)号:CN117828053A
公开(公告)日:2024-04-05
申请号:CN202311866715.0
申请日:2023-12-29
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/332 , G06F40/279 , G06F40/30 , G06N5/04 , G06N20/00 , G06Q50/18
Abstract: 本公开提供一种非结构化文本处理方法、装置、设备及存储介质,涉及自然语言理解技术领域。在本公开的一些实施例中,获取待处理的法律文书页面和非结构化问题文本;对所述法律文书页面进行文本识别,得到法律文书文本;将所述法律文书文本输入已经训练得到的生成式特征提取模型中,得到所述法律文书文本对应的语义解答文本;将所述非结构化问题文本和语义解答文本输入生成式语言模型中,得到所述非结构化问题文本对应的问题解答文本,提高非结构化问题文本的解答文本的准确率。
-
公开(公告)号:CN113486368B
公开(公告)日:2025-02-14
申请号:CN202110663306.5
申请日:2021-06-15
Applicant: 北京市大数据中心 , 北京数牍科技有限公司
Abstract: 本发明涉及信息安全技术领域,特别是指一种基于区块链技术的输入数据可信性验证方法及装置,方法包括:获取所有参与者节点的实际数据,通过智能合约分别进行加密,将加密后的实际数据存储至区块链;对输入数据进行加密,将加密后的输入数据分享给给所有参与者节点;对每个秘密份额分别进行加密,并将加密后的秘密份额广播给所有参与者节点;获取所有参与者节点接收到的加密后的秘密份额,通过智能合约对加密后的秘密份额进行数据恢复,得到待验证数据;根据待验证数据与区块链中的加密后的实际数据,通过智能合约对输入数据进行验证。采用本发明,可以验证输入数据的可信性,确保数据真实可信,避免参与方输入错误数据这一现象出现。
-
公开(公告)号:CN119357378A
公开(公告)日:2025-01-24
申请号:CN202411301360.5
申请日:2024-09-18
Applicant: 北京市大数据中心
IPC: G06F16/335 , G06F40/279 , G06F18/214 , G06N3/0499 , G06N3/096
Abstract: 本发明属于企业关系抽取技术领域,具体提供一种基于领域自适应的迁移学习实体关系抽取方法、装置、设备及存储介质,所述方法包括:选择一个或多个源领域;采用深度学习模型在选定的源领域上进行预训练,学习源领域内的已标注企业关系数据集;选择具有未标注或部分标注的企业关系数据的目标领域,使用领域自适应算法调整预训练的模型参数,适应目标领域的数据特征和分布;在完成目标领域数据特征和分布的领域适应后,部署迁移学习算法对调整后的深度学习模型进行微调;验证微调后深度学习模型在目标领域的性能;在目标领域中应用经过微调的深度学习模型识别和抽取文本中的企业关系及其关系。确保了抽取的企业关系及其关系数据的高质量和一致性。
-
公开(公告)号:CN116012027A
公开(公告)日:2023-04-25
申请号:CN202211614436.0
申请日:2022-12-15
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06Q30/0201 , G06F16/22 , G06F16/2457
Abstract: 本申请涉及数据处理技术领域,尤其涉及一种数据全生命周期打标方法及系统,方法包括:确定打标对象;基于多种维度,生成打标对象的全生命周期中的各个数据服务阶段各自对应的标签;建立标签与打标对象的关联关系。本申请中的技术方案,对作为打标对象的数据进行从数据汇聚接入、存储、稽核、清洗、融合、服务到销毁整个全生命周期各个阶段的打标,将数据从产生到销毁的每个阶段从多种维度进行数据标签化,展示数据的“一生画像”,确保对数据进行使用时可以全程跟踪数据的处理过程,并快速精准溯源到原始数据。
-
公开(公告)号:CN115982272A
公开(公告)日:2023-04-18
申请号:CN202211488843.1
申请日:2022-11-25
Applicant: 北京市大数据中心
IPC: G06F16/27 , G06F16/2458 , G06F16/23
Abstract: 本申请公开了一种城市大数据管理的数据标注方法、装置及计算机存储介质,用于提高数据标注的精度。本申请方法包括:获取待标注的第一数据集,所述第一数据集为城市大数据管理数据库中待标注的数据;将所述第一数据集输入目标数据标注模型,以使得目标数据标注模型生成所述第一数据集中的第一数据的预标注标签;将所述第一数据及所述预标注标签上传至区块链平台;通过所述区块链平台向数据标注修订端发送所述第一数据及所述预标注标签,以使得所述数据标注修订端修订错误的预标注标签,并生成修订结果;将所述修订结果上传至所述区块链平台;通过区块链平台向数据标注质检端发送所述修订结果,以使得所述数据标注质检端质检所述修订结果的准确性,并生成质检报告上传至所述区块链平台。
-
公开(公告)号:CN115712855A
公开(公告)日:2023-02-24
申请号:CN202211482745.7
申请日:2022-11-24
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F18/24 , G06F18/214 , G06F18/213 , G06N3/04 , G06N3/08
Abstract: 本申请关于一种基于自学习的标签规则产生方法及装置。具体方案为:通过响应于接收到目标数据,对目标数据进行特征提取,以得到特征数据;确定特征数据的所属类型;将特征数据和特征数据的所属类型输入至预训练的预测器中;获取预测器输出的标签规则;基于标签规则对特征数据进行打标签。本申请提升了数据标签化的工作效率和精准度。
-
公开(公告)号:CN113450119A
公开(公告)日:2021-09-28
申请号:CN202110713346.6
申请日:2021-06-25
Applicant: 北京市大数据中心 , 中国农业科学院农业信息研究所
Abstract: 本发明涉及区块链技术领域,特别是指一种目录区块链联合可信中继器的跨链对接方法及系统,方法由目录区块链联合可信中继器的跨链对接系统实现,该系统包括目录区块链、可信中继器以及多个应用链,可信中继器由目录区块链SDK模块、TEE和应用链SDK模块共同组成;方法包括:目录区块链对跨链交易事务申请进行验证;目录区块链通过TEE向第一应用链发出交易许可,第一应用链SDK模块调用第一应用链,在TEE的运行环境中完成子事务;TEE向第二应用链发出交易许可,第二应用链SDK模块调用第二应用链,在TEE的运行环境中完成子事务,以此完成第一应用链和与第二应用链跨链事务。本发明采用目录区块链联合可信中继器跨接方式,实现轻客户端的高效跨链对接。
-
公开(公告)号:CN113434875A
公开(公告)日:2021-09-24
申请号:CN202110668763.3
申请日:2021-06-16
Abstract: 本发明涉及区块链和属性基加密技术领域,特别是指一种基于区块链的轻量化访问方法及系统,方法由基于区块链的轻量化访问系统实现,方法包括:属性管理机构设定相关参数;数据所有者设定访问控制策略,基于CP‑ABE算法对数据进行加密,生成密文,将密文存储至数据服务提供方;数据服务提供方将密文和密文存储地址信息以交易Txstorage发送到区块链网络上;数据所有者将关键字、密文存储地址和访问控制策略以交易Txauthorization发送到区块链网络上;属性管理机构按照数据使用者的属性集ω,通过交易Txsecretkey向数据使用者颁发属性私钥;数据使用者通过数据访问交易TxAccess获取密文,通过属性私钥对密文进行解密,得到明文。采用本发明,可以提高计算效率和通信效率。
-
-
-
-
-
-
-
-
-