-
公开(公告)号:CN119380341A
公开(公告)日:2025-01-28
申请号:CN202411946533.9
申请日:2024-12-27
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06V20/70 , G06V30/19 , G06V10/82 , G06N3/0464
Abstract: 本申请公开了一种大模型多模态数据语义表征对齐方法,其通过采用基于深度学习的数据处理技术对第一模态数据和第二模态数据分别进行细粒度局部特征提取,并计算所述第一模态数据和第二模态数据的细粒度局部特征之间的相似度,作为初对齐损失函数值,接着,进一步结合全局上下文语义信息,对所述第一模态数据和第二模态数据的细粒度局部特征进行语义强化编码,通过上下文级别的语义对齐度量得到精对齐损失函数值,进而,基于精对齐损失函数值和初对齐损失函数值来指导模型训练,以实现多模态数据的语义表征对齐。通过这种方式,可以显著提高多模态数据在语义层面的对齐精度,为后续的数据融合和应用提供更准确的特征基础。
-
公开(公告)号:CN111078928A
公开(公告)日:2020-04-28
申请号:CN201911327469.5
申请日:2019-12-20
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06F16/583 , G06K9/62
Abstract: 本发明提供了一种图像去重方法及装置,可以计算待去重的每个图像的目标哈希值,具体将图像划分为多个局部图像,分别缩小图像和每个局部图像的尺寸,分别对缩小后的图像和每个缩小后的局部图像进行DCT变换,得到图像对应的DCT系数矩阵和每个局部图像对应的DCT系数矩阵;根据图像对应的DCT系数矩阵计算图像的哈希值,以及根据每个局部图像对应的DCT系数矩阵计算每个局部图像的哈希值;对图像的哈希值和每个局部图像的哈希值进行整合得到图像的目标哈希值。进一步通过两两匹配多个图像的目标哈希值确定多个图像中的重复图像,并去重。基于本发明可以对实现整体+局部的图像对比,提高了鲁棒性和精确性。
-
公开(公告)号:CN104767610B
公开(公告)日:2018-11-20
申请号:CN201510199706.X
申请日:2015-04-23
Applicant: 数据堂(北京)科技股份有限公司
Abstract: 本发明公开一种数据加密方法及系统。该方法包括:获取待传输数据;确定所述待传输数据的数据长度为第一长度;从数据平台所具有的数据中查找数据长度为第二长度的密钥数据;所述第二长度大于或等于所述第一长度;将所述待传输数据划分成第一数目个待传输数据块;将所述密钥数据划分成第二数目个密钥数据块;确定每个所述待传输数据块对应的密钥数据块;采用所述密钥数据块对所述待传输数据块进行加密,得到加密数据块;将所述加密数据块发送至目的终端。采用本发明的方法或系统,可以对待传输数据中的每个数据块,分别采用不同的密钥进行加密,从而实现一次一密的加密方式,提高数据传输的安全性。
-
公开(公告)号:CN120030132A
公开(公告)日:2025-05-23
申请号:CN202510510268.8
申请日:2025-04-23
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06F16/3329 , G06F40/205 , G06F40/30
Abstract: 本申请涉及智能问答技术领域,其具体地公开了一种基于多模态大模型的问答数据处理方法及系统,其采用基于深度学习的多模态数据处理技术对用户输入的文本问题和图像模态上下文进行语义解析,分别提取出文本问题和图像模态上下文的语义特征,接着对两者进行线性投影以实现特征对齐,并引入跨模态特征全域关联交互机制,挖掘文本问题与图像模态上下文之间的深层次语义关联,实现对文本问题和图像模态上下文信息的有效融合,进而利用大语言模型的推理能力,生成与文本问题相关的文本答案。通过这种方式,能够显著提高问答系统对多模态信息的理解和处理能力,生成与文本问题紧密相关且逻辑完整的文本答案,满足用户对于多模态问答场景下的信息需求。
-
公开(公告)号:CN119378564B
公开(公告)日:2025-04-25
申请号:CN202411949511.8
申请日:2024-12-27
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06F40/30 , G06F40/126 , G06F40/216
Abstract: 本申请涉及数据标注技术领域,其具体地公开了一种大模型数据智能标注方法及系统,其采用基于深度学习的自然语言处理技术对未标注文本数据集中的各个未标注文本数据进行置信度评估,选择最小置信度对应的文本数据作为代表样本数据,并对所述代表样本数据进行语料扩充,进而,通过对所述代表样本数据和语料扩充后的代表样本数据进行语义特征提取和补偿式交互融合,以充分利用两者之间的共有信息和独特信息,从而实现对所述代表样本数据的全面语义理解和智能标注。通过这种方式,可以显著提高数据标注的效率和准确性,同时大幅度减少人工干预的需求,降低标注成本。
-
公开(公告)号:CN119380144B
公开(公告)日:2025-04-04
申请号:CN202411946438.9
申请日:2024-12-27
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06V10/774 , G06V20/70 , G06V30/19 , G06V10/82 , G06N3/0464
Abstract: 本申请涉及计算机技术领域,其具体地公开了一种多模态大模型训练数据采集方法及系统,其采用基于深度学习的数据处理技术对语义对齐的图像数据和图像内容文本描述数据进行语义特征提取和跨模态联合编码,以捕捉到模态间的语义关联,实现跨模态的语义信息融合,并在此基础上进一步进行图像样本的生成,进而,通过对生成的图像样本与原始图像数据进行语义偏移度量,以智能识别生成的图像样本是否为合格增强样本。通过这种方式,可以有效地丰富多模态训练数据集,确保数据的质量,解决多模态数据增强过程中跨模态语义一致性的问题,从而提高多模态大模型的训练效率。
-
公开(公告)号:CN119273260A
公开(公告)日:2025-01-07
申请号:CN202411803953.1
申请日:2024-12-10
Applicant: 北京市大数据中心 , 数据堂(北京)科技股份有限公司
IPC: G06Q10/083 , G06Q10/087 , G06Q30/018 , G06Q40/04 , H04L67/1097
Abstract: 本发明涉及计算机系统的领域,尤其是涉及一种基于联邦控制的多源数据协同方法、装置、电子设备及介质,基于联邦控制的多源数据协同方法包括如下步骤:通过共识机制将整体目标拆解为多个子目标,并分配给区块链网络中的各个节点;通过链上投票消除节点间的冲突;通过去中心化博弈模型平衡节点之间的博弈和合作,通过基于去中心化竞价的激励机制分配节点获得奖励;通过跨链合约和基于跨链合约的数据流通框架,构建节点间信任关系;通过激励相容性的数据协同合约,统一跨链交互中供应方与需求方的交互规则。本发明具有减少供给和需求之间理解不一致的情况,便于对异质空间跨域进行管控的效果。
-
公开(公告)号:CN119273113A
公开(公告)日:2025-01-07
申请号:CN202411804034.6
申请日:2024-12-10
Applicant: 北京市大数据中心 , 数据堂(北京)科技股份有限公司
IPC: G06Q10/0631 , G06F18/22 , G06F18/25
Abstract: 本发明涉及电数字数据处理的领域,尤其是涉及一种基于场景生成与供需匹配的联邦数据服务方法、装置、电子设备和介质,方法包括如下步骤:构建人工场景;获得影响供需匹配效率和精度的因素和变量,对人工场景、需求信息和供应信息进行分析,获得分析结果,根据分析结果进行供需匹配,输出匹配结果;对需求信息和供应信息进行预测,并根据预测的需求信息和供应信息进行供需匹配。本发明将人工智能的推理与决策能力融入区块链系统中,利用智能算法实时监控共识过程并动态调整共识参数,促使一致性供需匹配决策的实时达成与动态调整,从而确保供需决策在面向场景多态性和关系耦合性时的适应性。
-
公开(公告)号:CN111078928B
公开(公告)日:2023-07-21
申请号:CN201911327469.5
申请日:2019-12-20
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06F16/583 , G06V10/42 , G06V10/75
Abstract: 本发明提供了一种图像去重方法及装置,可以计算待去重的每个图像的目标哈希值,具体将图像划分为多个局部图像,分别缩小图像和每个局部图像的尺寸,分别对缩小后的图像和每个缩小后的局部图像进行DCT变换,得到图像对应的DCT系数矩阵和每个局部图像对应的DCT系数矩阵;根据图像对应的DCT系数矩阵计算图像的哈希值,以及根据每个局部图像对应的DCT系数矩阵计算每个局部图像的哈希值;对图像的哈希值和每个局部图像的哈希值进行整合得到图像的目标哈希值。进一步通过两两匹配多个图像的目标哈希值确定多个图像中的重复图像,并去重。基于本发明可以对实现整体+局部的图像对比,提高了鲁棒性和精确性。
-
公开(公告)号:CN115810137B
公开(公告)日:2023-06-02
申请号:CN202310087037.1
申请日:2023-02-09
Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司
IPC: G06V10/776 , G06V40/16 , G06V10/82
Abstract: 本发明公开了一种交互式人工智能技术评测方案的构建方法,涉及人工智能测评技术领域,方法包括以下步骤:步骤S1:构建数据层,数据层包括评测数据库、评测工具库、评测标准库和基准模型库;步骤S2:构建封装层;步骤S3:构建执行层。本发明基于评测工具、评测数据、评测标准、基准模型等要素,快速构建一个人工智能评测方案,从而解决人工智能评测经验和方法无法重复利用、评测要求技术门槛高的问题,提供了交互式的配置环境,支持用户通过拖拽配置的可视化方式快速构建复杂的评测方案流程,从而实现为不同类型人工智能任务快速开发新的评测方案。
-
-
-
-
-
-
-
-
-