大模型多模态数据语义表征对齐方法

    公开(公告)号:CN119380341A

    公开(公告)日:2025-01-28

    申请号:CN202411946533.9

    申请日:2024-12-27

    Abstract: 本申请公开了一种大模型多模态数据语义表征对齐方法,其通过采用基于深度学习的数据处理技术对第一模态数据和第二模态数据分别进行细粒度局部特征提取,并计算所述第一模态数据和第二模态数据的细粒度局部特征之间的相似度,作为初对齐损失函数值,接着,进一步结合全局上下文语义信息,对所述第一模态数据和第二模态数据的细粒度局部特征进行语义强化编码,通过上下文级别的语义对齐度量得到精对齐损失函数值,进而,基于精对齐损失函数值和初对齐损失函数值来指导模型训练,以实现多模态数据的语义表征对齐。通过这种方式,可以显著提高多模态数据在语义层面的对齐精度,为后续的数据融合和应用提供更准确的特征基础。

    一种图像去重方法及装置

    公开(公告)号:CN111078928A

    公开(公告)日:2020-04-28

    申请号:CN201911327469.5

    申请日:2019-12-20

    Abstract: 本发明提供了一种图像去重方法及装置,可以计算待去重的每个图像的目标哈希值,具体将图像划分为多个局部图像,分别缩小图像和每个局部图像的尺寸,分别对缩小后的图像和每个缩小后的局部图像进行DCT变换,得到图像对应的DCT系数矩阵和每个局部图像对应的DCT系数矩阵;根据图像对应的DCT系数矩阵计算图像的哈希值,以及根据每个局部图像对应的DCT系数矩阵计算每个局部图像的哈希值;对图像的哈希值和每个局部图像的哈希值进行整合得到图像的目标哈希值。进一步通过两两匹配多个图像的目标哈希值确定多个图像中的重复图像,并去重。基于本发明可以对实现整体+局部的图像对比,提高了鲁棒性和精确性。

    一种数据驱动式人工智能技术评测系统及方法

    公开(公告)号:CN115830419A

    公开(公告)日:2023-03-21

    申请号:CN202310087039.0

    申请日:2023-02-09

    Abstract: 本发明公开了一种数据驱动式人工智能技术评测系统及方法,涉及人工智能评测技术领域,系统包括评测对象单元、评测过程单元、评测结果单元和算法优化单元,评测对象单元的数据信息传递至评测过程单元评测,评测过程单元评测结果传递至评测结果单元;算法优化单元接收评测结果数据,并将接收到的待优化的评测结果数据传递至评测对象单元进行优化;方法步骤包括生成评测任务;执行评测任务;生成评测结果。本发明针对不同技术领域和不同应用场景下的评测对象,可以快速选择适合的评测工具、评测数据、评测标准和基准模型后执行评测,输出评测结果,并推动评测对象的算法优化,从而极大降低用户进行人工智能评测的技术门槛。

    一种任务外包方法和系统

    公开(公告)号:CN104573988A

    公开(公告)日:2015-04-29

    申请号:CN201510041889.2

    申请日:2015-01-28

    CPC classification number: G06Q10/0631 G06Q10/06313

    Abstract: 本发明任务外包方法和系统,接收用户在公布的各待外包任务中对目标任务的认领请求,所述认领请求包括用户标识及所述目标任务的任务标识;之后,建立所述用户标识及所述任务标识间的关联关系,并存储所述关联关系,实现用户对目标任务的认领。可见,本发明提供了一种行之有效的任务外包方法,且利用本发明用户可依据实际需求便捷、高效地获取自己所需的外包任务,为进行任务外包的多方主体提供了便利。

    多模态大模型训练数据采集方法及系统

    公开(公告)号:CN119380144A

    公开(公告)日:2025-01-28

    申请号:CN202411946438.9

    申请日:2024-12-27

    Abstract: 本申请涉及计算机技术领域,其具体地公开了一种多模态大模型训练数据采集方法及系统,其采用基于深度学习的数据处理技术对语义对齐的图像数据和图像内容文本描述数据进行语义特征提取和跨模态联合编码,以捕捉到模态间的语义关联,实现跨模态的语义信息融合,并在此基础上进一步进行图像样本的生成,进而,通过对生成的图像样本与原始图像数据进行语义偏移度量,以智能识别生成的图像样本是否为合格增强样本。通过这种方式,可以有效地丰富多模态训练数据集,确保数据的质量,解决多模态数据增强过程中跨模态语义一致性的问题,从而提高多模态大模型的训练效率。

    一种交互式人工智能技术评测方案的构建方法

    公开(公告)号:CN115810137A

    公开(公告)日:2023-03-17

    申请号:CN202310087037.1

    申请日:2023-02-09

    Abstract: 本发明公开了一种交互式人工智能技术评测方案的构建方法,涉及人工智能测评技术领域,方法包括以下步骤:步骤S1:构建数据层,数据层包括评测数据库、评测工具库、评测标准库和基准模型库;步骤S2:构建封装层;步骤S3:构建执行层。本发明基于评测工具、评测数据、评测标准、基准模型等要素,快速构建一个人工智能评测方案,从而解决人工智能评测经验和方法无法重复利用、评测要求技术门槛高的问题,提供了交互式的配置环境,支持用户通过拖拽配置的可视化方式快速构建复杂的评测方案流程,从而实现为不同类型人工智能任务快速开发新的评测方案。

    一种语音数据质量检测方法、装置、服务器及存储介质

    公开(公告)号:CN110580917A

    公开(公告)日:2019-12-17

    申请号:CN201910870667.X

    申请日:2019-09-16

    Abstract: 本发明提供一种语音数据质量检测方法、装置、服务器及存储介质,以帧为单位对待进行质量检测的语音数据进行分割得到至少一个语音帧,计算语音帧在预先设置的至少一个频段中每个频段的频谱能量值,并将利用至少一个语音帧中每个语音帧在频段的频谱能量值计算语音数据在频段的目标频谱能量值,分析语音数据在各个频段的目标频谱能量值得到语音数据的质量检测结果。本发明提供的技术方案通过对语音数据在不同频段的目标频谱能量值的计算可分析出语音数据的语音质量检测结果,实现了对语音数据质量的检测。

Patent Agency Ranking