基于联邦数据及联邦服务的数据共享方法及装置

    公开(公告)号:CN113204795A

    公开(公告)日:2021-08-03

    申请号:CN202110764949.9

    申请日:2021-07-07

    Abstract: 本发明公开了一种基于联邦数据及联邦服务的数据共享方法及装置,该方法包括:接收数据使用方提交的模型运算需求;基于联邦节点能力数据库,根据模型运算需求匹配生成最优决策结果;基于最优决策结果选择计算模型,将公钥和计算模型发送至相应联邦节点;接收相应联邦节点返回的计算结果,其中,计算结果为联邦节点根据自身的联邦数据基于计算模型计算得出并通过公钥加密后的结果;将结果进行解密返回给数据使用方;计算参与计算的每个联邦节点的数据收益,提供给数据提供方;将计算过程数据存储在区块链的记账节点上;数据提供方作为联邦节点。本发明通过联邦服务机制来实现对各个数据使用方需求的决策生成,进而实现服务的联邦化。

    迭代式大规模发音词典构建方法及装置

    公开(公告)号:CN112530414B

    公开(公告)日:2021-05-25

    申请号:CN202110178948.6

    申请日:2021-02-08

    Abstract: 本发明公开了一种迭代式大规模发音词典构建方法及装置,其中该方法包括:根据文本生数据生成词条序列;根据音频生数据生成音标序列;根据词条序列,利用G2P模型生成二元组 ;根据音标序列,利用P2G模型生成二元组 ;计算两个二元组之间的匹配度,并与预设匹配度进行比较,对匹配度小于预设匹配度对应的二元组 和二元组 进行鉴别性样本抽取,获得鉴别性样本;获取领域专家对鉴别性样本的标注和校正,将标注和校正后的二元组 和二元组 存入多层次大规模发音词典。本发明能够快速有效地构建大规模发音词典,提升语音识别系统的工作效率并降低人工成本。

    多媒体文件的同步方法及装置

    公开(公告)号:CN108769559B

    公开(公告)日:2020-12-01

    申请号:CN201810546057.X

    申请日:2018-05-25

    Abstract: 本发明提供了一种多媒体文件的同步方法及装置,其中,多媒体文件的同步方法中,在每个视频设备拍摄的音频文件均包括同一脉冲波,在确定所述脉冲波在每个音频文件中的起始采样点之后,利用将样本序列和校验音频文件中的脉冲波进行相似度对比,得到每个所述校验音频文件中的最相似序列,依据每个所述校验音频文件中的最相似序列的位置,计算得到每个所述校验音频文件中的最相似序列的参照位置,实现了对多个视频设备录制的音频文件的同步。

    多媒体文件的同步方法及装置

    公开(公告)号:CN108769559A

    公开(公告)日:2018-11-06

    申请号:CN201810546057.X

    申请日:2018-05-25

    Abstract: 本发明提供了一种多媒体文件的同步方法及装置,其中,多媒体文件的同步方法中,在每个视频设备拍摄的音频文件均包括同一脉冲波,在确定所述脉冲波在每个音频文件中的起始采样点之后,利用将样本序列和校验音频文件中的脉冲波进行相似度对比,得到每个所述校验音频文件中的最相似序列,依据每个所述校验音频文件中的最相似序列的位置,计算得到每个所述校验音频文件中的最相似序列的参照位置,实现了对多个视频设备录制的音频文件的同步。

    多模态大模型训练数据采集方法及系统

    公开(公告)号:CN119380144A

    公开(公告)日:2025-01-28

    申请号:CN202411946438.9

    申请日:2024-12-27

    Abstract: 本申请涉及计算机技术领域,其具体地公开了一种多模态大模型训练数据采集方法及系统,其采用基于深度学习的数据处理技术对语义对齐的图像数据和图像内容文本描述数据进行语义特征提取和跨模态联合编码,以捕捉到模态间的语义关联,实现跨模态的语义信息融合,并在此基础上进一步进行图像样本的生成,进而,通过对生成的图像样本与原始图像数据进行语义偏移度量,以智能识别生成的图像样本是否为合格增强样本。通过这种方式,可以有效地丰富多模态训练数据集,确保数据的质量,解决多模态数据增强过程中跨模态语义一致性的问题,从而提高多模态大模型的训练效率。

    语音摘要生成模型训练方法、语音摘要生成方法及装置

    公开(公告)号:CN115827854B

    公开(公告)日:2023-08-11

    申请号:CN202211687868.4

    申请日:2022-12-28

    Abstract: 本发明涉及一种语音摘要生成模型训练方法、语音摘要生成方法及装置,训练方法包括如下步骤:提取样本文本的样本词语集合,以及提取样本音频数据的样本音频特征;将所述样本词语集合、所述样本音频特征进行多模态特征融合,获得多模态特征向量;根据样本文本所归属的领域,获得样本文本的领域权重;将所述领域权重加入所述多模态特征向量;将所述多模态特征向量输入摘要生成模型,通过逐步迭代训练获得最优摘要生成模型。本技术方案的语音摘要生成模型训练方法通过融合音频数据与文本的多模态信息,使生成的语音摘要更精确、重点性更强;并且通过校正多模态特征向量的领域,增强了语音摘要的领域倾向性,修正生成的语音摘要,使语音摘要更精准。

    语音摘要生成模型训练方法、语音摘要生成方法及装置

    公开(公告)号:CN115827854A

    公开(公告)日:2023-03-21

    申请号:CN202211687868.4

    申请日:2022-12-28

    Abstract: 本发明涉及一种语音摘要生成模型训练方法、语音摘要生成方法及装置,训练方法包括如下步骤:提取样本文本的样本词语集合,以及提取样本音频数据的样本音频特征;将所述样本词语集合、所述样本音频特征进行多模态特征融合,获得多模态特征向量;根据样本文本所归属的领域,获得样本文本的领域权重;将所述领域权重加入所述多模态特征向量;将所述多模态特征向量输入摘要生成模型,通过逐步迭代训练获得最优摘要生成模型。本技术方案的语音摘要生成模型训练方法通过融合音频数据与文本的多模态信息,使生成的语音摘要更精确、重点性更强;并且通过校正多模态特征向量的领域,增强了语音摘要的领域倾向性,修正生成的语音摘要,使语音摘要更精准。

    一种交互式人工智能技术评测方案的构建方法

    公开(公告)号:CN115810137A

    公开(公告)日:2023-03-17

    申请号:CN202310087037.1

    申请日:2023-02-09

    Abstract: 本发明公开了一种交互式人工智能技术评测方案的构建方法,涉及人工智能测评技术领域,方法包括以下步骤:步骤S1:构建数据层,数据层包括评测数据库、评测工具库、评测标准库和基准模型库;步骤S2:构建封装层;步骤S3:构建执行层。本发明基于评测工具、评测数据、评测标准、基准模型等要素,快速构建一个人工智能评测方案,从而解决人工智能评测经验和方法无法重复利用、评测要求技术门槛高的问题,提供了交互式的配置环境,支持用户通过拖拽配置的可视化方式快速构建复杂的评测方案流程,从而实现为不同类型人工智能任务快速开发新的评测方案。

Patent Agency Ranking