基于联邦机制的多主体共治数据协同方法、装置、电子设备及介质

    公开(公告)号:CN119248887A

    公开(公告)日:2025-01-03

    申请号:CN202411784495.1

    申请日:2024-12-06

    Abstract: 本发明涉及电数字数据处理的领域,尤其是涉及一种基于联邦机制的多主体共治数据协同方法、装置、电子设备及介质,方法包括如下步骤:获取数据信息和预先写入在区块链中的计算模型,通过计算模型对数据信息进行计算,获得计算结果,并生成数据目录,将数据目录写入区块链;区块链中的分析模型对数据目录进行分析,发掘数据目录的关系和隐性关系;通过切片算法将数据目录中的数据进行数据切片,数据切片后的数据存储在切片数据集中,应用算法获取切片数据集中的数据重新整合。本发明兼顾隐私保护、数据安全与流通效率的分布式数据治理范式,构建了面向跨域场景的体系化治理框架,实现了对“数据孤岛”的数据的高效利用。

    一种联邦数据学习的安全参数交换方法

    公开(公告)号:CN117786768A

    公开(公告)日:2024-03-29

    申请号:CN202410199786.8

    申请日:2024-02-23

    Abstract: 本发明提供了一种联邦数据学习的安全参数交换方法,属于数据安全技术领域。本发明采用第三方签名保护参数服务器的参数汇聚安全,目前还没有保护服务器的专利,本发明创新提出通过对参数服务器中的参数在读写、落盘和网络传输三个方面进行监控,来确保参数服务器进行安全的明文参数汇聚。本发明还通过采用RSA算法保护不安全环境下密码和参数安全通信,确保通信链路的安全,使链路劫持失效。本发明还采用加密强度可配置的训练节点参数加密措施,针对不同的训练节点的采用不同的加密强度,满足实际应用的各种安全场景要求,对训练节点进行安全保护。

    一种可信联邦智能安全计算平台的方法和装置

    公开(公告)号:CN117714217A

    公开(公告)日:2024-03-15

    申请号:CN202410167961.5

    申请日:2024-02-06

    Abstract: 本发明涉及电数字数据处理的领域,尤其是涉及一种可信联邦智能安全计算平台的方法和装置,方法包括如下步骤:参数服务器和节点通过公网连接,节点之间无连接,同时参数服务器和节点通过私链连接。参数服务器将初始参数和模型结构向节点发送;节点使用本地数据训练模型,获得参数和训练日志;节点将训练日志写入私链,将本地参数发送参数服务器;参数服务器将本地参数与之前汇聚后保存的参数进行聚合,获得聚合参数并向节点发送,将汇聚日志写入私链;节点直接与参数服务器交换参数,不等待其它节点。循环达预设次数或训练模型达到稳定后停止。本发明具有降低联邦学习中存在的泄密风险,提升联邦学习的安全性的效果。

    语音摘要生成模型训练方法、语音摘要生成方法及装置

    公开(公告)号:CN115827854B

    公开(公告)日:2023-08-11

    申请号:CN202211687868.4

    申请日:2022-12-28

    Abstract: 本发明涉及一种语音摘要生成模型训练方法、语音摘要生成方法及装置,训练方法包括如下步骤:提取样本文本的样本词语集合,以及提取样本音频数据的样本音频特征;将所述样本词语集合、所述样本音频特征进行多模态特征融合,获得多模态特征向量;根据样本文本所归属的领域,获得样本文本的领域权重;将所述领域权重加入所述多模态特征向量;将所述多模态特征向量输入摘要生成模型,通过逐步迭代训练获得最优摘要生成模型。本技术方案的语音摘要生成模型训练方法通过融合音频数据与文本的多模态信息,使生成的语音摘要更精确、重点性更强;并且通过校正多模态特征向量的领域,增强了语音摘要的领域倾向性,修正生成的语音摘要,使语音摘要更精准。

    语音摘要生成模型训练方法、语音摘要生成方法及装置

    公开(公告)号:CN115827854A

    公开(公告)日:2023-03-21

    申请号:CN202211687868.4

    申请日:2022-12-28

    Abstract: 本发明涉及一种语音摘要生成模型训练方法、语音摘要生成方法及装置,训练方法包括如下步骤:提取样本文本的样本词语集合,以及提取样本音频数据的样本音频特征;将所述样本词语集合、所述样本音频特征进行多模态特征融合,获得多模态特征向量;根据样本文本所归属的领域,获得样本文本的领域权重;将所述领域权重加入所述多模态特征向量;将所述多模态特征向量输入摘要生成模型,通过逐步迭代训练获得最优摘要生成模型。本技术方案的语音摘要生成模型训练方法通过融合音频数据与文本的多模态信息,使生成的语音摘要更精确、重点性更强;并且通过校正多模态特征向量的领域,增强了语音摘要的领域倾向性,修正生成的语音摘要,使语音摘要更精准。

    一种交互式人工智能技术评测方案的构建方法

    公开(公告)号:CN115810137A

    公开(公告)日:2023-03-17

    申请号:CN202310087037.1

    申请日:2023-02-09

    Abstract: 本发明公开了一种交互式人工智能技术评测方案的构建方法,涉及人工智能测评技术领域,方法包括以下步骤:步骤S1:构建数据层,数据层包括评测数据库、评测工具库、评测标准库和基准模型库;步骤S2:构建封装层;步骤S3:构建执行层。本发明基于评测工具、评测数据、评测标准、基准模型等要素,快速构建一个人工智能评测方案,从而解决人工智能评测经验和方法无法重复利用、评测要求技术门槛高的问题,提供了交互式的配置环境,支持用户通过拖拽配置的可视化方式快速构建复杂的评测方案流程,从而实现为不同类型人工智能任务快速开发新的评测方案。

    数据标注方法及装置
    37.
    发明授权

    公开(公告)号:CN113205163B

    公开(公告)日:2021-11-19

    申请号:CN202110764998.2

    申请日:2021-07-07

    Abstract: 本发明公开了一种数据标注方法及装置,该方法包括:利用无监督学习算法进行冷启动,对原始的无标签数据进行初级分类,生成弱和伪标签数据信息;对伪标签数据信息进行校验标注;对预设数量的弱标签数据信息进行标注,获得部分已标注数据,基于弱监督学习算法和部分已标注数据,对剩余的弱标签数据信息进行预标注,生成预标注结果;对预标注结果进行半监督学习算法的样本筛选,获得精品数据集;对精品数据集进行数据补充,获得全标签数据集;利用全标签数据集对无监督学习算法、弱监督学习算法和半监督学习算法进行算法迭代,获得优化的无监督学习算法、弱监督学习算法和半监督学习算法。本发明可以大幅减少人工标注成本,并提高数据标注效率。

    一种语音数据质量检测方法、装置、服务器及存储介质

    公开(公告)号:CN110580917A

    公开(公告)日:2019-12-17

    申请号:CN201910870667.X

    申请日:2019-09-16

    Abstract: 本发明提供一种语音数据质量检测方法、装置、服务器及存储介质,以帧为单位对待进行质量检测的语音数据进行分割得到至少一个语音帧,计算语音帧在预先设置的至少一个频段中每个频段的频谱能量值,并将利用至少一个语音帧中每个语音帧在频段的频谱能量值计算语音数据在频段的目标频谱能量值,分析语音数据在各个频段的目标频谱能量值得到语音数据的质量检测结果。本发明提供的技术方案通过对语音数据在不同频段的目标频谱能量值的计算可分析出语音数据的语音质量检测结果,实现了对语音数据质量的检测。

    一种图像标注方法及通用图像标注工具

    公开(公告)号:CN108829435A

    公开(公告)日:2018-11-16

    申请号:CN201810631648.7

    申请日:2018-06-19

    Abstract: 本申请提供了一种图像标注方法,根据图像标注需求对功能配置文件进行配置和解析,加载相应的功能模块,生成标注工具;根据所述标注工具中的绘制插件对图像进行标绘,并根据所述标注工具中的界面插件对标绘后的图像的属性进行标注,对图像进行标绘包括打点标绘、标线标绘、标框标绘和区域标绘。根据不同的图像标注需求可以灵活配置生成相应的标注工具,实现了打点标绘、标线标绘、标框标绘和区域标绘,还可以实现对标绘后的图像的属性进行标注,提高了图像标注的效率。

    联邦数据管控下的基于规则对齐的激励方法及装置

    公开(公告)号:CN119357754B

    公开(公告)日:2025-04-08

    申请号:CN202411911075.5

    申请日:2024-12-24

    Abstract: 本申请公开了一种联邦数据管控下的基于规则对齐的激励方法及装置,其首先指定联邦数据管控规则,同时从第一联邦节点和第二联邦节点获取用户的行为数据,并采用基于深度学习的数据处理技术对用户行为数据进行时序分析,以分别捕捉到第一联邦节点和第二联邦节点的用户行为特征,进而,通过将第一联邦节点用户行为特征和第二联邦节点用户行为特征分别与联邦数据管控规则进行语义关联分析,从而智能确定联邦节点的激励结果。这样,通过量化用户行为与联邦数据管控规则的一致性来调整联邦学习过程中各节点的权重分配,实现了对联邦学习参与者的公平激励,能够有效促进联邦学习环境中数据资源的高效利用,提高联邦学习的整体性能和隐私性。

Patent Agency Ranking