视觉问答及其模型训练方法、装置、电子设备、存储介质

    公开(公告)号:CN117892140B

    公开(公告)日:2024-05-31

    申请号:CN202410295706.9

    申请日:2024-03-15

    Abstract: 本发明公开了一种视觉问答及其模型训练方法、装置、电子设备、存储介质,应用于人工智能领域。其中,方法包括获取视觉问答训练样本数据集;将问题‑图像对样本输入至视觉问答模型,图文编码器对问题‑图像对样本进行图文编码处理,交互解码器从接收到的图文编码特征中提取交互对象的语义特征,推理解码器融合接收到的图文编码特征和交互对象特征,并基于融合图文编码特征对应的正确答案‑正确事件知识标签、与从知识库检索的答案、事件知识间的损失不断地迭代更新,直至满足预设模型训练结束条件。本发明可以解决相关技术无法满足用户高精度问答需求和答案可解释需求的问题,提升了基于场景交互任务中的视觉问答精度,让答案更具有可解释性。

    机器学习方法、装置、设备、联邦学习系统及存储介质

    公开(公告)号:CN117808126B

    公开(公告)日:2024-05-28

    申请号:CN202410230008.0

    申请日:2024-02-29

    Abstract: 本发明公开了一种机器学习方法、装置、设备、联邦学习系统及存储介质,属于边缘计算领域,用于在模型聚合过程中识别并剔除恶意用户的模型数据,解决了恶意用户攻击导致模型精度下降的问题。一方面边缘计算设备可以在簇内选择与自身的相关性达标的边缘计算设备的模型参数对自身的模型参数进行更新,另一方面簇头在进行簇内聚合时可以排除异常的边缘计算设备的模型参数,通过两层的风险识别,可以精准的识别并忽略异常的模型参数,排除了风险,有利于提升最终得到的全局网络模型的性能,使中心服务器在工业设备故障预测、网络安全问题识别与图片分类时发挥最优的效果,也避免了全局网络模型学习到恶意用户希望的特定行为。

    一种图像生成方法、系统、电子设备及可读存储介质

    公开(公告)号:CN117808923B

    公开(公告)日:2024-05-14

    申请号:CN202410224976.0

    申请日:2024-02-29

    Abstract: 本发明公开了一种图像生成方法、系统、电子设备及可读存储介质,涉及图像内容生成领域,为解决纯文本生成图像的方案不能满足特定任务场景下的情感需求,该图像生成方法包括:获取语义指导文本和情绪指导文本;基于语义指导文本和情绪指导文本检索得到多个参考图像样本;提取多个参考图像样本的特征,对所有特征中的至少两个特征进行组合得到多个图像组合语义特征;获取语义指导文本对应的文本语义特征,基于与文本语义特征的相似度最高的图像组合语义特征生成关联图像。本发明能够提高图像生成精度,使生成的关联图像与指导文本和情绪文本高度关联,在满足任务场景的语义文本要求的同时,满足该任务场景下的情感需求。

    任务处理方法、装置、云边端系统、设备及介质

    公开(公告)号:CN117808036B

    公开(公告)日:2024-04-30

    申请号:CN202410224860.7

    申请日:2024-02-29

    Abstract: 本发明涉及人工智能技术领域,公开了一种任务处理方法、装置、云边端系统、设备及介质,应用于云边端系统的边缘服务器,包括:响应于推理请求,将待处理任务输入至深度学习模型中进行推理,以获取相应的任务结果;在推理的过程中,针对待处理任务进行上下文查询,获取待处理任务的重复利用效率;根据重复利用效率,动态调整深度学习模型对应的缓存数据;缓存数据包含待处理任务在深度学习模型中推理产生的中间数据和任务结果;同时,将上下文查询到的数据发送至人工智能生成内容应用程序对应的其他边缘服务器。深度学习模型对应的缓存会随着输入任务的重复利用效率被动态调整,可以提高任务处理速度和数据传输效率,节省计算资源,降低总成本。

    数据识别方法、模型训练方法、装置、设备及存储介质

    公开(公告)号:CN116756536B

    公开(公告)日:2024-04-26

    申请号:CN202311034853.2

    申请日:2023-08-17

    Abstract: 本发明公开了一种数据识别方法、模型训练方法、装置、设备及存储介质,涉及计算机技术领域,旨在解决传统技术中无法对多源域数据进行快速高效识别的问题,所述数据识别方法应用于客户端,包括:获取初始识别模型;所述初始识别模型包括本地模型和全局模型;利用本地样本对所述初始识别模型进行训练,获得本地模型梯度和全局模型梯度;将所述全局模型梯度上传至服务器,以使所述服务器利用各所述全局模型梯度对服务器模型参数进行更新处理,获得服务器模型更新参数;利用所述本地模型梯度对本地模型参数进行更新,利用所述服务器模型更新参数对全局模型参数进行更新,直至获得满足预设条件的数据识别模型;利用所述数据识别模型执行数据识别操作。

    视频语言任务执行及其模型训练方法、装置、设备、介质

    公开(公告)号:CN117876940A

    公开(公告)日:2024-04-12

    申请号:CN202410270242.6

    申请日:2024-03-11

    Abstract: 本发明公开了一种视频语言任务执行及其模型训练方法、装置、设备、介质,应用于视频理解技术领域。其中,方法包括将具有文本标签的视频样本、待学习视频参数和待学习帧参数输入至视频语言模型,视觉语言预训练模型提取视觉特征和参数特征,视频帧适配器基于待学习帧参数,将视觉特征转换为满足视觉语言预训练模型需求的帧视觉信息,视频适配器基于待学习视频参数提取视频视觉信息;根据帧视觉信息、视频视觉信息与文本语义特征之间损失信息,对视频语言模型进行迭代更新,直至满足预设模型训练结束条件。本发明可以解决相关技术视频语言模型收敛慢,训练耗时耗资源的问题,能够有效提升视频语言模型的训练效率,节省模型训练所需的计算资源。

    一种图像生成方法、系统、电子设备及可读存储介质

    公开(公告)号:CN117808923A

    公开(公告)日:2024-04-02

    申请号:CN202410224976.0

    申请日:2024-02-29

    Abstract: 本发明公开了一种图像生成方法、系统、电子设备及可读存储介质,涉及图像内容生成领域,为解决纯文本生成图像的方案不能满足特定任务场景下的情感需求,该图像生成方法包括:获取语义指导文本和情绪指导文本;基于语义指导文本和情绪指导文本检索得到多个参考图像样本;提取多个参考图像样本的特征,对所有特征中的至少两个特征进行组合得到多个图像组合语义特征;获取语义指导文本对应的文本语义特征,基于与文本语义特征的相似度最高的图像组合语义特征生成关联图像。本发明能够提高图像生成精度,使生成的关联图像与指导文本和情绪文本高度关联,在满足任务场景的语义文本要求的同时,满足该任务场景下的情感需求。

    机器学习方法、装置、设备、联邦学习系统及存储介质

    公开(公告)号:CN117808126A

    公开(公告)日:2024-04-02

    申请号:CN202410230008.0

    申请日:2024-02-29

    Abstract: 本发明公开了一种机器学习方法、装置、设备、联邦学习系统及存储介质,属于边缘计算领域,用于在模型聚合过程中识别并剔除恶意用户的模型数据,解决了恶意用户攻击导致模型精度下降的问题。一方面边缘计算设备可以在簇内选择与自身的相关性达标的边缘计算设备的模型参数对自身的模型参数进行更新,另一方面簇头在进行簇内聚合时可以排除异常的边缘计算设备的模型参数,通过两层的风险识别,可以精准的识别并忽略异常的模型参数,排除了风险,有利于提升最终得到的全局网络模型的性能,使中心服务器在工业设备故障预测、网络安全问题识别与图片分类时发挥最优的效果,也避免了全局网络模型学习到恶意用户希望的特定行为。

    任务处理方法、装置、云边端系统、设备及介质

    公开(公告)号:CN117808036A

    公开(公告)日:2024-04-02

    申请号:CN202410224860.7

    申请日:2024-02-29

    Abstract: 本发明涉及人工智能技术领域,公开了一种任务处理方法、装置、云边端系统、设备及介质,应用于云边端系统的边缘服务器,包括:响应于推理请求,将待处理任务输入至深度学习模型中进行推理,以获取相应的任务结果;在推理的过程中,针对待处理任务进行上下文查询,获取待处理任务的重复利用效率;根据重复利用效率,动态调整深度学习模型对应的缓存数据;缓存数据包含待处理任务在深度学习模型中推理产生的中间数据和任务结果;同时,将上下文查询到的数据发送至人工智能生成内容应用程序对应的其他边缘服务器。深度学习模型对应的缓存会随着输入任务的重复利用效率被动态调整,可以提高任务处理速度和数据传输效率,节省计算资源,降低总成本。

    一种任务处理方法、装置、系统、设备及可读存储介质

    公开(公告)号:CN117094376B

    公开(公告)日:2024-02-23

    申请号:CN202311352992.X

    申请日:2023-10-19

    Abstract: 本发明在计算机应用技术领域公开了一种任务处理方法、装置、系统、设备及可读存储介质,该方法利用会话基础大模型对输入信息进行处理,得到用户意图;将用户意图输入动作状态管理器进行动作分析,得到处理用户意图的动作序列;从工具库中选出与动作序列匹配的目标工具;调用目标工具,执行动作序列中的动作。本发明的技术效果:提供了实现通用人工智能AGI的一个新范式,让智能体学会使用工具,并基于行为/动作作为驱动,将基础模型与现有工具连接起来,从而执行多样化的任务。进一步,可实现通用人工智能的一致性互联,实现功能池的虚拟可扩展,实现现有工具的高效利用,实现现有数据重复利用,提高效率。

Patent Agency Ranking