-
公开(公告)号:CN114020863A
公开(公告)日:2022-02-08
申请号:CN202111161716.6
申请日:2021-09-30
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06V30/148
Abstract: 本发明公开了一种视觉问答分析方法、装置、系统及计算机可读存储介质,该方法包括:获取图像和问题文本信息,并将图像和问题文本信息作为输入;判断图像中是否存在OCR信息,若存在,则采用字符识别网络对图像进行字符识别,得到多个字符结果及与每个字符结果各自对应的置信度得分;根据每个字符结果、各自对应的置信度得分以及预先建立的答案空间集合,得到与每个字符结合各自对应的相关答案空间及对应的分类概率值;根据各个分类概率值,从各个相关答案空间中确定出目标答案空间;本发明在使用过程中能够提高分类结果的准确性以及视觉问答结果的准确度。
-
公开(公告)号:CN119946378A
公开(公告)日:2025-05-06
申请号:CN202510406455.1
申请日:2025-04-02
Applicant: 浪潮电子信息产业股份有限公司
IPC: H04N21/81 , H04N21/854 , G06N3/045 , G06N3/096 , G06N3/0475 , G06N3/084 , G06N3/0464 , G06N3/094 , G06F16/783
Abstract: 本申请公开了一种文生视频生成方法、产品、设备及存储介质,涉及人工智能技术领域,包括:将文本描述和噪声向量输入至按照预设蒸馏策略训练的第一文生视频模型,以生成与文本描述匹配的视频和相应的视频隐向量;预设蒸馏策略为利用学生模型和基于注意力机制的扩散模型依次对历史高分辨率视频进行去噪,并基于去噪结果对应的损失对预设学生模型的模型参数进行更新;对视频隐向量进行上采样,并对得到的采样后向量和噪声向量进行拼接;将拼接后向量输入至基于多路状态空间模型的第二文生视频模型,以生成目标文生视频。本申请在基于注意力机制的基础上结合多路状态空间模型,通过多次推理,可提高文生视频的分辨率以及文生视频的生成效率。
-
公开(公告)号:CN114020863B
公开(公告)日:2025-04-29
申请号:CN202111161716.6
申请日:2021-09-30
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F16/3329 , G06F16/3331 , G06F16/34 , G06F16/35 , G06V30/148
Abstract: 本发明公开了一种视觉问答分析方法、装置、系统及计算机可读存储介质,该方法包括:获取图像和问题文本信息,并将图像和问题文本信息作为输入;判断图像中是否存在OCR信息,若存在,则采用字符识别网络对图像进行字符识别,得到多个字符结果及与每个字符结果各自对应的置信度得分;根据每个字符结果、各自对应的置信度得分以及预先建立的答案空间集合,得到与每个字符结合各自对应的相关答案空间及对应的分类概率值;根据各个分类概率值,从各个相关答案空间中确定出目标答案空间;本发明在使用过程中能够提高分类结果的准确性以及视觉问答结果的准确度。
-
公开(公告)号:CN117808127B
公开(公告)日:2024-05-28
申请号:CN202410230103.0
申请日:2024-02-29
Applicant: 浪潮电子信息产业股份有限公司
Abstract: 本发明公开了一种数据异构条件下的图像处理方法、联邦学习方法及装置,涉及图像处理技术领域,根据数据分布相似性对边缘计算设备分簇,簇内边缘计算设备具有相似的数据分布,可以让模型更好的捕捉到数据的特征,有效解决数据异构问题。簇内的边缘计算设备根据簇内树形聚合网络进行模型参数聚合,下层的边缘计算设备只向上一层中相应的边缘计算设备发送模型参数,而不向其他边缘计算设备发送模型参数,这样可以极大降低通信开销。边缘计算设备与边缘云服务器在联邦学习过程中进行两层模型参数聚合,得到准确可靠的图像处理模型,最终边缘计算设备使用该准确可靠的图像处理模型进行图像处理,可以提升图像处理的准确性与可靠性。
-
公开(公告)号:CN117808129B
公开(公告)日:2024-05-24
申请号:CN202410230139.9
申请日:2024-02-29
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06N20/00 , G06N5/04 , G06N3/098 , G06N3/082 , G06N3/0495 , G06N3/0442
Abstract: 本发明提供一种异构分布式学习方法、装置、设备、系统及介质,涉及计算机技术领域,方法应用于边缘设备,联邦学习系统包含多个边缘设备,多个边缘设备已划分至多个设备簇,方法包括:利用本地训练数据对本地的机器学习模型进行迭代训练;各边缘设备中的机器学习模型对应相同的模型结构及推理任务;对训练后的机器学习模型进行压缩,并将压缩后的机器学习模型参数发送至自身所在设备簇的簇头边缘设备;当自身属于簇头边缘设备时,对接收到的机器学习模型参数进行簇内聚合得到簇内聚合模型参数,并将簇内聚合模型参数发送至边缘云服务器进行全局聚合;可通过设备分簇及模型压缩减少联邦学习过程中的通信量,从而可提升通信效率。
-
公开(公告)号:CN117474796B
公开(公告)日:2024-04-05
申请号:CN202311813617.0
申请日:2023-12-27
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06T5/70 , G06T11/60 , G06T7/10 , G06N3/0455 , G06N3/0464 , G06V10/74
Abstract: 本发明涉及图像生成技术领域,具体公开了一种图像生成方法、装置、设备及计算机可读存储介质,在利用文生图扩散模型对待处理文本进行预设次数的去噪处理的过程中,在每次去噪处理中对生成的中间图像进行图像识别,根据图像识别结果和待处理文本的内容误差更新文生图扩散模型的第一阶段去噪向量,得到第二阶段去噪向量,以第二阶段去噪向量作为本次去噪处理的去噪向量;利用最终的第二阶段去噪向量生成与待处理文本对应的结果图像。通过两阶段去噪,加强了每次去噪过程中对待处理文本中包含的细节信息的把控,由此生成的结果图像可以对待处理文本中包含的细节信息进行精准刻画,从而提高了文本图像模态转换的准确性。
-
公开(公告)号:CN117808129A
公开(公告)日:2024-04-02
申请号:CN202410230139.9
申请日:2024-02-29
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06N20/00 , G06N5/04 , G06N3/098 , G06N3/082 , G06N3/0495 , G06N3/0442
Abstract: 本发明提供一种异构分布式学习方法、装置、设备、系统及介质,涉及计算机技术领域,方法应用于边缘设备,联邦学习系统包含多个边缘设备,多个边缘设备已划分至多个设备簇,方法包括:利用本地训练数据对本地的机器学习模型进行迭代训练;各边缘设备中的机器学习模型对应相同的模型结构及推理任务;对训练后的机器学习模型进行压缩,并将压缩后的机器学习模型参数发送至自身所在设备簇的簇头边缘设备;当自身属于簇头边缘设备时,对接收到的机器学习模型参数进行簇内聚合得到簇内聚合模型参数,并将簇内聚合模型参数发送至边缘云服务器进行全局聚合;可通过设备分簇及模型压缩减少联邦学习过程中的通信量,从而可提升通信效率。
-
公开(公告)号:CN117808128A
公开(公告)日:2024-04-02
申请号:CN202410230128.0
申请日:2024-02-29
Applicant: 浪潮电子信息产业股份有限公司
Abstract: 本发明公开了一种数据异构条件下的图像处理方法、联邦学习方法及装置,涉及图像处理技术领域,边缘云服务器根据数据分布相似性对边缘计算设备分簇,簇内边缘计算设备具有相似的数据分布,可以让模型更好的捕捉到数据的特征。边缘计算设备采用残差分级训练的方式进行模型训练,实现细粒度模型训练,缓解数据分布差异大的问题。边缘计算设备与边缘云服务器在联邦学习过程中进行三层模型参数聚合,得到准确可靠的图像处理模型,最终边缘计算设备使用该准确可靠的图像处理模型进行图像处理,可以提升图像处理的准确性与可靠性。
-
公开(公告)号:CN117808127A
公开(公告)日:2024-04-02
申请号:CN202410230103.0
申请日:2024-02-29
Applicant: 浪潮电子信息产业股份有限公司
Abstract: 本发明公开了一种数据异构条件下的图像处理方法、联邦学习方法及装置,涉及图像处理技术领域,根据数据分布相似性对边缘计算设备分簇,簇内边缘计算设备具有相似的数据分布,可以让模型更好的捕捉到数据的特征,有效解决数据异构问题。簇内的边缘计算设备根据簇内树形聚合网络进行模型参数聚合,下层的边缘计算设备只向上一层中相应的边缘计算设备发送模型参数,而不向其他边缘计算设备发送模型参数,这样可以极大降低通信开销。边缘计算设备与边缘云服务器在联邦学习过程中进行两层模型参数聚合,得到准确可靠的图像处理模型,最终边缘计算设备使用该准确可靠的图像处理模型进行图像处理,可以提升图像处理的准确性与可靠性。
-
公开(公告)号:CN117474796A
公开(公告)日:2024-01-30
申请号:CN202311813617.0
申请日:2023-12-27
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06T5/70 , G06T11/60 , G06T7/10 , G06N3/0455 , G06N3/0464 , G06V10/74
Abstract: 本发明涉及图像生成技术领域,具体公开了一种图像生成方法、装置、设备及计算机可读存储介质,在利用文生图扩散模型对待处理文本进行预设次数的去噪处理的过程中,在每次去噪处理中对生成的中间图像进行图像识别,根据图像识别结果和待处理文本的内容误差更新文生图扩散模型的第一阶段去噪向量,得到第二阶段去噪向量,以第二阶段去噪向量作为本次去噪处理的去噪向量;利用最终的第二阶段去噪向量生成与待处理文本对应的结果图像。通过两阶段去噪,加强了每次去噪过程中对待处理文本中包含的细节信息的把控,由此生成的结果图像可以对待处理文本中包含的细节信息进行精准刻画,从而提高了文本图像模态转换的准确性。
-
-
-
-
-
-
-
-
-