-
公开(公告)号:CN118759921B
公开(公告)日:2024-12-31
申请号:CN202410825029.7
申请日:2024-06-25
Applicant: 之江实验室
IPC: G05B19/042
Abstract: 本发明公开了一种基于对抗技能嵌入和分层强化学习的战斗机飞行控制方法,其设计了基于对抗生成式算法和深度强化学习算法共同组成的对抗技能嵌入学习框架,利用专家飞行数据由AI算法自动学习底层控制指令到宏机动技能的映射,并通过复用这些宏机动技能,显著降低下游空战任务的学习难度,大幅压缩强化学习算法的收敛时间,提升空战智能体的博弈性能,并赋予了空战智能体更高的灵活性和快速迁移能力,为空战智能体的实用化训练和部署探明了一条新技术路径。
-
公开(公告)号:CN118691951A
公开(公告)日:2024-09-24
申请号:CN202410679654.5
申请日:2024-05-29
Applicant: 之江实验室
Abstract: 本发明公开了一种基于多模型混合的文本视频一致性评估方法和装置,属于文本视频一致性评估技术领域,包括:从文本标注中获取视频问答对,从视频数据中获取目标运动轨迹,将视频问答对、目标运动轨迹和视频数据输入微调多模态大模型,得到预测回答,根据预测回答和视频问答对得到第一得分;将视频数据通过基于强化学习的图像字幕提取模型得到预测文本,根据预测文本与文本标注计算第二得分;对第一得分和第二得分加权融合,得到最终得分,根据最终得分所在质量等级与人工评估所在质量等级的相符情况实现对文本视频一致性的评估。本发明通过融合两个模型在语义特征空间和视觉特征空间的文本视频一致性得分,提高了文本视频一致性评估的准确率。
-
公开(公告)号:CN118570064A
公开(公告)日:2024-08-30
申请号:CN202410688395.2
申请日:2024-05-30
Applicant: 之江实验室
IPC: G06T3/4053 , G06T5/70 , G06T5/60 , G06N3/0464 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本发明公开了一种免训练使用扩散模型中先验知识的超分方法、装置及存储介质,包括:将图像输入到基于GAN的初步超分模型,产出初步高分辨率图像;提取输入图像的语义标签;将初步高分辨率图像进行前向加噪;将前向加噪后的初步高分辨率图片输入到预训练的扩散模型中进行去噪,通过语义标签控制恢复图像,恢复得到高频细节信息;将输入图像通过高斯模糊得到低频轮廓图,将低频轮廓图和高频细节信息结合得到超分辨率图像。本发明可以在极低的时间内高质量地完成超分任务。本发明可以完全不需要额外训练,可以轻松适应不同的预训练模型。且由于没有针对某一模型训练的模块,而是根据扩散模型本身的原理工作,可适配任何预训练的文生图扩散模型。
-
公开(公告)号:CN118759921A
公开(公告)日:2024-10-11
申请号:CN202410825029.7
申请日:2024-06-25
Applicant: 之江实验室
IPC: G05B19/042
Abstract: 本发明公开了一种基于对抗技能嵌入和分层强化学习的战斗机飞行控制方法,其设计了基于对抗生成式算法和深度强化学习算法共同组成的对抗技能嵌入学习框架,利用专家飞行数据由AI算法自动学习底层控制指令到宏机动技能的映射,并通过复用这些宏机动技能,显著降低下游空战任务的学习难度,大幅压缩强化学习算法的收敛时间,提升空战智能体的博弈性能,并赋予了空战智能体更高的灵活性和快速迁移能力,为空战智能体的实用化训练和部署探明了一条新技术路径。
-
公开(公告)号:CN118691467A
公开(公告)日:2024-09-24
申请号:CN202410688411.8
申请日:2024-05-30
Applicant: 之江实验室
IPC: G06T3/4053 , G06T3/4046 , G06T3/4038 , G06T5/77 , G06T5/60 , G06V20/70 , G06V10/77 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0455
Abstract: 本发明提供一种图像超分辨率的加速方法、系统、装置及存储介质,本发明识别和利用图像中不同区域的信息量差异,进而对这些区域采取差异化的处理策略,通过一种算法识别出图像中信息量丰富的区域和信息量较少的区域,对于识别出的不同区域,本发明采用不同的超分辨率恢复策略,对于信息量丰富的区域,可以采用更为精细的算法,以确保在放大过程中细节的准确恢复;而对于信息量较少的区域,则可以采用更快但可能略微粗糙的算法,以节省处理时间;在保证图像超分质量的前提下,本发明通过智能选择处理策略,显著提高了图像超分辨率的处理速度。
-
公开(公告)号:CN118612509A
公开(公告)日:2024-09-06
申请号:CN202410688412.2
申请日:2024-05-30
Applicant: 之江实验室
IPC: H04N21/44 , H04N21/431 , H04N21/488
Abstract: 本发明公开了一种基于重要性评估的多模态个性化扩散模型视频生成及加速装置和方法,包括:用于对原视频和图像数据进行文本字幕消除和低质量图像筛选过滤的视频图像预处理模块,用于向开源预训练的文本做引导的视频生成扩散模型内注入实体位置的条件信息的文本、实体位置控制的视频生成扩散模型训练微调模块,用于调整视频生成模型的噪声初始化的文本、实体位置控制的视频生成扩散模型优化模块,文本、实体位置控制的视频生成扩散模型推理加速模块和文本、实体位置控制的视频生成扩散模型编辑调整模块。本发明能够解决模型生成质量差、生成效率低、模态信息单一和未充分挖掘扩散模型生成过程中特征间联系的技术问题。
-
-
-
-
-