-
公开(公告)号:CN117194214A
公开(公告)日:2023-12-08
申请号:CN202210715644.3
申请日:2022-06-02
Applicant: 南京大学
IPC: G06F11/36 , G06V20/62 , G06V10/44 , G06V10/82 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/084 , G06N3/092
Abstract: 一种基于深度图像理解的通用型强化学习软件遍历测试技术,由交互功能模块,图像理解模块,强化学习探索模块组成。交互功能模块通过对软件应用运行时页面截屏捕获,解码执行强化学习探索模块提供动作,实现与应用的交互。深度图像理解模块通过对截屏图像进行分析编码,分别生成状态与可执行动作的特征向量。强化学习探索模块利用DQN架构对状态‑动作输入计算效用,进行比较,选择合适动作作为输出。通过结合图像理解和强化学习,摆脱平台接口的限制,实现对软件应用跨平台的高效测试。
-
公开(公告)号:CN119129638A
公开(公告)日:2024-12-13
申请号:CN202411624958.8
申请日:2024-11-14
Applicant: 南京大学
IPC: G06N3/006 , G06N3/0455 , G06N3/0464 , G06F40/20 , G06F18/241
Abstract: 本发明公开一种基于自然语言指令的高效人机协作策略部署方法,该方法借助于自然语言指导的条件扩散模型的强大表征能力,将多样化队友的最优协作策略参数压缩为单个条件扩散模型,在部署阶段基于人类队友提供的自然语言指令,为队友生成定制化的协作策略。该方法能够在试错成本较高的实际场景中仅通过少量自然语言指令实现协作策略的生成和部署,能够保证人机协作策略部署的高效性。
-
公开(公告)号:CN114138653A
公开(公告)日:2022-03-04
申请号:CN202111471771.5
申请日:2021-11-30
Applicant: 南京大学
Abstract: 一种基于深度图像理解的移动应用跨平台强化学习遍历测试技术,包括交互模块,深度图像理解模块,强化学习模块。交互模块通过对apk运行中的状态进行截屏捕获,提供给深度图像理解模块,并通过强化学习模块选择动作执行,从而与移动应用进行交互。深度图像理解模块通过截屏编码器对应用当前界面截图并分析,分别生成状态和可执行动作编码后的特征向量。强化学习模块通过DQN模型分析状态、动作对的优劣,选择最佳可执行动作,实现对移动应用状态空间的高效探索。
-
公开(公告)号:CN119443202A
公开(公告)日:2025-02-14
申请号:CN202411580804.3
申请日:2024-11-07
Applicant: 南京大学
IPC: G06N3/094 , G06N3/092 , G06F18/214
Abstract: 本发明公开一种基于强化学习的多无人机协同对抗学习方法,设计基于多智能体间的通信机制并结合长短期记忆网络的特征聚合提取模块,准确高效地提取战场态势特征;采用分层强化学习方法,引入底层机动控制模块和上层作战决策模块,分别实现底层控制和上层决策,基于高效环境并行模块进行训练,提升复杂作战场景下的作战策略训练效率;此外,通过基于种群演化多样化的多智能体博弈训练模块提升了作战策略的泛化能力。本发明能够有效提取战场态势特征,进行高效协同作战训练,从而适应复杂多变的战场环境,提高无人机自主协同作战的泛化能力。
-
公开(公告)号:CN119443202B
公开(公告)日:2025-04-22
申请号:CN202411580804.3
申请日:2024-11-07
Applicant: 南京大学
IPC: G06N3/094 , G06N3/092 , G06F18/214
Abstract: 本发明公开一种基于强化学习的多无人机协同对抗学习方法,设计基于多智能体间的通信机制并结合长短期记忆网络的特征聚合提取模块,准确高效地提取战场态势特征;采用分层强化学习方法,引入底层机动控制模块和上层作战决策模块,分别实现底层控制和上层决策,基于高效环境并行模块进行训练,提升复杂作战场景下的作战策略训练效率;此外,通过基于种群演化多样化的多智能体博弈训练模块提升了作战策略的泛化能力。本发明能够有效提取战场态势特征,进行高效协同作战训练,从而适应复杂多变的战场环境,提高无人机自主协同作战的泛化能力。
-
公开(公告)号:CN119129638B
公开(公告)日:2025-03-25
申请号:CN202411624958.8
申请日:2024-11-14
Applicant: 南京大学
IPC: G06N3/006 , G06N3/0455 , G06N3/0464 , G06F40/20 , G06F18/241
Abstract: 本发明公开一种基于自然语言指令的高效人机协作策略部署方法,该方法借助于自然语言指导的条件扩散模型的强大表征能力,将多样化队友的最优协作策略参数压缩为单个条件扩散模型,在部署阶段基于人类队友提供的自然语言指令,为队友生成定制化的协作策略。该方法能够在试错成本较高的实际场景中仅通过少量自然语言指令实现协作策略的生成和部署,能够保证人机协作策略部署的高效性。
-
-
-
-
-