-
公开(公告)号:CN109444841B
公开(公告)日:2020-08-04
申请号:CN201811600312.0
申请日:2018-12-26
Applicant: 清华大学 , 中国人民解放军海军航空大学
IPC: G01S7/41
Abstract: 本发明公开了一种基于修正切换函数的平滑变结构滤波方法及系统,其中,该方法包括:根据雷达目标的运动过程和量测过程分别建立目标运动模型和雷达量测模型;利用目标运动模型和雷达跟踪的历史数据计算出当前时刻目标状态的预测值;根据雷达目标的运动状态和噪声的先验信息给定出目标运动模型和雷达量测模型的不确定度,根据不确定度的先验估计计算新息增益项;根据目标状态的预测值和新息增益项计算出目标状态的后验更新,并序贯迭代上述步骤对目标状态持续跟踪,直至雷达判断航迹终止。该方法采用双曲正切函数作为切换函数计算新息增益项,抑制滤波过程中的抖振现象,提高滤波器对未建模的系统不确定度的鲁棒性,获得更好的目标状态估计精度。
-
公开(公告)号:CN119398127A
公开(公告)日:2025-02-07
申请号:CN202411363120.8
申请日:2024-09-27
Applicant: 清华大学深圳国际研究生院
Abstract: 本发明提供一种大模型参数微调方法、装置、设备、介质及产品,属于人工智能技术领域,方法包括获取目标任务的数据集,根据所述数据集得到训练集;根据所述训练集、预设的微调策略和优化算法对大模型进行参数微调;其中,所述微调策略包括基于随机子空间迭代法对所述大模型的梯度进行低维投影。本发明通过随机子空间迭代法对所述大模型的梯度进行低维投影,在低微投影空间进行参数更新,相较于全参微调的方法,既减少了所需的显存,又减少了微调的时间。
-
公开(公告)号:CN119227814A
公开(公告)日:2024-12-31
申请号:CN202411731916.4
申请日:2024-11-29
Applicant: 清华大学深圳国际研究生院
Abstract: 本发明提供一种多机器人博弈仿真方法、仿真平台、电子设备及存储介质,属于人工智能技术领域,方法包括运行至少一环境实例,各环境实例中设有至少一己方机器人以及至少一对手机器人;在当前训练轮中,确定各环境实例共享的训练策略以及与各对手机器人对应的对手策略,将训练策略对应的第一控制指令发送至己方机器人并将对手策略对应的第二控制指令发送至对手机器人,以便己方机器人和对手机器人在环境实例中执行博弈任务。本发明在各环境实例中为己方机器人配置对手机器人,提高对抗训练经验多样性,实现对环境实例的充分探索,且各环境实例中的对手机器人均根据对手策略与共享策略的己方机器人进行对抗博弈,有助于制定更加稳健和通用的策略。
-
公开(公告)号:CN118247614B
公开(公告)日:2024-12-17
申请号:CN202410284922.3
申请日:2024-03-13
Applicant: 清华大学深圳国际研究生院
IPC: G06V10/80 , G06V20/64 , G06V20/70 , G06V10/25 , G06V10/46 , G06V10/52 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/048
Abstract: 本发明提供一种多智能体协同感知方法、设备及存储介质,涉及协同感知技术领域,所述方法包括:获取第一原始点云数据;根据第一原始点云数据,获取第一多尺度特征;对第一多尺度特征进行挑选处理,获取第一高信息量特征;将第一高信息量特征广播至各个协同智能体,获取第二高信息量特征;将第一高信息量特征与全部第二高信息量特征进行第二融合处理,获取融合协同特征;根据融合协同特征,生成检测结果信息。通过挑选获得的高信息量值的特征,降低噪声导致的感知偏差影响,同时降低通信带宽消耗提高协同效率。利用第一融合处理以及第二融合处理的双阶段融合,在不同阶段对传递的高信息量值的特征进行融合,降低协同感知过程中位姿噪声的影响。
-
公开(公告)号:CN118570454A
公开(公告)日:2024-08-30
申请号:CN202411053612.7
申请日:2024-08-02
Applicant: 深圳清华大学研究院
IPC: G06V10/25 , G06N3/045 , G06N3/0464 , G06N3/082 , G06N3/084 , G06N3/0895 , G06N3/09 , G06V10/22 , G06V10/764 , G06V10/766 , G06V10/774 , G06V10/82 , G06V20/13
Abstract: 本发明提供一种基于检测器解耦的半监督遥感目标检测方法及装置,涉及遥感图像处理技术领域,方法包括:将获取的待检测的遥感图像输入至目标检测模型,得到目标检测模型输出的检测结果;目标检测模型是基于无标签样本遥感图像、有标签样本遥感图像以及有标签样本遥感图像中至少一个样本目标的真实检测框的宽高比对应的权重进行训练得到的,目标检测模型用于对待检测的遥感图像中的至少一个目标进行检测。在训练目标检测模型时结合无标签样本遥感图像、有标签样本遥感图像以及有标签样本遥感图像中至少一个样本目标的真实检测框的宽高比对应的权重,使得目标检测模型的性能较好,从而提升遥感图像中目标检测的准确性。
-
公开(公告)号:CN118569066A
公开(公告)日:2024-08-30
申请号:CN202410620791.1
申请日:2024-05-20
Applicant: 清华大学深圳国际研究生院
IPC: G06F30/27 , G06F30/15 , G06N5/04 , G06N3/0475 , G06N3/0464 , G06N3/045 , G06N3/092
Abstract: 本发明公开了一种基于技能学习和自注意力的围捕多智能体强化学习方法。该方法包括:对海上围捕环境进行建模;构建强化学习模型用于训练无人艇智能体,其中,所述强化学习模型包括演员网络和评论家网络,所述演员网络包含多个策略网络,每个策略网络对应一个无人艇智能体,所述评论家网络用于评估策略网络所输出的策略性能;通过与所述海上围捕环境的交互,对无人艇智能体进行强化学习训练,以利用设定的总体奖励函数学习技能条件下的优化策略。本发明在多障碍物围捕环境下使用技能发现的方法与多智能体强化学习相结合,使用赋能的原理进行技能发现,能更好的组合单体技能与协调围捕技能,提高了围捕效率。
-
公开(公告)号:CN117763182A
公开(公告)日:2024-03-26
申请号:CN202311520512.6
申请日:2023-11-14
Applicant: 清华大学深圳国际研究生院
IPC: G06F16/55 , G06F16/583 , G06V10/774 , G06V10/764 , G06V10/40 , G06F17/16
Abstract: 本发明涉及遥感图像技术领域,提供一种舰船图像检索方法、装置、设备和存储介质,该方法包括:获取待检索的舰船图像;利用第一视觉模型,对待检索的舰船图像进行特征提取,得到待检索的舰船图像对应的目标特征向量;第一视觉模型为根据第二视觉模型和语言模型训练得到的;第一视觉模型和第二视觉模型的模型参数相同;利用第一视觉模型,对至少一个第一遥感图像分别进行特征提取,得到各个第一遥感图像对应的第一特征向量;根据各个第一遥感图像对应的第一特征向量以及目标特征向量,得到目标舰船图像。本发明中检索到的目标舰船图像与待检索的舰船图像的相似度更高,提高了细粒度舰船图像检索的准确度。
-
公开(公告)号:CN117689997A
公开(公告)日:2024-03-12
申请号:CN202311817081.X
申请日:2023-12-26
Applicant: 清华大学深圳国际研究生院
IPC: G06V10/82 , G06V10/774 , G06V20/56 , G06N3/082
Abstract: 本发明提供一种检测模型剪枝方法、装置、电子设备和存储介质,属于目标检测技术领域,方法包括:对待剪枝检测模型的网络层进行分解,得到分解网络层;根据分解网络层之间的连接关系和剪枝策略,构建分解网络层的依赖图;根据依赖图对分解网络层进行分组,得到网络层分组;对网络层分组进行稀疏性训练,确定网络层分组的重要性以及网络层分组中参数的重要性;根据网络层分组的重要性、参数的重要性以及预设的剪枝率,对网络层分组中参数进行移除以完成剪枝。本发明利用依赖图描述分解网络层的依赖关系,在对网络层分组中相互依赖的参数剪枝时会一并移除,避免破坏网络结构,稀疏性训练使得网络层分组内耦合的参数都是稀疏的,避免移除重要参数。
-
-
-
-
-
-
-