-
公开(公告)号:CN118964822A
公开(公告)日:2024-11-15
申请号:CN202411048412.2
申请日:2024-08-01
申请人: 上海交通大学 , 中国人民解放军国防科技大学
摘要: 本发明涉及数据分析技术领域,具体公开了一种基于分块Cholesky分解交叉方向乘子法的状态估计方法,采用下述步骤:基于传感器的测量信息和动态系统的先验信息获取无人船状态估计对应的目标状态数据;采用交叉方向乘子法,引入辅助变量和惩罚参数,将状态估计方程转化为迭代求解的拉格朗日子方程;提出一种分块Cholesky分解方法,求解得到的拉格朗日子方程。本发明采用基于拉格朗日的交叉方向乘子法,能达到更高的精度;同时,在每次拉格朗日迭代过程,提出分块Cholesky分解,将大规模矩阵运算采用分块的形式,转化为多个子矩阵求解,并利用Cholesky分解后的上三角矩阵和下三角矩阵形式特性,将问题简化为两组顺序迭代方程,在处理长时间步长问题,计算速度更快。
-
公开(公告)号:CN118964821A
公开(公告)日:2024-11-15
申请号:CN202411048411.8
申请日:2024-08-01
申请人: 上海交通大学 , 中国人民解放军国防科技大学
IPC分类号: G06F17/18 , G06F18/2415 , G06F17/16 , G06N3/084
摘要: 本发明涉及数据分析技术领域,具体公开了一种基于交叉方向乘子法的并行状态估计方法;本发明首先建立普适情况下即非线性情况的状态估计模型,并构造相应的拉格朗日方程。结合高斯牛顿法解决非线性系统无法通过梯度求解的情况,引入分块Cholesky分解思想优化拉格朗日子方程的迭代计算。最后提出一种并行算法求解顺序迭代方程。本发明能够克服传统的贝叶斯及平滑方法处理高维问题的困难,考虑复杂海洋环境的影响,建立了普适性的约束方程及相应的状态估计模型;结合高斯‑牛顿法处理拉格朗日子方程中出现的非线性情况无法应用梯度下降法求解问题。提出了并行算法,将具有依赖性的顺序求解转换为并行计算,极大的提高了算法的效率。
-
公开(公告)号:CN118764958A
公开(公告)日:2024-10-11
申请号:CN202410976604.3
申请日:2024-07-20
申请人: 中国人民解放军国防科技大学
IPC分类号: H04W72/044 , H04W72/541 , H04W72/50 , H04W4/42 , G06N3/0455 , G06N3/0499
摘要: 本申请涉及一种基于预训练注意力编码器的无人机集群干扰资源分配方法。所述方法包括:利用干扰效果评估模型以及无人机集群消耗的干扰功率设置干扰资源分配问题的目标函数,结合拒止条件下无人机通信、能源以及飞行速度受限情况,将干扰资源分配问题建模为带约束条件的组合优化问题,组合优化问题将组合优化问题中的干扰决策过程建模为分布式局部可观测马尔科夫博弈模型,将无人机映射为智能体,利用基于预训练注意力编码器的MAPPO算法对模型进行求解,得到无人机集群的干扰资源分配方案。采用本方法能够解决了多智能体协同决策过程中状态空间维度爆炸和环境非平稳问题。
-
公开(公告)号:CN113806490B
公开(公告)日:2023-06-13
申请号:CN202111132324.7
申请日:2021-09-27
申请人: 中国人民解放军国防科技大学
IPC分类号: G06F16/33 , G06N3/0442 , G06N3/08
摘要: 本发明公开了一种基于BERT采样的文本通用触发器生成系统和方法,设置初始单词序列长度m及批次大小n,将初始单词序列复制n份得到n个单词序列,在其上随机选择第i个位置,将初始单词序列输入到BERT语言模型中,获得第i个位置单词的概率分布;采样一个单词y,将第i个位置的原始掩码符号替换为单词y,得到一批初始触发词序列,并连接到数据测试集的所有样本上,输入到目标模型进行测试;将测试结果传输到BERT采样模块,并调整单词分布概率,然后采样获得候选单词;继续将候选单词在除第i个位置外的其他位置上进行替换,直到目标模型的预测错误率达到设定值阈值以上,输出触发器序列。本发明具有效率高、质量好的优点。
-
公开(公告)号:CN113806490A
公开(公告)日:2021-12-17
申请号:CN202111132324.7
申请日:2021-09-27
申请人: 中国人民解放军国防科技大学
摘要: 本发明公开了一种基于BERT采样的文本通用触发器生成系统和方法,设置初始单词序列长度m及批次大小n,将初始单词序列复制n份得到n个单词序列,在其上随机选择第i个位置,将初始单词序列输入到BERT语言模型中,获得第i个位置单词的概率分布;采样一个单词y,将第i个位置的原始掩码符号替换为单词y,得到一批初始触发词序列,并连接到数据测试集的所有样本上,输入到目标模型进行测试;将测试结果传输到BERT采样模块,并调整单词分布概率,然后采样获得候选单词;继续将候选单词在除第i个位置外的其他位置上进行替换,直到目标模型的预测错误率达到设定值阈值以上,输出触发器序列。本发明具有效率高、质量好的优点。
-
公开(公告)号:CN117176287A
公开(公告)日:2023-12-05
申请号:CN202311045855.1
申请日:2023-08-18
申请人: 中国人民解放军国防科技大学
摘要: 本申请涉及一种基于改进PPO算法的多机通信干扰资源分配方法及装置。所述方法包括:采用马尔科夫模型确定多机通信的干扰资源分配任务。根据所述干扰资源分配任务获取当前时刻的干扰环境状态,当前时刻的干扰环境状态经正态化后输入至策略网络进行训练,得到当前时刻的干扰环境状态对应的第一分配策略。根据第一分配策略与经正态化后的下一时刻的干扰环境状态作为训练样本,样本基于改进PPO算法的价值网络进行强化学习,得到最优干扰资源分配策略。采用本方法能够在干扰资源有限的条件下,提高压制干扰的成功率,实现多机协同干扰的干扰效益最大化。
-
-
-
-
-