基于示教学习的决策树行为决策算法

    公开(公告)号:CN107479547B

    公开(公告)日:2020-11-24

    申请号:CN201710687194.0

    申请日:2017-08-11

    Applicant: 同济大学

    Abstract: 本发明公开了一种基于示教学习的决策树行为决策算法,主要解决现有技术中存在的现有决策算法不能同时兼顾综合复杂的场景和稳定的要求的问题。该一种基于示教学习的决策树行为决策算法包括步骤为:存储示教轨迹的状态转移规律;求取状态转移频率矩阵和状态转移概率矩阵;构建奖励;决策树对即将产生的动作进行评估;更新转移频率矩阵与状态转移概率矩阵;重复上述过程至评估通过。通过上述方案,本发明达到了无人驾驶行为决策应的最大合理性和安全性目的。

    基于马尔科夫跳变的分布式事件触发滤波系统及设计方法

    公开(公告)号:CN107065545B

    公开(公告)日:2020-03-24

    申请号:CN201710212237.X

    申请日:2017-04-01

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于马尔科夫跳变的分布式事件触发滤波系统及设计方法,该系统包括N条滤波链路,每条滤波链路包括依次连接的传感器、事件触发器、零阶保持器和滤波器,传感器连接被测对象,每条滤波链路中的滤波器还与其他邻居滤波器进行通信连接,该系统中N个滤波器之间的通信拓扑呈非齐次马尔可夫跳变形式,在每种非齐次马尔科夫链拓扑下,相互连接的滤波器进行信息交换,每条滤波链路中的滤波器还与所在滤波链路中对应的事件触发器连接。与现有技术相比,本发明具有良好的抗噪能力,而且在保证滤波性能的前提下有效降低数据传递次数、节约网络资源。

    一种序列化车道线地图的存储及检索方法

    公开(公告)号:CN110515942A

    公开(公告)日:2019-11-29

    申请号:CN201910630486.X

    申请日:2019-07-12

    Applicant: 同济大学

    Abstract: 本发明涉及一种序列化车道线地图的存储及检索方法,包括以下步骤:S1、采用栅格子地图的方式存储车道线的车道线数据,其中,车道线数据包括车道线编号数据和坐标数据;S2、根据车辆定位信息,获取对应的子地图,在对应的子地图中检索车道线数据,以得到完整的车道线信息。与现有技术相比,本发明在地图存储阶段,利用栅格子地图的方式统计有效子地图并存储车道线数据,根据车道线编号和坐标数据编码属性值;在地图使用阶段,通过车辆的定位信息,从子地图检索得到车道线数据属性值,解码获得车道线编号和坐标数据,将相同编号的车道线数据拟合得到完整车道线信息,本发明既能有效减小系统存储空间、提高检索速度,也能保证存储数据精度。

    一种改进的无人车快速搜索随机树路径规划方法

    公开(公告)号:CN108196536A

    公开(公告)日:2018-06-22

    申请号:CN201711395779.1

    申请日:2017-12-21

    Applicant: 同济大学

    Abstract: 本发明涉及一种改进的无人车快速搜索随机树路径规划方法,其特征在于,具体包括以下步骤:1)采用RRT算法搜索获取一条由起点到终点的初始路径;2)采用采用单向剪枝法对初始路径剪枝得到初步剪枝路径;3)对初步剪枝路径采用采用双向剪枝法进一步缩短路径的长度;4)采用削峰法去掉路径上的尖锐夹角,满足;5)对削峰后的路径进行平滑处理,得到无人车的跟随路径。与现有技术相比,本发明具有路径更短、考虑非完整约束等优点。

    一种基于模型预测控制的无人车避障方法

    公开(公告)号:CN107168319A

    公开(公告)日:2017-09-15

    申请号:CN201710403248.6

    申请日:2017-06-01

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于模型预测控制的无人车避障方法,包括以下步骤:1)建立无人驾驶车辆的动力学模型,描述无人驾驶车辆动力学特征;2)构建模型预测控制最优化问题的代价函数和约束条件:将障碍物威胁函数和关于目标位置的代价函数之和作为模型预测控制最优化问题的代价函数,并将无碰撞条件的合取约束作为约束条件之一;3)求解模型预测控制最优化问题,获取无人车避障的最优路径。与现有技术相比,本发明具有察觉域由设计者决定、具有更好的乘客舒适度水平等优点。

    基于马尔科夫跳变的分布式事件触发滤波系统及设计方法

    公开(公告)号:CN107065545A

    公开(公告)日:2017-08-18

    申请号:CN201710212237.X

    申请日:2017-04-01

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于马尔科夫跳变的分布式事件触发滤波系统及设计方法,该系统包括N条滤波链路,每条滤波链路包括依次连接的传感器、事件触发器、零阶保持器和滤波器,传感器连接被测对象,每条滤波链路中的滤波器还与其他邻居滤波器进行通信连接,该系统中N个滤波器之间的通信拓扑呈非齐次马尔可夫跳变形式,在每种非齐次马尔科夫链拓扑下,相互连接的滤波器进行信息交换,每条滤波链路中的滤波器还与所在滤波链路中对应的事件触发器连接。与现有技术相比,本发明具有良好的抗噪能力,而且在保证滤波性能的前提下有效降低数据传递次数、节约网络资源。

    一种分布式滤波网络系统及设计方法

    公开(公告)号:CN105606381A

    公开(公告)日:2016-05-25

    申请号:CN201610058593.6

    申请日:2016-01-28

    Applicant: 同济大学

    CPC classification number: G01M17/04

    Abstract: 本发明涉及一种分布式滤波网络系统及设计方法。该系统包括:滤波器网络单元:包括分布于不同物理站点的滤波器;传感器采样单元:包括车载传感器和滤波传感器,车载传感器内嵌于汽车悬架系统并采集其状态信息,滤波传感器内嵌于各滤波器内并采集该滤波器与设定的相邻滤波器的交流信息;事件触发单元:包括与各滤波器对应的事件触发器,各事件触发器分别决定对应滤波器事件发生时刻;在事件发生时刻,滤波器接收对应车载传感器采集的汽车悬架系统状态信息以及设定相邻的滤波器的交流信息,否则该滤波器不动作。与现有技术相比,本发明既能满足多终端同时获得数据的需求,又能有效防止滤波器网络崩溃,且能耗低、效率高、稳定性强。

    基于对数量化的网络控制系统L2-L∞滤波信息处理方法

    公开(公告)号:CN102651641B

    公开(公告)日:2015-03-04

    申请号:CN201110044899.3

    申请日:2011-02-24

    Applicant: 同济大学

    Abstract: 本发明涉及基于对数量化的网络控制系统L2-L∞滤波信息处理方法,包括以下步骤:1)网络控制系统发送端对输入的信号进行采样、量化以及编码处理后发送给接收端;2)接收端对接收的数据进行解码,并将解码后的数据传输给滤波器;3)滤波器对接收到的数据进行滤波处理,还原原系统信息。与现有技术相比,本发明具有实现了对网络控制系统在干扰影响下的具有性能参数γ的鲁棒L2-L∞滤波处理,在滤波信息处理方法设计中充分考虑了实际中由于采样、量化、丢包所带了的影响因素,从而更符合实际使用情况。

    一种考虑车辆横纵动力学耦合的Tube-based鲁棒模型预测跟踪控制方法

    公开(公告)号:CN119002278A

    公开(公告)日:2024-11-22

    申请号:CN202411131513.6

    申请日:2024-08-18

    Applicant: 同济大学

    Abstract: 本发明涉及一种考虑车辆横纵动力学耦合的Tube‑based鲁棒模型预测跟踪控制方法,包括以下步骤:建立车辆运动行为模型及其T‑S模糊模型;依据T‑S模糊模型离线计算反馈增益和实际‑标称误差的鲁棒正不变集,求解带有一系列线性矩阵不等式约束的Min‑Max问题得到最优控制输入。本发明改进了现有车辆Tube‑based模型预测跟踪控制方法,并建立车辆跟踪控制T‑S模糊模型,更精确的描述车辆运动行为。本发明考虑车辆横纵动力学耦合的Tube‑based鲁棒模型预测跟踪控制方法相比于与传统Tube‑based跟踪控制方法保守性更小,跟踪效果更好。

    一种基于策略梯度的分布式多智能体系统最优控制方法

    公开(公告)号:CN116699979A

    公开(公告)日:2023-09-05

    申请号:CN202310420548.0

    申请日:2023-04-19

    Applicant: 同济大学

    Inventor: 张皓 李燕 王祝萍

    Abstract: 本发明涉及一种基于策略梯度的分布式多智能体系统最优控制方法,其特征在于,包括以下步骤:基于离散时间非线性多智能体系统的性能指标,构建相应的状态‑动作价值函数;确定一个在容许控制集内的初始控制策略;根据多个状态‑动作价值函数和当前控制策略进行策略评估;根据策略评估结果,结合梯度下降的方法进行策略改进,得到下一轮迭代的策略,返回进行策略评估,直至学习到收敛的最优控制策略,其中,迭代优化过程基于Actor‑Critic结构和经验回放机制实现,采用critic网络逼近控制策略,采用actor网络逼近状态‑动作价值函数;基于最优控制策略控制分布式多智能体系统。与现有技术相比,本发明具有不依赖于模型、实时性、数据利用率高等优点。

Patent Agency Ranking