基于抽样子图的网络资源动态分配方法、系统及介质

    公开(公告)号:CN114826921B

    公开(公告)日:2024-05-17

    申请号:CN202210479810.4

    申请日:2022-05-05

    Abstract: 本发明公开了一种基于抽样子图的网络资源动态分配方法、系统及介质,包括对当前的网际网络和网络节点进行建模以得到图数据;确定图数据的最终特征向量;将最终特征向量输入抽样子图模型中进行处理,并计算隐层神经元被开启的概率分布,然后根据概率分布继续采样,并对显层神经元进行采样,从而更新网络的权重和偏置,并根据图数据的结构相似度来判断是否继续更新,若当前网络和上一次网络的结构相似度超过预设阈值时,则停止更新网络的权重和偏置;构建多层带权重的网络,并进行随机游走以得到满足预设条件的目标上下文,进而根据目标上下文中各个节点的状态自动分配网络资源。本发明不仅能够在小型网络中使用,更能在超大规模网络上进行网络资源分配。

    基于抽样子图的网络资源动态分配方法、系统及介质

    公开(公告)号:CN114826921A

    公开(公告)日:2022-07-29

    申请号:CN202210479810.4

    申请日:2022-05-05

    Abstract: 本发明公开了一种基于抽样子图的网络资源动态分配方法、系统及介质,包括对当前的网际网络和网络节点进行建模以得到图数据;确定图数据的最终特征向量;将最终特征向量输入抽样子图模型中进行处理,并计算隐层神经元被开启的概率分布,然后根据概率分布继续采样,并对显层神经元进行采样,从而更新网络的权重和偏置,并根据图数据的结构相似度来判断是否继续更新,若当前网络和上一次网络的结构相似度超过预设阈值时,则停止更新网络的权重和偏置;构建多层带权重的网络,并进行随机游走以得到满足预设条件的目标上下文,进而根据目标上下文中各个节点的状态自动分配网络资源。本发明不仅能够在小型网络中使用,更能在超大规模网络上进行网络资源分配。

    点云数据的优化分步配准方法

    公开(公告)号:CN112950686B

    公开(公告)日:2024-05-03

    申请号:CN202110345850.5

    申请日:2021-03-31

    Applicant: 苏州大学

    Abstract: 本发明涉及一种点云数据的优化分步配准方法,用于实现点云数据配准,点云数据的优化分步配准方法包括以下步骤:步骤一:预处理:对原始点云数据进行预处理,去除原始点云数据中的离群噪点并减小原始点云数据的规模,得到待配准的源点云数据;步骤二:粗配准:采用正态分布变换法对源点云数据进行变换,得到粗配准转换矩阵,从而利用粗配准转换矩阵对源点云数据进行变换而得到粗配准后的点云数据;步骤三:精确配准:采用引入模拟退火策略的迭代最近点法对粗配准后的点云数据进行多次迭代,得到最终变换结果。本发明能够实现较为精准、快速的点云配准,在收敛时间可控的前提下,能够亚欧消防指陷入局部极值的情况发生。

    一种基于环境交互的机器人实时控制方法

    公开(公告)号:CN114872049B

    公开(公告)日:2023-08-29

    申请号:CN202210610733.1

    申请日:2022-05-31

    Applicant: 苏州大学

    Inventor: 刘全 吴光军 朱斐

    Abstract: 本发明公开的一种基于环境交互的机器人实时控制方法,包括初始化行动者网络参数,评论家网络为,目标网络行动者参数和目标评论家参数,经验缓冲池,各个阶段间隔时间步,使用K‑means对已有样本进行聚类学习至数据收敛;获取机器人初始状态st,判断机器人初始状态st所属类簇中心;通过摄像头采集的视频数据得出当前机器人的状态信息,然后将此信息通过以太网传输到后台服务器,得到机器人下一步该执行的动作a;执行动作a,获得立即奖赏,并获取机器人下一状态,将经验放入经验缓冲池;从经验缓冲池中随机采样小批量的n个经验转移样本;通过最小化损失函数更新评论家网络参数通过策略梯度方法更新行动者网络参数,更新目标网络参数。

    基于自适应策略优化的家庭清洁机器人控制系统

    公开(公告)号:CN108523768B

    公开(公告)日:2020-09-18

    申请号:CN201810199176.2

    申请日:2018-03-12

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于自适应策略优化的家庭清洁机器人控制系统,包括传感系统、控制系统、清洁系统、驱动系统及电力系统,所述传感系统采集环境信息和电力系统信息,并将环境信息和电力系统信息传入控制系统,所述控制系统根据接收到的信息通过自适应策略控制方法来处理,并传递该控制信号到驱动系统和清洁系统。本发明通过在清洁机器人的控制系统中采用自适应策略优化方法,处理来自传感系统获取的环境信息,然后选择合适的行动,并利用传感系统传递控制系统的控制信号到驱动系统和清洁系统,使清洁机器人执行对应的行动来清洁家庭环境。

    基于部分感知马氏决策过程的机器人最优路径规划方法

    公开(公告)号:CN108680155B

    公开(公告)日:2020-09-08

    申请号:CN201810102240.0

    申请日:2018-02-01

    Applicant: 苏州大学

    Abstract: 本发明公开了基于部分感知马氏决策过程的机器人最优路径规划方法,机器人寻找到达目标位置的最优路径,以POMDP模型和SARSOP算法为基础,使用GLS搜索方法作为搜索时的启发式条件,在连续状态大规模观察空间问题中,使用本发明可避免早期经典算法使用基于试验作为启发式条件重复更新多条相似路径中,更新信念状态上下界的次数,且不影响最终的最优策略,提高算法效率,在相同时间内,机器人能够火车更优的策略,找到更优的路径。

    基于自动发现抽象动作的机器人分层强化学习初始化方法

    公开(公告)号:CN105955921B

    公开(公告)日:2019-03-26

    申请号:CN201610238118.7

    申请日:2016-04-18

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于自动发现抽象动作的机器人分层强化学习初始化方法,其特征在于:包括Q学习模块、创建抽象动作模块、状态‑抽象动作评估值Q(s,o)初始化模块以及分层强化学习模块,先利用Q学习模块让机器人与环境交互产生经验,然后基于这些经验使用创建抽象动作模块让机器人创建抽象动作,最后机器人通过初始化状态‑抽象动作评估值Q(s,o)初始化模块,从普通的强化学习转向分层强化学习模块进行分层强化学习,并记录学习结果。本发明通过对状态‑抽象动作评估值Q(s,o)进行初始化,使机器人采用分层强化学习方法求解复杂环境中的任务时收敛速度更快。

    基于部分感知马氏决策过程的机器人最优路径规划方法

    公开(公告)号:CN108680155A

    公开(公告)日:2018-10-19

    申请号:CN201810102240.0

    申请日:2018-02-01

    Applicant: 苏州大学

    Abstract: 本发明公开了基于部分感知马氏决策过程的机器人最优路径规划方法,机器人寻找到达目标位置的最优路径,以POMDP模型和SARSOP算法为基础,使用GLS搜索方法作为搜索时的启发式条件,在连续状态大规模观察空间问题中,使用本发明可避免早期经典算法使用基于试验作为启发式条件重复更新多条相似路径中,更新信念状态上下界的次数,且不影响最终的最优策略,提高算法效率,在相同时间内,机器人能够火车更优的策略,找到更优的路径。

    基于深度Q网络的废品回收机器人控制方法及其装置

    公开(公告)号:CN108415254A

    公开(公告)日:2018-08-17

    申请号:CN201810199112.2

    申请日:2018-03-12

    Applicant: 苏州大学

    CPC classification number: G05B13/042

    Abstract: 本发明公开了一种基于深度Q网络的废品回收机器人控制方法及其装置,其特征在于:所述传感系统:用于感知机器人面前物体位置信息,通过图像信息表示;所述控制系统:用于控制机器人抓取手臂抓取物体与放置物体于收纳机构内;所述作业系统:接收控制系统的信息,执行各项动作;所述驱动系统:用于为作业系统执行控制系统的各项动作提供动力;所述传感系统采集环境信息和驱动系统信息,并将环境信息和驱动系统信息传入控制系统,由控制系统根据接收到的信息来计算处理,并发送信息于作业、驱动系统驱动机器人执行相应动作。本发明运用人工智能领域的强化学习算法,能够自主学习更新神经网络的参数,以使机器人达到回收物品的控制效果。

Patent Agency Ranking