一种基于因果强化学习的图节点遍历问题求解方法

    公开(公告)号:CN116738010A

    公开(公告)日:2023-09-12

    申请号:CN202311001415.6

    申请日:2023-08-10

    Abstract: 本发明公开了一种基于因果强化学习的图节点遍历问题求解方法,属于数据处理领域,包括以下步骤:S1、将图节点遍历问题抽象为因果强化学习的目标空间;S2、定义图节点遍历问题的优化目标、状态空间、动作空间、策略、奖励函数和奖励期望;S3、智能体从已完成建模的因果强化学习环境中学习图节点遍历问题求解方法。本发明采用上述基于因果强化学习的图节点遍历问题求解方法,在结合因果推断与强化学习,以实现对复杂图节点遍历问题的高效解决的基础上,不仅能提高模型的可解释性,理解模型的决策过程,还能够显著提高模型在处理大规模和复杂图节点遍历问题上的性能,节省计算资源,提高计算效率。

    一种基于知识与数据联合的路径规划方法、应用及装置

    公开(公告)号:CN117808180B

    公开(公告)日:2024-07-05

    申请号:CN202311816500.8

    申请日:2023-12-27

    Abstract: 本发明属于数据处理技术领域,公开了一种基于知识与数据联合的路径规划方法、应用及装置,将物流配送路径优化问题抽象为因果强化学习的目标空间,其中图的节点代表物流配送地点,边代表连接这些地点的道路;定义物流配送路径优化问题的优化目标、状态空间、动作空间、策略、奖励函数和奖励期望;利用智能体在已完成建模的因果强化学习环境中对物流配送路径优化问题进行学习求解,以找出最优的货物配送策略。传统的物流配送求解方法往往基于静态数据进行路径规划。而新的方法和系统能够动态调整配送策略,提高物流效率和准确性。最后,本发明基于所提出的每一种子方法均给出其对应的硬件实现,在计算机硬件层面对其内部求解性能做出了优化。

    基于注意力的锂离子电池日历老化预测模型和方法

    公开(公告)号:CN115718263B

    公开(公告)日:2023-04-07

    申请号:CN202310023441.2

    申请日:2023-01-09

    Abstract: 本发明公开了一种基于注意力的锂离子电池日历老化预测模型和方法(Knowledge‑Data‑Attention‑based Calendar Aging Forecaster,即KDACAF),其包括半经验模块(SEM模块)、知识驱动注意力模块、数据驱动注意力模块、长短时记忆模块(LSTM模块)。本发明KDACAF所述的基于注意力的锂离子电池日历老化预测模型和方法,其知识驱动注意力模块以基于阿伦尼乌斯定律的半经验模块为前端,将电池领域电化学先验知识融入数据驱动的神经网络中,借鉴人类的认知决策机理将注意力机制应用于锂离子电池日历老化预测,有助于电池健康状态的监测和管理,延长电池的使用寿命。

    一种基于大语言模型先验知识的推理状态控制方法及装置

    公开(公告)号:CN118446322B

    公开(公告)日:2025-02-11

    申请号:CN202410851175.7

    申请日:2024-06-28

    Abstract: 本发明涉及数据处理技术领域,特别是指一种基于大语言模型先验知识的推理状态控制方法及装置,该方法应用于自动驾驶离散化导航问题、集装箱堆叠问题、货物码放问题和自然语言文本下的文字数值计算问题,方法包括:获取无人系统决策推理的样本数据集;使用样本数据集、以及由ATE因果效应估计算法与交叉熵组成的损失函数,对初始的大语言模型进行训练;获取长程行动决策问题,构建因果概率树,确定剪枝和展开方向的优化问题,进而将长程行动决策问题切分为多个短程行动决策问题;使用训练好的大语言决策推理模型对多个短程行动决策问题进行求解,进而完成行动。采用本发明,可以解决大语言模型在长程推理任务中因果幻觉的问题,提高了推理的准确性。

    一种基于OD数据的多目标旅行商控制方法、系统及介质

    公开(公告)号:CN117094460B

    公开(公告)日:2024-06-14

    申请号:CN202311086400.4

    申请日:2023-08-28

    Abstract: 本发明属于信息处理技术领域,公开了一种基于OD数据的多目标旅行商控制方法、系统及介质,根据时刻T各信息点的数据包转移请求统计情况,借助新一代信息技术,由计算机自动地规划M条路径;由M个数据载体在各信息点间按对应的路径转移,使得在T+1时刻,T时刻产生的所有数据包都可以到达其目的地信息点。本发明的OD数据的全称是Origin‑Destination数据,是一种带有数据所载信息流向关系表示的数据类型,作为一种大规模数据,该数据既具有较为清晰的图结构,又记录了时空模式和趋势。宏观来看,每一时间截面上的数据可以表征为有向图,微观来看,每一条数据都是构成有向图的一条有向边。

    基于注意力的锂离子电池日历老化预测模型和方法

    公开(公告)号:CN115718263A

    公开(公告)日:2023-02-28

    申请号:CN202310023441.2

    申请日:2023-01-09

    Abstract: 本发明公开了一种基于注意力的锂离子电池日历老化预测模型和方法(Knowledge‑Data‑Attention‑based Calendar Aging Forecaster,即KDACAF),其包括半经验模块(SEM模块)、知识驱动注意力模块、数据驱动注意力模块、长短时记忆模块(LSTM模块)。本发明KDACAF所述的基于注意力的锂离子电池日历老化预测模型和方法,其知识驱动注意力模块以基于阿伦尼乌斯定律的半经验模块为前端,将电池领域电化学先验知识融入数据驱动的神经网络中,借鉴人类的认知决策机理将注意力机制应用于锂离子电池日历老化预测,有助于电池健康状态的监测和管理,延长电池的使用寿命。

    一种基于大语言模型先验知识的推理状态控制方法及装置

    公开(公告)号:CN118446322A

    公开(公告)日:2024-08-06

    申请号:CN202410851175.7

    申请日:2024-06-28

    Abstract: 本发明涉及数据处理技术领域,特别是指一种基于大语言模型先验知识的推理状态控制方法及装置,该方法应用于自动驾驶离散化导航问题、集装箱堆叠问题、货物码放问题和自然语言文本下的文字数值计算问题,方法包括:获取无人系统决策推理的样本数据集;使用样本数据集、以及由ATE因果效应估计算法与交叉熵组成的损失函数,对初始的大语言模型进行训练;获取长程行动决策问题,构建因果概率树,确定剪枝和展开方向的优化问题,进而将长程行动决策问题切分为多个短程行动决策问题;使用训练好的大语言决策推理模型对多个短程行动决策问题进行求解,进而完成行动。采用本发明,可以解决大语言模型在长程推理任务中因果幻觉的问题,提高了推理的准确性。

    一种基于知识与数据联合的路径规划方法、应用及装置

    公开(公告)号:CN117808180A

    公开(公告)日:2024-04-02

    申请号:CN202311816500.8

    申请日:2023-12-27

    Abstract: 本发明属于数据处理技术领域,公开了一种基于知识与数据联合的路径规划方法、应用及装置,将物流配送路径优化问题抽象为因果强化学习的目标空间,其中图的节点代表物流配送地点,边代表连接这些地点的道路;定义物流配送路径优化问题的优化目标、状态空间、动作空间、策略、奖励函数和奖励期望;利用智能体在已完成建模的因果强化学习环境中对物流配送路径优化问题进行学习求解,以找出最优的货物配送策略。传统的物流配送求解方法往往基于静态数据进行路径规划。而新的方法和系统能够动态调整配送策略,提高物流效率和准确性。最后,本发明基于所提出的每一种子方法均给出其对应的硬件实现,在计算机硬件层面对其内部求解性能做出了优化。

    一种基于OD数据的多目标旅行商控制方法、系统及介质

    公开(公告)号:CN117094460A

    公开(公告)日:2023-11-21

    申请号:CN202311086400.4

    申请日:2023-08-28

    Abstract: 本发明属于信息处理技术领域,公开了一种基于OD数据的多目标旅行商控制方法、系统及介质,根据时刻T各信息点的数据包转移请求统计情况,借助新一代信息技术,由计算机自动地规划M条路径;由M个数据载体在各信息点间按对应的路径转移,使得在T+1时刻,T时刻产生的所有数据包都可以到达其目的地信息点。本发明的OD数据的全称是Origin‑Destination数据,是一种带有数据所载信息流向关系表示的数据类型,作为一种大规模数据,该数据既具有较为清晰的图结构,又记录了时空模式和趋势。宏观来看,每一时间截面上的数据可以表征为有向图,微观来看,每一条数据都是构成有向图的一条有向边。

Patent Agency Ranking