-
公开(公告)号:CN114800530B
公开(公告)日:2023-11-28
申请号:CN202210647458.0
申请日:2022-06-09
Applicant: 中国科学技术大学
IPC: B25J9/16
Abstract: 本发明公开了一种基于视觉的机器人的控制方法、设备及存储介质,该方法包括:步骤1,通过与机器人通信连接的摄像头按预设时间间隔获取多张包含机器人和环境的图像,将获取的多张图像通过强化学习帧栈堆叠得到用于后续控制的输入图像数据;步骤2,使用训练好的卷积特征编码器对步骤1中得到的输入图像数据进行编码,得到一个50维的向量即为T‑级奖励序列表征数据;步骤3,使用训练好的多层感知决策模型将步骤2中得到的T‑级奖励序列表征数据映射为一个最优动作,使机器人执行该最优动作来对该机器人进行最优控制。该发明能够极大地提升强化学习算法的泛化能力以缓解未知视觉干扰的影响,促进强化学习算法更好地落地应用。
-
公开(公告)号:CN115456146A
公开(公告)日:2022-12-09
申请号:CN202211123990.9
申请日:2022-09-15
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种压缩深度图神经网络模型的方法、设备及存储介质,该方法通过向量表示鉴别模块和对数几率鉴别模块分别对教师图神经网络模型和学生图神经网络模型的向量表示和对数几率进行区分得出区分结果,根据区分结果迭代更新学生图神经网络模型,二者交替训练,直到完成指定的训练轮次;当训练过程收敛时,保存此时学生图神经网络模型的网络参数;用训练完成后的学生图神经网络模型以训练步骤保存的网络参数在图结构上前向预测,得出每个节点的向量表示,使用该学生图神经网络模型的分类器预测验证数据集上节点类别。使轻量级图神经网络模型在节省深层图神经网络模型80%以上参数量情况下,获得与深层图神经网络模型相当甚至更优的预测表现。
-
公开(公告)号:CN114462566A
公开(公告)日:2022-05-10
申请号:CN202210180990.6
申请日:2022-02-25
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种实现智能实时决策系统实时确定最优决策动作的方法,包括以:步骤1,离散化决策过程:确定最小决策时刻间隔;步骤2,定义系统状态:根据系统状态建立蒙特卡洛树搜索模型;步骤3,训练状态转移模型:将智能实时决策系统的状态转移过程建模为状态转移模型,基于历史数据训练所述状态转移模型,测试模型精度并选择最优模型参数;步骤4,挂载状态转移模型:用状态转移模型,状态转移模型预测蒙特卡洛树搜索模型的下一时刻系统状态作为漂移后的根节点,在下一个决策时刻到达前完成搜索,根据决策结果确定智能实时决策系统的当前最优的决策动作。该方法实现了在智能实时决策系统中利用蒙特卡洛树搜索实时确定最优决策动作。
-
公开(公告)号:CN113449075A
公开(公告)日:2021-09-28
申请号:CN202110692090.5
申请日:2021-06-22
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种面向知识图谱多跳推理的锥嵌入方法,包括:步骤1,通过训练集利用梯度下降算法对查询锥嵌入模型进行训练,训练集为给定的一个包含若干实体的知识图谱数据集的子集;查询锥嵌入模型能将实体和查询表示为2维锥的笛卡尔积,并在嵌入空间中设置与、或、非算子,建模所有一阶逻辑查询;步骤2,利用训练好的查询锥嵌入模型对一个给定查询,先将其生成锥嵌入,然后计算该锥嵌入与各个实体嵌入之间的距离,以距离最近的实体作为该查询的答案。该方法由于能对查询涉及多种FOL算子时,对答案集的基数进行建模,很好的满足了知识图谱的多跳推理任务中的应用,由于能准确估计查询所对应答案集合的大小,易于实现精确的推理。
-
公开(公告)号:CN113360605A
公开(公告)日:2021-09-07
申请号:CN202110698612.2
申请日:2021-06-23
Applicant: 中国科学技术大学
IPC: G06F16/33 , G06F16/36 , G06F40/295
Abstract: 本发明公开了一种基于主题实体语境迭代优化的全局实体链接方法,包括:步骤1,以预先训练好的主题实体迭代语境细化模型,对包含多个指称的文档和包含多个候选实体的知识图谱进行实体链接处理;步骤2,所述主题实体迭代语境细化模型处理过程中,对知识图谱中每个指称的候选实体进行迭代优化打分,最终选择得分最高的候选实体作为实体链接的结果。该方法计算效率高,性能优异。
-
公开(公告)号:CN113157935A
公开(公告)日:2021-07-23
申请号:CN202110281892.7
申请日:2021-03-16
Applicant: 中国科学技术大学
IPC: G06F16/36 , G06F40/211 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于关系上下文进行实体对齐的图神经网络模型及方法,模型包括:实体上下文模块,根据对齐的实体种子,以知识图谱中每一个实体及其周围的子图信息作为输入,输出该实体的实体上下文向量;关系上下文模块,根据对齐的实体种子,以知识图谱中每一个实体及其周围的子图信息作为输入,输出该实体的关系上下文向量;向量拼接模块,能拼接实体上下文模块和关系上下文模块输出的实体上下文向量与关系上下文向量,得到实体的最终向量;相似度判断模块,能计算两个实体的最终向量的内积作为这两个实体的相似度得分。该模型及方法有效地利用并建模了知识图谱中的关系信息,同时结合了图神经网络相关技术,取得了显著的性能提升。
-
公开(公告)号:CN118350379B
公开(公告)日:2024-09-17
申请号:CN202410787492.7
申请日:2024-06-18
Applicant: 中国科学技术大学
Abstract: 本发明公开一种提升知识系统中自然语言处理准确性的方法、设备及介质,方法包括:步骤1,将待处理知识系统的自然语言构建为待补全知识图谱;步骤2,获取每个三元组的语义模式;步骤3,用语义模式对三元组填充合适的词获得多个语义完整的候选句子;步骤4,添加提示句得出将任务形式转为掩蔽语言建模预训练任务的多个带有完整语义的提示句作为正、负训练样本;步骤5,将正、负训练样本输入预训练语言模型,用交叉熵损失训练预训练语言模型直到满足训练条件;步骤6,用训练好预训练语言模型补全待补全知识图谱;步骤7,处理补全后的知识图谱得出处理结果。该方法提升了智能知识系统中对应知识图谱的自然语言处理的准确性。
-
公开(公告)号:CN118464723A
公开(公告)日:2024-08-09
申请号:CN202410531991.X
申请日:2024-04-29
Applicant: 中国科学院合肥物质科学研究院 , 中国科学技术大学 , 安徽智农网络科技有限公司
IPC: G01N15/02
Abstract: 本发明公开了一种多级雾滴筛分系统及其性能评估方法,本发明涉及雾滴筛分系统技术领域。本发明通过设置三级雾滴粒径筛分系统,模拟分析了系统关键参数对筛分效率的影响,实现了对雾滴多个粒径段的高效筛分,为多种雾滴谱测量系统的性能表征提供一种重要的技术装置,基于虚拟冲击原理将雾滴按照粒径分为四个粒径段,运用流体仿真软件分析了筛分系统中收集腔直径、喷嘴与收集腔的间距对筛分效率的影响,实现了2到20μm雾滴的高效筛分,平均筛分效率为75.4%,对小于10μm雾滴的筛分效率高达88%以上。设计实验方案,对仿真结果进行了验证,实验与仿真的平均筛分效率的偏差约为3.5%,为雾滴谱测量系统的性能表征装置的设计提供理论依据。
-
公开(公告)号:CN114547344A
公开(公告)日:2022-05-27
申请号:CN202210310909.1
申请日:2022-03-28
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种挖掘知识图谱中不同长度规则的可微规则学习模型,包括:所述玩家单元包括并列设置的若干玩家模块,每个玩家模块能根据输入的从知识图谱中找到不同长度链式逻辑规则的查询,从知识图谱中找到对应的链式逻辑规则;所述队长单元,与所述玩家单元通信连接,能从所述玩家单元中选择合适的玩家模块来处理对应的查询;所述裁判单元,分别与所述队长单元和玩家单元通信连接,能对所述玩家单元找到的链式逻辑规则进行评估,得出评估反馈结果,用于所述玩家单元和队长单元根据所述评估反馈结果改善自身。该可微规则学习模型,能准确、高效的从知识图谱中挖掘全部的链式逻辑规则。
-
公开(公告)号:CN114139675A
公开(公告)日:2022-03-04
申请号:CN202111491549.1
申请日:2021-12-08
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种提升智能体控制中选择可靠动作准确性的方法,包括:步骤1,将预先部署有行为策略网络、概率神经网络和评价打分网络的智能体按待完成的预设目标任务与真实环境交互采集真实环境数据,并从采集的真实环境数据中通过概率神经网络学习模拟真实环境动力学得到多个动力学模型;步骤2,智能体基于多个动力学模型学习评价打分网络的评价打分函数的多个估计;步骤3,智能体使用得到的评价打分函数的多个估计中最小的k个估计的平均值来优化行为策略网络的策略;步骤4,智能体控制中采用优化后的策略进行行为的选择。能提高智能体用有模型强化学习方法的样本效率,进而提升学习的策略性能低,提高控制中选择可靠动作的准确性。
-
-
-
-
-
-
-
-
-