一种面向连续动作空间的智能体控制任务求解方法

    公开(公告)号:CN116224775B

    公开(公告)日:2025-05-02

    申请号:CN202211098363.4

    申请日:2022-09-08

    Abstract: 本发明公开了一种面向连续动作空间的智能体控制任务求解方法,该方法包括:使用VAE来嵌入来自外部环境的观测值,并对输入数据进行降维处理;智能体与环境不断进行交互,生成用于训练策略的样本数据;采样虚拟目标,重新计算奖励后加入重放缓冲区,完成样本数据的扩充;通过对智能体已经实现的状态进行核密度估计,同时计算当前状态与期望目标状态的距离作为系数,生成每个时刻的内在奖励;利用内在奖励设置动态比率,选择下一个episode合适的初始状态;通过该训练方法,面向连续动作空间的智能体将自动学会智能体控制方法,实现人为布置的任务。本发明用于深度强化学习中的稀疏奖励任务,能够提高算法完成任务的性能。

    一种基于知识库的复杂问题语义解析方法

    公开(公告)号:CN117216335A

    公开(公告)日:2023-12-12

    申请号:CN202311118755.7

    申请日:2023-08-31

    Abstract: 本发明公开了一种基于知识库的复杂问题语义解析方法,属于自然语言处理、智能问答技术领域。本发明在知识库密集空间中直接检索候选实体和关系集合,将实体消歧和关系分类作为辅助任务与结构化查询生成一同进行多任务学习训练,三个子任务共享同一套编码器参数,同时每个子任务在编码器的基础上设计独立的层用于训练对应子任务,最终将生成的结构化查询语句作为模型输出结果,并通过在知识库中执行查询语句得到问题的答案。本发明考虑了三个子任务之间的协同关系,通过联合训练,克服了传统方案中存在的各任务相互独立以及存在错误传播的缺陷,提高了结构化查询生成任务的准确率,同时提升了语义解析模型的整体效果。

    一种基于异构知识融合的知识推理方法

    公开(公告)号:CN117235216A

    公开(公告)日:2023-12-15

    申请号:CN202311108953.5

    申请日:2023-08-30

    Abstract: 本发明涉及机器推理领域,具体为一种基于异构知识融合的知识推理方法。该方法基于输入识别出问答对中的关键实体概念,利用关键实体概念获取证据文本知识;将问答对与证据文本知识拼接输入到预训语言练模型中获取语义编码;针对每个问答对,从知识图谱中抽取与关键实体概念相关的三元组路径,并引入语义节点,计算上下文相关性并剪枝构建模式图,在此基础上进行推理得到模式图编码;通过捕获语义编码与模式图编码的潜在关联,实现知识融合推理;通过分类层计算每个候选选项的置信度分数,将置信度最高的候选选项作为最终预测答案。解决了现有智能问答系统在回答常识相关的问题时,缺乏关联性高的背景知识、且多源知识融合不足导致推理效果差问题。

    一种用于癫痫预判的脑电信号处理方法

    公开(公告)号:CN119249083A

    公开(公告)日:2025-01-03

    申请号:CN202411354778.2

    申请日:2024-09-27

    Abstract: 本发明属于非线性生理信号处理技术领域,具体提供一种用于癫痫预判的脑电信号处理方法,用以提高癫痫发作预警的准确性和实时性。本发明引入贝叶斯估计和时频分析方法,能够更精确地解析脑电信号中主要频率成分的时间演化过程,不仅考虑了信号的动态变化特性,还通过贝叶斯方法有效处理了脑电信号的非线性和非稳态特性,从而更准确地捕捉到癫痫发作前的特异性时频特征;这些特征作为判定癫痫发作的重要依据,显著提升了预警的准确性。综上,本发明通过实时监测脑电信号的时频变化能够在癫痫发作前进行预警,这种实时的分析能力使得医生或患者家属能够提前采取措施,避免或减少癫痫发作带来的伤害,提高了医疗干预的时效性。

    一种面向逻辑推理问题的拟人思维驱动的嵌入增强方法

    公开(公告)号:CN119025646A

    公开(公告)日:2024-11-26

    申请号:CN202411102286.4

    申请日:2024-08-12

    Abstract: 一种面向逻辑推理问题的人类解题思维驱动的嵌入增强方法,本发明涉及自然语言处理领域中的多项选择式的逻辑推理问答问题,其旨在解决现有的逻辑推理问答问题解决方法中存在的文本结构解析不清、问题相关要素利用不足且逻辑推理问题语义挖掘难度大的技术问题。本发明方法主要包含数据预处理,将样例整理为合适于神经网络模型处理的文本序列,基于人类解题思维设计驱动的基于题意的嵌入更新模块,首先字符嵌入表示初始化,使用预训练语言模型对样例中的字符进行向量化表示,然后使用问题部分的嵌入序列构造逻辑信息过滤向量,进而使用过滤向量对题干及选项的嵌入表示进行更新,参考人类阅读习惯的语义关系建模模块,解析神经网络的基本语义单元。

    一种融合生成对抗网络与不确定性的图像质量增强方法

    公开(公告)号:CN117745591A

    公开(公告)日:2024-03-22

    申请号:CN202311781471.6

    申请日:2023-12-22

    Abstract: 本发明属于图像视觉和图像增强技术领域,具体提供一种融合生成对抗网络与不确定性的图像质量增强方法,用以提高图像数据质量,进而提高图像数据对预测结果的可信度。本发明在生成对抗网络(GAN网络)中引入不确定性估计,将GAN网络与信息论、主观逻辑等理论相结合,通过在判别器中使用深度证据网络输出图像所属类别的证据,估计GAN网络输出的空度、不协调度、偶然不确定性和认知不确定性,并在生成器的目标函数中引入消除不确定性项,促使生成器的目标朝着消除预测不确定性的方向演化,最终使得GAN网络的训练具备信息论可解释性的同时,提高图像增强的可信度。

    一种面向连续动作空间的智能体控制任务求解方法

    公开(公告)号:CN116224775A

    公开(公告)日:2023-06-06

    申请号:CN202211098363.4

    申请日:2022-09-08

    Abstract: 本发明公开了一种面向连续动作空间的智能体控制任务求解方法,该方法包括:使用VAE来嵌入来自外部环境的观测值,并对输入数据进行降维处理;智能体与环境不断进行交互,生成用于训练策略的样本数据;采样虚拟目标,重新计算奖励后加入重放缓冲区,完成样本数据的扩充;通过对智能体已经实现的状态进行核密度估计,同时计算当前状态与期望目标状态的距离作为系数,生成每个时刻的内在奖励;利用内在奖励设置动态比率,选择下一个episode合适的初始状态;通过该训练方法,面向连续动作空间的智能体将自动学会智能体控制方法,实现人为布置的任务。本发明用于深度强化学习中的稀疏奖励任务,能够提高算法完成任务的性能。

Patent Agency Ranking