-
公开(公告)号:CN118245111A
公开(公告)日:2024-06-25
申请号:CN202410173153.X
申请日:2024-02-07
Applicant: 吉林大学
IPC: G06F9/30 , G06F9/38 , G06F3/0484
Abstract: 本申请提供了一种大模型控制电子设备的方法和装置,涉及计算机技术领域。该方法包括:确定电子设备当前需要完成的第一任务,以及获取电子设备当前的第一状态信息和显示屏当前的第一屏幕截图,将第一任务、第一状态信息和第一屏幕截图输入预先训练得到的多模态大模型得到多模态大模型输出的第一结果,之后控制电子设备执行第一结果中包括的至少一个第一指令。本申请实施例中,通过多模态大模型将任务分解为至少一个指令,然后控制电子设备执行每个指令,不需要用户手动向电子设备输入指令控制电子设备动作,可以降低用户的工作难度和工作量。
-
公开(公告)号:CN114998277B
公开(公告)日:2024-05-17
申请号:CN202210679169.9
申请日:2022-06-16
Applicant: 吉林大学
IPC: G06T7/00 , G06V10/44 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/042 , G06N3/08 , B25J9/16
Abstract: 本申请公开了一种抓取点识别方法、装置、电子设备及计算机存储介质。其中,上述方法包括:获取目标状态下的目标物体对应的目标真实图像;提取目标真实图像对应的目标真实领域特征以及目标合成领域特征;将目标真实领域特征和目标合成领域特征按照目标权重比例进行融合,得到目标物体对应的目标跨域特征;基于目标跨域特征确定目标物体对应的抓取点。本方案通过将真实领域特征和合成领域特征进行跨域特征融合,增强抓取点识别过程的跨域表达能力,并基于跨域特征确定物体的抓取点,实现即使是面对例如变形空间更大、抓取困难度更高的衣物等结构复杂的物体,也能够识别到精准的抓取点,提升抓取点识别的鲁棒性以及识别精度。
-
公开(公告)号:CN117540214A
公开(公告)日:2024-02-09
申请号:CN202311677765.4
申请日:2023-12-07
Applicant: 吉林大学
IPC: G06F18/214 , G06N20/00 , G06F17/18 , G06F18/211
Abstract: 本说明书公开了一种智能体训练方法、装置、存储介质及电子设备,其中方法包括:获取环境向量、智能体的局部状态向量和动作向量进行拼接,得到智能体的全局向量,采用对比模块对全局向量进行计算,得到目标向量,采用集成评价网络对目标向量进行评价得到样本评分,对样本评分进行处理得到预估评分,计算对比模块、策略网络和集成评价网络的损失函数,基于损失函数对网络参数进行调整,直至损失函数指示收敛,得到训练完成的对比模块、策略网络和集成评价网络,采用本说明书,采用对比模块辅助评价网络进行训练增加额外的损失函数,提高目标向量的表示能力,并通过集成式评价网络减少预估时产生的误差,提高了智能体训练模型的样本训练效率。
-
公开(公告)号:CN115269786B
公开(公告)日:2023-01-06
申请号:CN202211186100.9
申请日:2022-09-28
Applicant: 吉林大学
Abstract: 本申请公开了一种可解释的虚假文本检测方法、装置、存储介质以及终端,使用虚假文本检测模型,生成目标文本的目标文本嵌入表示,以及生成未处理原始文本的参考文本嵌入表示;确定目标文本的目标证据语句,以及目标证据语句的证据文本嵌入表示;基于目标文本嵌入表示、参考文本嵌入表示、以及证据文本嵌入表示确定目标文本的真实性检测结果,并基于目标证据语句解释真实性检测结果。由于本申请基于原始的参考文本对目标文本进行真实性检测,减少检测时对人工事实核查报告的依赖,且从参考文本中确定出目标文本的真实性检测结果及其判断的证据文本。使得文本检测过程中减少对目标文本的检测时延,并且真实性检测结果具有可解释性。
-
公开(公告)号:CN115269786A
公开(公告)日:2022-11-01
申请号:CN202211186100.9
申请日:2022-09-28
Applicant: 吉林大学
Abstract: 本申请公开了一种可解释的虚假文本检测方法、装置、存储介质以及终端,使用虚假文本检测模型,生成目标文本的目标文本嵌入表示,以及生成未处理原始文本的参考文本嵌入表示;确定目标文本的目标证据语句,以及目标证据语句的证据文本嵌入表示;基于目标文本嵌入表示、参考文本嵌入表示、以及证据文本嵌入表示确定目标文本的真实性检测结果,并基于目标证据语句解释真实性检测结果。由于本申请基于原始的参考文本对目标文本进行真实性检测,减少检测时对人工事实核查报告的依赖,且从参考文本中确定出目标文本的真实性检测结果及其判断的证据文本。使得文本检测过程中减少对目标文本的检测时延,并且真实性检测结果具有可解释性。
-
公开(公告)号:CN114925805A
公开(公告)日:2022-08-19
申请号:CN202210260941.3
申请日:2022-03-10
Applicant: 吉林大学
Abstract: 本申请提供了一种图神经网络模型及其确定方法、图表示方法、介质及终端,涉及图神经网络技术领域。该方法包括:确定L层中第l层初始化权重矩阵,其中,L为卷积层数,L为正整数,l为小于等于L的正整数;利用牛顿迭代法,根据第l层初始化权重矩阵确定第l层目标权重变换矩阵;根据第l层目标权重变换矩阵,对图数据中第l层节点的特征进行正交变换,根据正交变换结果得到图数据对应的目标图表示;根据L层目标权重变换矩阵,确定损失函数,根据损失函数对正交化图神经网络模型进行优化,得到图神经网络模型。本方案通过一组正交化图卷积操作保证了图卷积层的正交性,并有效地保存了节点表示的范数,提高了信号传播和反向梯度的稳定性。
-
公开(公告)号:CN113435606A
公开(公告)日:2021-09-24
申请号:CN202110748240.X
申请日:2021-07-01
Applicant: 吉林大学
Abstract: 本申请实施例公开了一种强化学习模型的优化方法、装置、存储介质及电子设备,涉及深度强化学习领域。其中,方法包括:基于演员评论家网络与环境交互产生的历史数据获取变分推理网络,以及通过所述变分推理网络训练所述演员评论家网络;基于经训练过的所述演员评论家网络生成初始演员双评论家网络;将所述初始演员双评论家网络中的优势函数替换为广义优势函数,得到所述初始演员双评论家网络对应的演员双评论家网络。采用本申请实施例,可以提高针对历史数据的利用率,提高深度强化学习模型的泛化性以及减少训练时。
-
公开(公告)号:CN112508116A
公开(公告)日:2021-03-16
申请号:CN202011482638.5
申请日:2020-12-15
Applicant: 吉林大学
IPC: G06K9/62
Abstract: 本申请公开了一种分类器生成方法、装置、存储介质及电子设备,属于计算机技术领域。所述分类器生成方法包括:获取第n个集成分类器和第n个数据子集,通过所述第n个集成分类器对所述第n个数据子集进行处理得到第n个元状态参数,通过元采样器对所述第n个元状态参数进行处理得到第n个采样权重,基于所述第n个采样权重生成第n+1个数据子集,将训练后的第n+1个基分类器与所述第n个集成分类器进行组合得到第n+1个集成分类器,在n+1大于阈值时,将所述第n+1个集成分类器作为目标集成分类器。故本申请通过构造元采样器,能自动从数据中学习对给定任务提供最优的采样策略,有效提升集成学习模型的性能,解决类别不平衡数据上的机器学习效果差的问题。
-
公开(公告)号:CN110417594B
公开(公告)日:2020-10-27
申请号:CN201910689017.5
申请日:2019-07-29
Applicant: 吉林大学
Abstract: 本发明提供了一种网络构建方法、装置、存储介质及电子设备,构建节点的族群归属度模型;构建节点的高阶关联关系模型;构建节点的族群归属度表示和节点高阶关联关系之间的关系模型;融合所述族群归属度模型、所述高阶关联关系模型及所述族群归属度表示和节点高阶关联关系之间的关系模型,构建统一模型;根据所述统一模型,生成网络中节点的向量表示。本发明使用族群信息对节点表示进行指导和优化,实现在保留高阶关联关系的同时利用族群信息,挖掘网络中的信息,生成更优的网络中节点的向量表示数据。
-
公开(公告)号:CN119761454A
公开(公告)日:2025-04-04
申请号:CN202510248451.5
申请日:2025-03-04
Applicant: 吉林大学
Abstract: 本申请提供了一种空间对齐与选择性权重激活的持续离线强化学习方法,包括:针对持续学习任务序列中的每一个任务,使用该任务对应的数据集,利用量化空间对齐方法将状态空间和动作空间对齐,以得到相同空间下的状态序列和动作序列;获取单时间步奖励序列,并利用奖励函数计算出累积折扣奖励和序列;基于该任务的状态序列,将累积折扣奖励和序列作为扩散模型的条件信息,利用被激活的扩散模型生成给定状态序列,再利用逆动力学模型生成给定动作序列;将各任务累积的折扣奖励和的最大化作为目标,进行持续强化学习,以更新各任务对应的扩散模型参数,和逆动力学模型参数。该方法使各任务的强化学习过程在同样的空间上进行,并有效缓解了灾难性遗忘。
-
-
-
-
-
-
-
-
-