-
公开(公告)号:CN113282705B
公开(公告)日:2022-01-28
申请号:CN202110567522.X
申请日:2021-05-24
Applicant: 暨南大学
Abstract: 本发明公开了一种能够自动更新的案件预判智能体训练方法及系统,方法包括获取一定数量的司法案件审判书作为样本,从审判书种抽取事实等关键信息,对于数据进行处理,同时接收专家标注的新的数据,构建新的数据集,针对司法审判问题进行建模,得到对关键信息的准确率计算模型,从模型中提取训练所需要的参数,定义模型训练的reward函数,再使用BCQ算法根据参数以及数据集进行智能体模型的训练。本发明使用强化学习的方法解决司法案件预判不准确的问题,同时能够进行改进和优化,长期保持模型的准确率。
-
公开(公告)号:CN113282705A
公开(公告)日:2021-08-20
申请号:CN202110567522.X
申请日:2021-05-24
Applicant: 暨南大学
Abstract: 本发明公开了一种能够自动更新的案件预判智能体训练方法及系统,方法包括获取一定数量的司法案件审判书作为样本,从审判书种抽取事实等关键信息,对于数据进行处理,同时接收专家标注的新的数据,构建新的数据集,针对司法审判问题进行建模,得到对关键信息的准确率计算模型,从模型中提取训练所需要的参数,定义模型训练的reward函数,再使用BCQ算法根据参数以及数据集进行智能体模型的训练。本发明使用强化学习的方法解决司法案件预判不准确的问题,同时能够进行改进和优化,长期保持模型的准确率。
-
公开(公告)号:CN114218867A
公开(公告)日:2022-03-22
申请号:CN202111563799.1
申请日:2021-12-20
Applicant: 暨南大学
IPC: G06F30/27 , G06Q10/04 , G06F111/04
Abstract: 本发明提供了一种基于熵优化安全强化学习的特种设备流程控制方法及系统,属于人工智能技术领域。本发明根据特种设备生产的特点和实现的功能建立特种设备模型;提取生产线所需优化的参数,并定义符合特种设备生产特点的状态、动作、奖励函数、折扣因子、成本函数和策略模型,构建安全强化学习模型训练系统,采用马尔科夫决策过程进行训练;采用泛化优势估计算法实现基于Actor‑critic框架的熵优化安全强化学习算法,对马尔科夫决策过程中的每个策略设置上下边界,对特种设备进行流程控制。本发明采用的熵优化安全强化学习算法的流程控制,使得所构建的模型具有更好的泛化性,能够有效提高操作安全性、精准性。
-
公开(公告)号:CN112966072A
公开(公告)日:2021-06-15
申请号:CN202110263818.2
申请日:2021-03-11
Applicant: 暨南大学
Abstract: 本申请涉及一种案件的预判方法、装置、电子装置和存储介质,其中,该案件的预判方法包括:获取待预判案件的起诉文本;在起诉文本中抽取预设关键信息,并对关键信息进行数据处理,得到起诉文本对应的多条第一向量信息;利用已训练的案件预判模型处理多条第一向量信息,获得多条第一向量信息对应的第一分类标签,其中,已训练的案件预判模型被训练为用于根据起诉文本的向量信息得到与该起诉文本对应的分类标签,分类标签包括该起诉文本对应的法律事实类别及该法律事实所引用法条的引用准确率;根据第一分类标签确定案件的预判结果。通过本申请,解决了相关技术中案件预判准确率不高的问题,实现了案件的高效准确预判。
-
公开(公告)号:CN114218867B
公开(公告)日:2022-06-28
申请号:CN202111563799.1
申请日:2021-12-20
Applicant: 暨南大学
IPC: G06F30/27 , G06Q10/04 , G06F111/04
Abstract: 本发明提供了一种基于熵优化安全强化学习的特种设备流程控制方法及系统,属于人工智能技术领域。本发明根据特种设备生产的特点和实现的功能建立特种设备模型;提取生产线所需优化的参数,并定义符合特种设备生产特点的状态、动作、奖励函数、折扣因子、成本函数和策略模型,构建安全强化学习模型训练系统,采用马尔科夫决策过程进行训练;采用泛化优势估计算法实现基于Actor‑critic框架的熵优化安全强化学习算法,对马尔科夫决策过程中的每个策略设置上下边界,对特种设备进行流程控制。本发明采用的熵优化安全强化学习算法的流程控制,使得所构建的模型具有更好的泛化性,能够有效提高操作安全性、精准性。
-
-
-
-