一种能够自动更新的案件预判智能体训练方法及系统
摘要:
本发明公开了一种能够自动更新的案件预判智能体训练方法及系统,方法包括获取一定数量的司法案件审判书作为样本,从审判书种抽取事实等关键信息,对于数据进行处理,同时接收专家标注的新的数据,构建新的数据集,针对司法审判问题进行建模,得到对关键信息的准确率计算模型,从模型中提取训练所需要的参数,定义模型训练的reward函数,再使用BCQ算法根据参数以及数据集进行智能体模型的训练。本发明使用强化学习的方法解决司法案件预判不准确的问题,同时能够进行改进和优化,长期保持模型的准确率。
0/0