-
公开(公告)号:CN117272006A
公开(公告)日:2023-12-22
申请号:CN202311052101.9
申请日:2023-08-21
Applicant: 浙江大学
IPC: G06F18/21 , G06F18/214 , G06F16/22
Abstract: 本发明公开了一种基于数据库索引技术的主动学习训练加速方法及系统。方法包括:将训练样本输入样本特征提取模块中,输出特征向量;输入主动学习评价模块中,输出样本评分,调用高性能索引模块排序;高性能索引模块对样本评分保存以及排序次序关系维护;集成主动学习算法模块调用高性能索引模块预筛选,使用主动学习算法挑选待训练样本,输入待训练的深度学习模型中训练;重复直至训练完成。本发明结合主动学习和高效的数据索引结构,加快主动学习训练流程,提高模型训练的效率和性能。优化数据的存储和索引方式,减少数据操作的复杂性,有助于提高训练过程的整体效率,能够基于高效的数据库索引结构,以及轻量的主动学习算法,加速训练流程。