一种基于自训练的文本检测器训练方法及系统

    公开(公告)号:CN111753657B

    公开(公告)日:2023-01-13

    申请号:CN202010428815.5

    申请日:2020-05-20

    Abstract: 本发明公开了一种基于自训练的文本检测器训练方法及系统。本方法步骤包括:1)获取来源于目标域的视频数据;使用源域的数据对检测器和跟踪器进行预训练;2)利用步骤1)训练后的检测器处理来源于目标域的视频数据,获得该视频数据每一帧的检测结果;步骤1)训练后的跟踪器根据前一帧的检测结果预测当前帧的跟踪结果;3)文本挖掘模块将每一帧的检测结果与跟踪结果进行融合生成运动轨迹,然后根据该运动轨迹中的边界包围盒来预测轨迹结果,以及从该运动轨迹中挖掘得到难正样本和难负样本,其中当且仅当该视频数据中的一帧图像A中存在难正样本或难负样本,则将图像A添加到伪数据集中;4)利用步骤3)得到的伪数据集训练检测器。

    一种全局优化的键值存储方法及装置

    公开(公告)号:CN115599288A

    公开(公告)日:2023-01-13

    申请号:CN202110778061.0

    申请日:2021-07-09

    Abstract: 本发明公开一种全局优化的键值存储方法及装置,利用分为记录层和非记录层的数据存储结构GHLSM存储键值对;使用核心数据结构GHmap记录记录层中最新版本的键值对所在的层;核心数据结构GHmap通过在compaction时帮助键值对判断是否已过时需要自我毁灭、及在查询时帮助索引最新版键值对所在的层,从而避免无用数据继续参与后续compaction过程所带来的额外IO开销。本发明可在机械硬盘、固态硬盘等硬件环境下均取得良好效果,有效地提升读、写、范围查询等方面的性能。

Patent Agency Ranking