一种通用的全文搜索方法
    14.
    发明授权

    公开(公告)号:CN102968501B

    公开(公告)日:2016-02-17

    申请号:CN201210525753.5

    申请日:2012-12-07

    Abstract: 本发明提供一种通用的全文搜索方法,包括数据准备阶段:以业务系统作为分类条件建立多个分类信息数据表,各分类信息数据表之间两两设置关联描述字段;索引创建阶段:业务系统提交电子文件到电子文件管理平台时,将触发该电子文件管理平台的索引创建装置,开始抽取电子文件内容,并分别建立该电子文件的元数据索引库和内容索引库,并建立元数据索引库和内容索引库的关联关系,通过元数据索引库进行访问授权控制;数据搜索阶段:通过所述分类信息数据表及其关联描述字段对分类检索进行授权控制和用户认证。从而实现了在同一个系统中可以灵活设置搜索访问权限,满足了多种方式的授权访问控制要求,可以实现用户对不需要授权的文件的访问。

    海量文本中低占比信息识别方法及装置

    公开(公告)号:CN105653649B

    公开(公告)日:2019-05-21

    申请号:CN201511002761.1

    申请日:2015-12-28

    Abstract: 一种海量文本中低占比信息识别方法及装置,其中方法包括如下步骤,将素材信息分为训练信息和测试信息,将所述素材信息通过特征选择、向量化处理转化成可分析的数学矩阵,代入集成学习模型进行模型训练;所述模型训练包括步骤,根据训练信息构建第一分析模型;将测试信息代入分析模型,对所述第一分析模型的运行效果进行评估,得到评估值,根据评估值调整第一分析模型中各算法的训练信息分配权重得到新的分析模型;本方法解决了大量数据中低占比的少量待识别信息的识别问题。

Patent Agency Ranking