-
公开(公告)号:CN112507201A
公开(公告)日:2021-03-16
申请号:CN202011207081.4
申请日:2020-11-03
Applicant: 国网浙江省电力有限公司台州供电公司
IPC: G06F16/9532 , G06F16/33 , G06F40/247 , G06F40/289 , G06F40/30
Abstract: 本发明公开了一种基于NLP检索分析技术的搜索引擎构建及搜索方法,解决了现有技术的不足,搜索引擎构建方法包括以下步骤:步骤1,收集企业数据,根据企业数据构建企业信息词库;步骤2,构建企业名称专用库、停词库和同义词库;步骤3,构建匹配模块,用于将搜索语句和企业信息词库相匹配,得出匹配的企业以及相关信息;搜索方法包括以下步骤:步骤a,用户输入搜索语句;步骤b,搜索引擎根据企业名称专用库、停词库和同义词库将搜索语句进行分词;步骤c,搜索引擎从分词中提取关键词;步骤d,将关键词与企业信息词库进行匹配,获取符合条件的企业以及企业的信息;步骤e,检索引擎通过显示单元将符合条件的企业信息提供给用户。