一种面向电网复杂调控业务的数据检索意图识别方法
摘要:
本发明公开了一种面向电网复杂调控业务的数据检索意图识别方法,构建电网调度领域字典,进行文本预处理;针对预处理后的文本进行基于TF‑IDF算法的计算,并利用SimHash算法将每个关键词映射为高维稀疏的二进制SimHash签名,经相识度计算后构建词族;利用自然语言处理技术从历史文本数据中提取关键词,建立历史数据与词族间的关联数据库;采用TF‑IDF算法和Word2Vec模型相结合进行文本特征提取,并进行自适应融合;将融合后的文本特征向量输入到emoBERT‑TextCNN模型中,经过处理后识别出调度意图,及意图分类。本发明通过构建电网领域的语义模型,实现对复杂电网业务指令的准确解析和理解,根据语义推理识别调度意图,快速检索相关数据,具有可扩展和灵活的架构,适应不同电网调控场景。
0/0