-
公开(公告)号:CN118036605A
公开(公告)日:2024-05-14
申请号:CN202410228934.4
申请日:2024-02-29
Applicant: 湖南大学
IPC: G06F40/289 , G06F40/284 , G06F16/33 , G06F16/35 , G06F18/213 , G06F18/23 , G06N3/0464 , G06N3/08 , G06N3/006 , G06N10/20
Abstract: 本发明公开了一种基于Word2vec‑QCNN模型的文本表示系统、方法及其在电力领域词库构建的应用,该方法预处理模块对电力文本进行分词并去停用词;向量转换模块采用Word2vec模型将所得词汇转化为词向量;特征提取模块采用振幅编码将词向量编码为量子态,利用QCNN模型对量子态的词向量进行卷积完成特征提取,并池化降维,去除冗余特征,通过量子测量将处理后的量子态投影到新的经典空间,得到三维词向量;聚类模块采用QPSO算法对三维词向量聚类;词集对比模块将聚类所得词集与非专业词集对比,剔除重叠词,获得最终电力领域词库。本发明利用量子计算的并行性优势和量子叠加态特性提高计算效率及模型表达能力,从而提高词库准确率。