一种基于多层次算法与大模型协同的运营商术语提取方法

    公开(公告)号:CN118333050A

    公开(公告)日:2024-07-12

    申请号:CN202410221769.X

    申请日:2024-02-28

    摘要: 本发明公开了一种基于多层次算法与大模型协同的运营商术语提取方法,属于自然语言处理技术领域,包括以下步骤:S1:语料收集与清洗;S2:获取候选术语种子词库;S3:获取最终的领域术语词表。本发明通过这种多元算法和大模型技术的结合,有效提高了术语提取的准确性,并且通过更全面地分析文本内容,增强了对术语上下文关联性的理解;并通过逐点互信息(PMI)技术进一步扩充术语词表,从而增加了术语的覆盖范围和多样性,提高了术语的相关性和实用性;不仅提升了术语提取的全面性和准确度,还降低了对单一数据源质量的依赖,使其更适用于多样化的运营商业务场景,具有重要的实际应用价值。