一种无监督汉词语消歧方法、装置、终端设备及存储介质

    公开(公告)号:CN119962540A

    公开(公告)日:2025-05-09

    申请号:CN202510022895.7

    申请日:2025-01-07

    Abstract: 本申请公开了一种无监督汉词语消歧方法、装置、终端设备及存储介质。本申请对用户输入的文本数据进行文本分割,获取若干词语,并依次提取各所述词语的多层特征;多层特征包括:第一语义层特征;对各所述词语的所述第一语义层特征进行迭代更新,每次更新时,根据各词语的多层特征,更新预设的语义图谱,以更新各词语对应节点的第一融合特征;并将第一融合特征输入至预训练完毕的消歧模型中,获取对应词语的第二语义层特征,以更新对应节点的第一语义层特征;直至各词语对应前后获取的第二语义层特征之间的第一余弦相似度小于预设值,根据当前获取的第二语义层特征,确定对应词语的语义表示。通过本申请,可以提高语义图谱以及消歧结果的准确性。

Patent Agency Ranking