象形文字词组释义的挖掘方法、装置、设备、介质及产品

    公开(公告)号:CN120068854A

    公开(公告)日:2025-05-30

    申请号:CN202510536901.0

    申请日:2025-04-27

    Abstract: 本申请公开了一种象形文字词组释义的挖掘方法、装置、设备、介质及产品。该象形文字词组释义的挖掘方法包括:通过Transformer模型确定语料库中象形文字的字间概率分布,并根据字间概率分布确定候选词组;对于每个所述候选词组,确定所述候选词组对应的图像片段以及所述候选词组对应的单句释义文本;通过图文对齐模型,确定所述候选词组在所述单句释义文本中所对应的分词,得到所述候选词组对应的释义。上述技术方案根据字间概率分布确定候选词组,并利用图文对齐模型从相应的单句释义文本中匹配候选词组对应的分词,得到候选词组的释义,实现了对于象形文字词组释义有效和准确的挖掘。

Patent Agency Ranking