-
公开(公告)号:CN120068854A
公开(公告)日:2025-05-30
申请号:CN202510536901.0
申请日:2025-04-27
Applicant: 中央民族大学
IPC: G06F40/279 , G06F40/216 , G06F40/30
Abstract: 本申请公开了一种象形文字词组释义的挖掘方法、装置、设备、介质及产品。该象形文字词组释义的挖掘方法包括:通过Transformer模型确定语料库中象形文字的字间概率分布,并根据字间概率分布确定候选词组;对于每个所述候选词组,确定所述候选词组对应的图像片段以及所述候选词组对应的单句释义文本;通过图文对齐模型,确定所述候选词组在所述单句释义文本中所对应的分词,得到所述候选词组对应的释义。上述技术方案根据字间概率分布确定候选词组,并利用图文对齐模型从相应的单句释义文本中匹配候选词组对应的分词,得到候选词组的释义,实现了对于象形文字词组释义有效和准确的挖掘。
-
公开(公告)号:CN117197820A
公开(公告)日:2023-12-08
申请号:CN202311122407.7
申请日:2023-09-01
Applicant: 中央民族大学
IPC: G06V30/244 , G06V30/19 , G06V30/14 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种用于残缺东巴文字的识别方法、系统、电子设备及介质,识别方法包括:网络构建步骤:构建东巴文补全识别网络并对东巴文补全识别网络进行训练,东巴文补全识别网络包括级联补全模块和识别模块;东巴文字补全步骤:通过级联补全模块提取出残缺东巴文字后,对残缺东巴文字进行像素补全获得完整的东巴文字;东巴文字识别步骤:通过识别模块将完整的东巴文字及残缺东巴文字进行拼接后,对拼接后的完整的东巴文字及残缺东巴文字进行识别获得中文释义。
-