基于词表扩充的语种间语义对齐方法、装置及电子设备

    公开(公告)号:CN118607532A

    公开(公告)日:2024-09-06

    申请号:CN202410691440.X

    申请日:2024-05-30

    Abstract: 本申请提供一种基于词表扩充的语种间语义对齐方法、装置及电子设备。该方法包括:从目标语言的语料中提取所述目标语言的token;将目标语言的token作为扩充token对原语言模型进行词表扩充;通过微调词表扩充后的原语言模型将所述扩充token嵌入到预训练语言的语义空间中。本申请提供的基于词表扩充的语种间语义对齐方法、装置及电子设备,将目标语言以新添加的token形式嵌入到预训练语言的语义空间中,增强模型处理多语言任务的能力的同时,提升了模型对目标语言的文本理解和生成能力。

    针对检索模型的在线隐私保护方法、装置及存储介质

    公开(公告)号:CN119227127A

    公开(公告)日:2024-12-31

    申请号:CN202411186071.5

    申请日:2024-08-27

    Abstract: 本发明提供一种针对检索模型的在线隐私保护方法、装置及存储介质。该针对检索模型的在线隐私保护方法包括:获取第一相似矩阵;所述第一相似矩阵指查询图像集中的图像样本之间的语义相似矩阵;所述查询图像集中包含多个图像样本;基于所述第一相似矩阵确定所述查询图像集的干扰。本发明提供的针对检索模型的在线隐私保护方法、装置及存储介质,基于图像样本间的语义相似性来指导生成干扰,来提供可靠的图像保护,绕过了检索模型的检测和识别,提高了信息的安全性。

Patent Agency Ranking