一种汉藏语多模态的图文处理方法及处理系统
摘要:
本申请提供了一种汉藏语多模态的图文处理方法及处理系统,通过提取汉藏语图文信息中汉藏语图像模态的图像特征和汉藏语文本模态的文本特征以确定第一汉藏语图文交互特征信息,根据第一汉藏语图文交互特征信息确定第一交互特征量;将汉藏语图像模态的图像切分重组得到汉藏语图像副本,根据汉藏语图像副本的图像副本特征和文本特征确定第二汉藏语图文交互特征信息,根据第二汉藏语图文交互特征信息确定第二交互特征量;基于第一交互特征量和第二交互特征量输出所述汉藏语图文交互的交互结果。上述方案基于第一交互特征量和第二交互特征量输出交互结果,可实现汉藏语图文跨模态交互的语义关联,从而提高汉藏语图文跨模态交互处理结果的真实性。
公开/授权文献
0/0