Invention Publication
- Patent Title: 用于共享和剪枝视觉和语言模型的权重的装置和方法
-
Application No.: CN202380068894.5Application Date: 2023-09-26
-
Publication No.: CN119948490APublication Date: 2025-05-06
- Inventor: 高尚谦 , B·乌兹肯特 , 沈逸麟 , 金红霞
- Applicant: 三星电子株式会社
- Applicant Address: 韩国京畿道
- Assignee: 三星电子株式会社
- Current Assignee: 三星电子株式会社
- Current Assignee Address: 韩国京畿道
- Agency: 北京市柳沈律师事务所
- Agent 巫资青
- Priority: 63/410,789 20220928 US 18/368,353 20230914 US
- International Application: PCT/KR2023/014832 2023.09.26
- International Announcement: WO2024/072001 EN 2024.04.04
- Date entered country: 2025-03-26
- Main IPC: G06N3/0455
- IPC: G06N3/0455 ; G06N3/08 ; G06N3/0499 ; G06F16/9032 ; G06F16/9038 ; G06F16/432 ; G06F16/532 ; G06F16/56

Abstract:
一种通过使用包括文本编码器和视觉编码器的多模态模型来执行多模态任务的方法可以包括经由文本编码器从查询中获得文本特征,经由视觉编码器从一个或多个输入图像中获得图像特征,以及基于文本特征和图像特征之间的相似性输出对查询的响应,其中根据由超网络生成的共享向量和剪枝向量来剪枝和共享文本编码器和视觉编码器的权重向量,并且其中超网络和多模态模型被联合训练,以最小化文本编码器和视觉编码器中权重向量之间的差异、文本编码器的不同层中权重向量之间的差异和多模态模型中的参数数量中的至少一个。
Information query