- 专利标题: 基于纯文本数据训练的图像理解方法、系统、设备及介质
-
申请号: CN202410375523.8申请日: 2024-03-29
-
公开(公告)号: CN117972141B公开(公告)日: 2024-06-18
- 发明人: 张勇东 , 卢志颖 , 谢洪涛 , 刘传彬
- 申请人: 中国科学技术大学
- 申请人地址: 安徽省合肥市包河区金寨路96号
- 专利权人: 中国科学技术大学
- 当前专利权人: 中国科学技术大学
- 当前专利权人地址: 安徽省合肥市包河区金寨路96号
- 代理机构: 北京凯特来知识产权代理有限公司
- 代理商 韩珂; 郑立明
- 主分类号: G06F16/78
- IPC分类号: G06F16/78 ; G06F16/75 ; G06F16/783 ; G06V10/44 ; G06V10/764 ; G06V10/82 ; G06N3/0455 ; G06N3/08 ; G06N5/04
摘要:
本发明公开了一种基于纯文本数据训练的图像理解方法、系统、设备及介质,它们是一一对应的方案,方案中:利用纯文本数据进行训练,极大的节省了复杂的图文数据收集和标注流程,并且通过实验表明,采用本发明训练后的图像理解模型具有较高的理解精确度;而且,相比于传统方案在训练和推理阶段使用复杂的文本编码器,本发明在推理阶段仅输入图像,无需额外的文本编码器,从而大大加速了推理速度,对实际应用有积极深远的影响。
公开/授权文献
- CN117972141A 基于纯文本数据训练的图像理解方法、系统、设备及介质 公开/授权日:2024-05-03