基于大模型的推测解码方法、装置、设备以及存储介质

    公开(公告)号:CN119806649A

    公开(公告)日:2025-04-11

    申请号:CN202411886929.9

    申请日:2024-12-19

    Abstract: 本公开提供了基于大模型的推测解码方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域。具体实现方案为:将第一词元序列输入第一大模型,得到第二词元序列;其中,该第一大模型是根据第二大模型量化得到的,该第一词元序列基于多模态数据得到;将该第一词元序列和该第二词元序列输入该第二大模型,得到第三词元序列;根据该第二词元序列和该第三词元序列进行验证,得到推测解码结果。

    文本确定方法、多模态大模型训练方法以及设备

    公开(公告)号:CN119862957A

    公开(公告)日:2025-04-22

    申请号:CN202411858879.3

    申请日:2024-12-16

    Abstract: 本公开提供了基于多模态大模型的文本确定方法、多模态大模型训练方法以及设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、自然语言处理、大模型等技术领域。具体实现方案为:通过多模态大模型中的编码网络、目标图像以及目标图像对应的任务描述文本确定出第一词元序列,并将第一词元序列输入多模态大模型中的大语言模型,获取输出的第一词元特征序列,以及将第一词元特征序列中最后一个词元特征分别输入多模态大模型中的各个解码网络,获取各个解码网络输出的目标词元,并根据第一词元序列和目标词元,得到目标文本。

Patent Agency Ranking