用于生成信息的方法和装置

    公开(公告)号:CN108509904A

    公开(公告)日:2018-09-07

    申请号:CN201810276675.7

    申请日:2018-03-30

    Inventor: 张刚

    Abstract: 本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取第一图像以及与第一图像关联的标注信息,标注信息包括第一图像中至少两类目标区域的位置信息以及至少两类目标区域的类型信息;根据标注信息分别提取第一图像中目标区域的特征向量;融合所提取的特征向量,得到第一特征向量;获取第二图像以及与第二图像关联的第二特征向量;根据第一特征向量与第二特征向量之间的距离,生成第一图像与第二图像之间的相似度信息。该实施方式提供了一种基于不同种类的目标区域生成相似度信息的机制,丰富了信息生成方法。

    图像方法和装置
    32.
    发明公开

    公开(公告)号:CN108491890A

    公开(公告)日:2018-09-04

    申请号:CN201810299833.0

    申请日:2018-04-04

    Inventor: 张刚

    Abstract: 本申请实施例公开了图像处理方法和装置。该方法的一具体实施方式包括:从第一处理器接收待处理图像;将待处理图像作为目标图像输入基于神经网络的机器学习模型进行处理,得到处理结果;响应于确定得到目标图像的处理结果,向第一处理器发送图像获取请求,其中第一处理器响应于接收到图像获取请求且已获取新的待处理图像,发送所获取的新的待处理图像;响应于接收到第一处理器发送的处理结果获取请求,向第一处理器发送目标图像的处理结果,其中,第一处理器响应于接收到目标图像的处理结果,对目标图像的处理结果进行融合处理,输出融合后的处理结果并向第一处理器发送处理结果获取请求,该实施方式提升了图像处理效率。

    用于识别对象的方法和装置

    公开(公告)号:CN108446737A

    公开(公告)日:2018-08-24

    申请号:CN201810236270.0

    申请日:2018-03-21

    Inventor: 张刚

    Abstract: 本申请实施例公开了用于识别对象的方法和装置。该方法的一具体实施方式包括:获取包含目标对象的待匹配图像;确定预设的候选匹配图像集合中的每个候选匹配图像与待匹配图像的匹配度作为第一匹配度;基于第一匹配度,从候选匹配图像集合中选取符合第一预设条件的候选匹配图像;确定预设的验证匹配图像集合中的每个验证匹配图像与选取的候选匹配图像的匹配度作为第二匹配度,其中,验证匹配图像集合中包含待匹配图像;基于第二匹配度,从验证匹配图像集合中选取符合第二预设条件的验证匹配图像;响应于选取的验证匹配图像不同于待匹配图像,确定选取的候选匹配图像中不包含目标对象。该实施方式有助于识别选出的候选匹配图像中所包含的对象。

    模型生成方法和装置
    34.
    发明公开

    公开(公告)号:CN108256646A

    公开(公告)日:2018-07-06

    申请号:CN201810059365.X

    申请日:2018-01-22

    Inventor: 张刚

    Abstract: 本申请实施例公开了模型生成方法和装置。该方法的一具体实施方式包括:创建与用于生成原始模型的原始神经网络的结构相同的神经网络,以及对创建的神经网络的多个待裁剪的中间层的结构分别进行裁剪,得到目标神经网络;通过训练操作对目标神经网络进行训练,得到目标模型。实现了通过对创建的与用于生成原始模型的原始神经网络结构相同的神经网络的部分层的结构进行裁剪,得到占用的存储空间较小的目标神经网络,利用原始模型的输出层的输出对目标神经网络进行训练,得到目标模型。减少了构建占用的存储空间较小的目标神经网络的开销以及减少了为使得最后得到的存储空间较小的目标模型达到精度阈值所需的训练开销。

    用于生成图像的方法和装置

    公开(公告)号:CN107609506A

    公开(公告)日:2018-01-19

    申请号:CN201710806650.9

    申请日:2017-09-08

    Inventor: 何涛 张刚 刘经拓

    Abstract: 本申请公开了用于生成图像的方法和装置。该方法的一具体实施方式包括:获取至少两张人脸图像;将上述至少两张人脸图像输入预先训练的生成模型生成单张人脸图像,其中,生成模型在训练过程中利用损失函数更新模型参数,而该损失函数是基于单张人脸生成图像为真实人脸图像的概率和该单张人脸生成图像与得到该单张人脸生成图像的至少两张人脸样本图像之间的相似度确定的。该实施方式提高了所生成人脸图像的真实性。

    为人脸识别生成训练数据的方法、装置和计算机存储介质

    公开(公告)号:CN107609481A

    公开(公告)日:2018-01-19

    申请号:CN201710691048.5

    申请日:2017-08-14

    Abstract: 本发明提供了一种为人脸识别生成训练数据的方法、装置和计算机存储介质,其中方法包括:将未戴配件的人脸图像输入生成式网络,得到戴配件的人脸图像;将所述戴配件的人脸图像用于建立人脸识别模型的第二训练数据;其中所述生成式网络为利用第一训练数据预先训练得到的对抗生成式网络中的生成式网络,所述第一训练数据包括同一用户标识对应的未戴配件人脸图像和戴配件人脸图像。本发明通过数据增广方式得到的戴配件的人脸图像大大扩充了建立人脸识别模型的训练数据数量,从而提高了戴配件的人脸图像的识别准确性。

    文本确定方法、多模态大模型训练方法以及设备

    公开(公告)号:CN119862957A

    公开(公告)日:2025-04-22

    申请号:CN202411858879.3

    申请日:2024-12-16

    Abstract: 本公开提供了基于多模态大模型的文本确定方法、多模态大模型训练方法以及设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、自然语言处理、大模型等技术领域。具体实现方案为:通过多模态大模型中的编码网络、目标图像以及目标图像对应的任务描述文本确定出第一词元序列,并将第一词元序列输入多模态大模型中的大语言模型,获取输出的第一词元特征序列,以及将第一词元特征序列中最后一个词元特征分别输入多模态大模型中的各个解码网络,获取各个解码网络输出的目标词元,并根据第一词元序列和目标词元,得到目标文本。

    电子设备的语音控制方法、装置、计算机设备和存储介质

    公开(公告)号:CN112017650B

    公开(公告)日:2024-05-24

    申请号:CN201910468915.8

    申请日:2019-05-31

    Abstract: 本申请提出一种电子设备的语音控制方法、装置、计算机设备和存储介质,其中,方法包括:通过接收用户的第一语音指令进入音乐模式;进入音乐模式之后预定时间段内启动电子设备的全双工聆听状态,在全双工聆听状态之下获取第一类型用户指令并识别;第一类型用户指令与音乐模式相关执行第一类型用户指令;第一类型用户指令与音乐模式不相关不执行第一类型用户指令;在预定时间段之后,退出全双工聆听状态。由此,进入音乐模式之后预定时间段内,启动电子设备的全双工聆听状态,直接对不具有唤醒词的第一类型用户指令进行识别,并且第一类型用户指令与音乐模式相关才执行,节约用户语音发起指令成本,保证电子设备正常播放语音,提升用户使用体验。

    用于识别对象的方法和装置

    公开(公告)号:CN108446737B

    公开(公告)日:2022-07-05

    申请号:CN201810236270.0

    申请日:2018-03-21

    Inventor: 张刚

    Abstract: 本申请实施例公开了用于识别对象的方法和装置。该方法的一具体实施方式包括:获取包含目标对象的待匹配图像;确定预设的候选匹配图像集合中的每个候选匹配图像与待匹配图像的匹配度作为第一匹配度;基于第一匹配度,从候选匹配图像集合中选取符合第一预设条件的候选匹配图像;确定预设的验证匹配图像集合中的每个验证匹配图像与选取的候选匹配图像的匹配度作为第二匹配度,其中,验证匹配图像集合中包含待匹配图像;基于第二匹配度,从验证匹配图像集合中选取符合第二预设条件的验证匹配图像;响应于选取的验证匹配图像不同于待匹配图像,确定选取的候选匹配图像中不包含目标对象。该实施方式有助于识别选出的候选匹配图像中所包含的对象。

    用于生成图像的方法和装置

    公开(公告)号:CN107633218B

    公开(公告)日:2021-06-08

    申请号:CN201710806066.3

    申请日:2017-09-08

    Inventor: 何涛 张刚 刘经拓

    Abstract: 本申请公开了用于生成图像的方法和装置。该方法的一具体实施方式包括:获取待处理人脸图像,其中,所述待处理人脸图像的图像分辨率低于预先设定的第一分辨率阈值;将所述待处理人脸图像输入预先训练的生成模型,生成处理后的人脸图像,上述生成模型在训练过程中利用损失函数更新模型参数,而该损失函数是基于人脸样本图像和人脸生成图像组成的图像组为正样本数据的概率确定的。该实施方式提高了所生成的人脸图像的真实性。

Patent Agency Ranking