字幕的生成方法、装置、电子设备及介质

    公开(公告)号:CN117560551A

    公开(公告)日:2024-02-13

    申请号:CN202311023084.6

    申请日:2023-08-15

    摘要: 本申请公开了一种字幕的生成方法、装置、电子设备及介质。通过应用本申请的技术方案,可以通过风格化控制模块辅助已有的图像字幕生成模型来为各个图像生成一个具备特定风格类别的字幕内容。具体来说,一方面可以通过风格控制模块的风格因子控制字幕生成模型来为图像选择一个更具有特定风格特征的词汇。以达到为不同用户输出其偏爱程度更高的字幕内容的目的。另一方面通过流利度因子来计算预测单词和前文已预测得到的词汇的相似性,并以此选择重复程度较低的单词,从而实现降低字幕出现重复单词的可能性,提升句子的流利度。

    基于向量夹角的异常数据检测方法

    公开(公告)号:CN110288043A

    公开(公告)日:2019-09-27

    申请号:CN201910585910.3

    申请日:2019-07-01

    IPC分类号: G06K9/62

    摘要: 本发明提供了一种基于向量夹角的异常数据检测方法,包括:基于原训练样本,获取模型的扰动方向,扰动方向为模型测试时输入观测数据样本后使得该模型的损失函数增大最快的方向;获取输入的观测数据样本相对于同一类别的原训练样本的变化方向,根据扰动方向向量和变化方向向量得到扰动方向与变化方向的向量夹角,通过向量夹角的取值得到异常数据的检测结果。本发明可达到在现有模型上进行较小的改动即可完成异常数据检测,无需再建立一个单独的模型;实现了在无法事先准备异常数据样本的情况下可进行异常数据样本检测的目的;由于本发明是在完成主任务的现有模型上进行改动实现异常数据检测,因此可以实现异常检测结果与主任务结果同步输出。

    一种图像语义分割方法、装置、存储介质及终端

    公开(公告)号:CN115937516B

    公开(公告)日:2023-10-03

    申请号:CN202211458456.3

    申请日:2022-11-21

    摘要: 本发明公开了一种图像语义分割方法、装置、存储介质及终端,方法包括:获取并预处理待处理手绘草图数据,生成手绘草图数据的图结构表示;将手绘草图数据的图结构表示输入预先训练的图像语义分割模型中;预先训练的图像语义分割模型是通过根据模型训练样本生成的特征向量训练的,特征向量是将时序信息中所含的序列信息编码到初始特征向量中生成,时序信息和初始特征向量是基于模型训练样本生成;根据预先训练的图像语义分割模型计算并输出待处理手绘草图数据的语义分割结果。本申请在模型训练的过程中可以引导模型关注图像时序信息并将其中蕴含的序列信息编码进提取到的特征向量中,进而强化了模型对图像的特征提取能力,从而提升了语义分割精度。

    一种图像语义分割方法、装置、存储介质及终端

    公开(公告)号:CN115937516A

    公开(公告)日:2023-04-07

    申请号:CN202211458456.3

    申请日:2022-11-21

    摘要: 本发明公开了一种图像语义分割方法、装置、存储介质及终端,方法包括:获取并预处理待处理手绘草图数据,生成手绘草图数据的图结构表示;将手绘草图数据的图结构表示输入预先训练的图像语义分割模型中;预先训练的图像语义分割模型是通过根据模型训练样本生成的特征向量训练的,特征向量是将时序信息中所含的序列信息编码到初始特征向量中生成,时序信息和初始特征向量是基于模型训练样本生成;根据预先训练的图像语义分割模型计算并输出待处理手绘草图数据的语义分割结果。本申请在模型训练的过程中可以引导模型关注图像时序信息并将其中蕴含的序列信息编码进提取到的特征向量中,进而强化了模型对图像的特征提取能力,从而提升了语义分割精度。