针对包含边框的视频拷贝检测方法及装置

    公开(公告)号:CN113971770B

    公开(公告)日:2024-10-29

    申请号:CN202010648949.8

    申请日:2020-07-07

    摘要: 本发明涉及一种针对包含边框的视频拷贝检测方法及装置,该方法包括:从样本视频中抽取多个第一关键帧图像;基于图像边缘由外向内遍历第一关键帧图像,去除纯色像素点区域,得到多个非纯色像素点为边缘的第二关键帧图像;对第二关键帧图像进行二次遍历,去除纯色像素点个数大于第一阈值的图像区域;从每个第二关键帧图像中提取图像特征,得到多个第一多维图像特征向量;基于多个第一多维图像特征向量与视频库中存储的视频的多个第二多维图像特征向量建立索引,获取多个拷贝视频帧图像;根据时间信息,将多个拷贝视频帧图像进行整合,获得拷贝视频片段,由此,可以实现对视频中存在的多处拷贝视频片段的准确检测,并确定其在原视频中的位置。

    图片匹配方法、装置、电子设备以及存储介质

    公开(公告)号:CN112650867B

    公开(公告)日:2024-09-24

    申请号:CN202011561238.3

    申请日:2020-12-25

    IPC分类号: G06F16/535 G06F16/583

    摘要: 本发明实施例公开了一种图片匹配方法、装置、电子设备以及存储介质。该方法包括:获取目标文本,基于预先训练的特征提取模型提取所述目标文本的文本特征信息;将所述文本特征信息与预设图库中各图片的图片特征信息进行匹配,其中,所述各图片的图片特征信息基于所述预先训练的特征提取模型对各图片提取得到,所述特征提取模型包括文本特征提取子模型、图片特征提取子模型以及分别与所述文本特征提取子模型、所述图片特征提取子模型连接的联合特征提取子模型;将与所述文本特征信息相匹配的图片确定为所述目标文本的匹配图片。通过本发明实施例公开的技术方案,实现了文本自动配图,提升文本的观感质量,激发读者的阅读兴趣,提升读者的阅读体验。

    评论生成模型训练方法和装置、信息生成方法和装置

    公开(公告)号:CN117591948B

    公开(公告)日:2024-09-03

    申请号:CN202410082714.5

    申请日:2024-01-19

    摘要: 本公开提供了一种评论生成模型训练方法和装置,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为:获取文本样本集,文本样本集包括:第一文本样本,第一文本样本包括:展示文本以及与展示文本相关的情感立场文本;获取预先构建的评论生成网络,评论生成网络包括:编码器和解码器,编码器分别对展示文本和情感立场文本进行建模,得到评论全局特征向量;解码器用于对评论全局特征向量进行解码,得到评论结果信息;将从文本样本集中选取的第一文本样本输入评论生成网络,得到评论生成网络输出的评论结果信息;基于评论结果信息,得到训练完成的评论生成模型。

    基于预训练模型的通用立场检测方法、装置和存储介质

    公开(公告)号:CN117972420A

    公开(公告)日:2024-05-03

    申请号:CN202410038893.2

    申请日:2024-01-10

    摘要: 本申请涉及自然语言处理技术领域,尤其涉及一种基于预训练模型的通用立场检测方法、装置和存储介质。包括:获取待检测文本和待检测立场目标;将待检测文本和待检测立场目标输入通用立场检测模型,预测待检测文本对于待检测立场目标的立场类别概率分布;立场类别用于表示待检测文本对于待检测立场目标的立场;通用立场检测模型为根据至少一个文本、至少一个立场目标、每个文本的立场类别和每个文本的立场类型预先训练得到;立场类型用于表示文本的立场类别是否依赖于立场目标;将立场类别概率分布中最大概率数值对应的立场类别,确定为待检测文本对于待检测立场目标的立场类别。本申请实施例用于解决立场检测的检测效果较差的问题。

    一种多模态大型语言模型训练方法、电子设备及存储介质

    公开(公告)号:CN117409431A

    公开(公告)日:2024-01-16

    申请号:CN202311412797.1

    申请日:2023-10-27

    摘要: 本发明提供了多模态大型语言模型训练方法、电子设备和存储介质,涉及计算机技术应用领域,包括:利用第一训练样本对图文对齐模型进行训练,得到训练后的图文对齐模型;第二训练样本对大型语言模型进行训练,第一训练样本对包含一个第一图像样本和对应的原始文本;第一图像样本仅包括自然图像;第二训练样本集包括多个第二训练样本对,每个第二训练样本对包含一个第二图像样本和对应的问答对文本,其中,第二图像样本中设置有目标检测框,第二图像样本至少包括文档、表格、图表和自然图像。本发明能够理解不同种类的图表和文档数据,且具有对图片中的区域准确定位的能力,能够解锁更加多样的多模态能力。

    一种多模态大模型训练策略确定方法、电子设备及介质

    公开(公告)号:CN117407754A

    公开(公告)日:2024-01-16

    申请号:CN202311415357.1

    申请日:2023-10-27

    摘要: 本发明提供了一种多模态大模型训练策略确定方法、电子设备及介质,涉及多模态大模型训练策略确定领域,所述方法包括:获取初始多模态大模型对应的状态列表A;使用预设的一阶段训练策略,对初始多模态大模型进行训练,以得到第一中间多模态大模型列表B;使用预设的两阶段训练策略,分别对处于A中每一状态的初始多模态大模型进行训练,以得到第二中间多模态大模型列表C;获取B对应的第一性能参数列表α=(α1,α2,α3)以及C对应的第二性能参数列表β=(β1,β2,β3);若α1<β1、α2<β2且α3<β3,则将预设的两阶段训练策略确定为初始多模态大模型对应的目标训练策略;本发明能够达到确定出最佳的模型训练策略的目的。

    面向大语言模型的词向量生成方法、电子设备及存储介质

    公开(公告)号:CN117113990A

    公开(公告)日:2023-11-24

    申请号:CN202311374453.6

    申请日:2023-10-23

    摘要: 本发明涉及计算机技术应用领域,提供了一种面向大语言模型的词向量生成方法、电子设备及存储介质,包括:获取待分词的文本,作为目标文本;对目标文本进行分词处理,得到对应的分词集S;基于预设词向量基准表T,获取每个词在每个嵌入矩阵的特征向量;基于预设滑动窗口长度d,将S划分为多个语句片段,得到对应的语句片段集SP;对每个语句片段的特征向量进行融合,得到对应的特征向量;得到SP对应的特征向量F作为目标文本的特征向量。本发明在词向量生成过程中,将多个相邻的词组合视为一个词,能够使得分词的长度得到极大的压缩。此外,将不同词的特征向量通过张量积的方式组合成一个词的特征向量,可以极大的降低可训练参数量。