-
公开(公告)号:CN119364140A
公开(公告)日:2025-01-24
申请号:CN202411377010.7
申请日:2024-09-30
Applicant: 中国科学院计算技术研究所
IPC: H04N21/854 , G06V10/766 , G06V10/776 , G06V10/40 , H04N21/472
Abstract: 本发明提出一种基于实体和位置关系的轨迹引导视频生成方法和装置,包括:获取待编辑的视频帧及其对应的运动轨迹,视频帧中包括多个实体;提取步骤,以每个实体为中心建立极坐标系,通过将相邻实体边界框的四维向量转换为极坐标向量,得到实体间的相对位置,结合相对位置和视频帧的实体语义信息,得到视频帧的图像特征;初始化零矩阵,根据运动轨迹的轨迹序列点嵌入图像特征,得到实体表示;将实体表示和运动轨迹输入编码器,得到编码结果,将编码结果与高斯噪声相叠加后输入去噪扩散模型,获得多个不同分辨率的特征作为潜在条件信号,最后通过解码器对潜在条件信号进行解码,得到重构视频,作为视频帧在运动轨迹下的视频生成结果。
-
公开(公告)号:CN117710850A
公开(公告)日:2024-03-15
申请号:CN202311575656.1
申请日:2023-11-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于时空分解与对齐的端到端动作视频生成方法,包括:构建视频生成模型,以一组姿势关键点、参考前景及参考背景作为该视频生成模型的模型输入,以目标动作视频作为该视频生成模型的模型输出;将该目标动作视频的原始视频空间分解为多组时空子空间,通过动作流引导使各组时空子空间的子空间特征对齐;将对齐后的各组时空子空间恢复为该原始视频空间,并得到该目标动作视频。本发明还提出一种基于时空分解与对齐的端到端动作视频生成系统,以及一种用于实现基于时空分解与对齐的端到端动作视频生成的数据处理装置。
-
公开(公告)号:CN113627498B
公开(公告)日:2024-03-12
申请号:CN202110854800.X
申请日:2021-07-28
Applicant: 中国科学院计算技术研究所
IPC: G06V10/764 , G06V10/774 , G06V10/46 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种人物丑化图像识别模型训练方法,包括以下步骤:将真实图像样本输入到丑化分类器中进行训练以使该其具有图像分类和图像特征提取的功能;冻结该丑化分类器的网络参数并将其作为图像特征提取器,将噪声和该真实图像样本输入到分类有益生成对抗网络进行训练以使其具有生成合成图像样本的功能;将该分类有益生成对抗网络生成的合成图像样本输入到该丑化分类器中进行进一步训练,得到该丑化分类器即为该人物丑化图像识别模型。
-
公开(公告)号:CN117271768A
公开(公告)日:2023-12-22
申请号:CN202311208664.2
申请日:2023-09-19
Applicant: 中国科学院计算技术研究所
IPC: G06F16/35 , G06F40/126 , G06F40/279 , G06N3/0499
Abstract: 本发明提出一种基于大语言模型分析引导的虚假新闻检测方法,通过将大语言模型的分析中蕴含的知识选择性地注入到小语言模型中,实现大语言模型和小语言模型的协同检测。为进一步降低检测成本,通过知识迁移的方式,基于训练完成的上述网络中得到基于大语言模型分析知识迁移的虚假新闻检测网络,该网络的特点是无需大语言模型分析作为输入,仅使用检测网络中凝结的大模型分析知识用于检测。
-
公开(公告)号:CN116883775A
公开(公告)日:2023-10-13
申请号:CN202310714418.8
申请日:2023-06-15
Applicant: 中国科学院计算技术研究所
IPC: G06V10/774 , G06V10/82 , G06V10/764 , G06V10/74 , G06N3/0475 , G06N3/0464 , G06N3/08
Abstract: 本发明提出一种开放环境的模型溯源方法,包括:以已知图像和对应的已知图像生成模型类别构建为闭集样本;以卷积神经网络构建增强模型,基于该闭集样本以该增强模型生成对应未知图像生成模型类别的开集样本;以该闭集样本和该开集样本训练任务模型,通过完成训练的任务模型预测给定图像的图像生成模型。本发明还提出一种开放环境的模型溯源系统,以及一种用于开放环境下模型溯源的数据处理装置。
-
公开(公告)号:CN111694955B
公开(公告)日:2023-09-12
申请号:CN202010382894.0
申请日:2020-05-08
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种社交平台的早期争议性消息检测方法及系统,包括:收集社交平台中关于预设话题下的所有消息,并根据每一条消息的评论信息为每一条消息的争议性进行标记,提取标记后消息的多维度争议性特征作为训练数据,以该训练数据训练梯度提升树模型,得到争议性消息检测模型;从该社交平台获取待发表的消息作为待检测消息,并将该待检测消息的多维度争议性特征输入至该争议性消息检测模型,得到该待检测消息的争议性消息检测结果。本发明可得到社交平台中待审核发表消息的争议性。
-
公开(公告)号:CN113537027B
公开(公告)日:2023-09-01
申请号:CN202110776853.4
申请日:2021-07-09
Applicant: 中国科学院计算技术研究所
IPC: G06V40/16 , G06V10/40 , G06V10/764 , G06V10/774 , G06N20/00
Abstract: 本发明提出一种基于面部划分的人脸深度伪造检测方法和系统,包括:对训练数据,提取全局人脸特征;根据获取全局人脸特征过程中产生的浅层卷积特征,将该浅层卷积特征根据预设的面部划分方式,划分为多个图像区域,分别将该图像区域输入至局部人脸特征提取模型,得到该人脸图像的多个局部特征;通过注意力模型提取该多个局部特征间的关系特征,并将该关系特征与该全局特征拼接后输入至二分类模型,得到该训练数据的检测结果,根据该结果和该标签构建损失函数,以训练该全局人脸特征提取模型、局部人脸特征提取模型、注意力模型和该二分类模型。
-
公开(公告)号:CN116189313A
公开(公告)日:2023-05-30
申请号:CN202211387389.0
申请日:2022-11-07
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于并发策略的深度合成图像视频伪造检测方法和系统,包括:获取由多个操作构成的深伪检测流程,将该深伪检测流程中操作耗时程度大于预设值的操作作为独立操作,并通过为每个独立操作的数据输入,构建对应的输入缓存队列,得到独立检测流程;以多个该独立检测流程并发执行图像的伪造检测任务,且在伪造检测过程中每个独立检测流程的输入缓存队列根据打包数据策略,将队列中的数据打包送入与当前输入缓存队列对应的独立操作;汇总各独立检测流程的输出,得到该图像的伪造检测结果。
-
公开(公告)号:CN113449601B
公开(公告)日:2023-05-16
申请号:CN202110591209.X
申请日:2021-05-28
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06V40/10 , G06V20/40 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明提出一种基于渐进性平滑损失的行人重识别模型训练方法,包括:获取训练样本数据;其中,所述训练样本数据包括多个包含行人的视频;将所述训练样本数据输入至初始模型中,得到对应各所述包含行人的视频的帧级别特征和视频级别特征;分别基于所述帧级别特征和所述视频级别特征计算第一损失和第二损失;基于所述第一损失和所述第二损失对所述初始模型的模型参数进行优化,得到行人重识别模型。
-
公开(公告)号:CN115393697A
公开(公告)日:2022-11-25
申请号:CN202210895693.X
申请日:2022-07-28
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06V20/00 , G06V10/26 , G06V10/30 , G06V10/40 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种基于多元特征融合分割的图片伪造检测方法和系统,通过提取图像中伪造区域的光照梯度、噪声分布、压缩一致性特征后,对其进行加权融合成一个新的综合特征,送入到专用的分割神经网络判断图像是否是伪造的,并标记出伪造区域,同时将多元融合特征与网络分割结果结合,给出伪造检测的解释性展示,在提高传统方法的准确率和普适性的同时,弥补了深度学习方法可解释性较低的不足。
-
-
-
-
-
-
-
-
-