-
公开(公告)号:CN113449601B
公开(公告)日:2023-05-16
申请号:CN202110591209.X
申请日:2021-05-28
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06V40/10 , G06V20/40 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明提出一种基于渐进性平滑损失的行人重识别模型训练方法,包括:获取训练样本数据;其中,所述训练样本数据包括多个包含行人的视频;将所述训练样本数据输入至初始模型中,得到对应各所述包含行人的视频的帧级别特征和视频级别特征;分别基于所述帧级别特征和所述视频级别特征计算第一损失和第二损失;基于所述第一损失和所述第二损失对所述初始模型的模型参数进行优化,得到行人重识别模型。
-
公开(公告)号:CN113343810A
公开(公告)日:2021-09-03
申请号:CN202110590381.3
申请日:2021-05-28
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
Abstract: 本发明提出一种基于时序多样性与相关性的行人重识别模型训练方法,包括以下步骤:获取训练样本数据,所述训练样本数据包括多个包含行人的视频序列;将所述训练样本数据输入至初始模型中采样各所述包含行人的视频序列的多帧视频,并且提取所述多帧视频的帧级别特征,聚合所述帧级别特征得到视频级别特征;基于所述视频级别特征计算视频级别损失;基于所述视频级别损失对所述初始模型的模型参数进行优化,得到行人重识别模型。
-
公开(公告)号:CN113449601A
公开(公告)日:2021-09-28
申请号:CN202110591209.X
申请日:2021-05-28
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
Abstract: 本发明提出一种基于渐进性平滑损失的行人重识别模型训练方法,包括:获取训练样本数据;其中,所述训练样本数据包括多个包含行人的视频;将所述训练样本数据输入至初始模型中,得到对应各所述包含行人的视频的帧级别特征和视频级别特征;分别基于所述帧级别特征和所述视频级别特征计算第一损失和第二损失;基于所述第一损失和所述第二损失对所述初始模型的模型参数进行优化,得到行人重识别模型。
-
公开(公告)号:CN113343810B
公开(公告)日:2023-03-21
申请号:CN202110590381.3
申请日:2021-05-28
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06V20/40 , G06V40/10 , G06V10/774
Abstract: 本发明提出一种基于时序多样性与相关性的行人重识别模型训练方法,包括以下步骤:获取训练样本数据,所述训练样本数据包括多个包含行人的视频序列;将所述训练样本数据输入至初始模型中采样各所述包含行人的视频序列的多帧视频,并且提取所述多帧视频的帧级别特征,聚合所述帧级别特征得到视频级别特征;基于所述视频级别特征计算视频级别损失;基于所述视频级别损失对所述初始模型的模型参数进行优化,得到行人重识别模型。
-
公开(公告)号:CN111832622A
公开(公告)日:2020-10-27
申请号:CN202010531569.6
申请日:2020-06-11
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
Abstract: 本发明提出一种特定人物丑化图片识别方法和系统,包括:获取包含特定人物的图片集,该图片集包括多张漫画和多张照片,该图片集中每张图片标有代表是否丑化的预设标签,以该图片集中漫画和照片分别作为训练数据,训练卷积神经网络模型,得到特定人物漫画识别网络和特定人物照片识别网络;通过前置网络判断待识别图片是否属于漫画,若是,则将该待识别图片发送至该特定人物漫画识别网络,得到该待识别图片的特定人物丑化图片识别结果,否则对该待识别图片进行人脸对比,判断该待识别图片是否包括该特定人物,若是则通过该特定人物照片识别网络,得到该待识别图片的特定人物丑化图片识别结果,否则得到该待识别图片不包括该特定人物的识别结果。
-
公开(公告)号:CN111832621A
公开(公告)日:2020-10-27
申请号:CN202010531567.7
申请日:2020-06-11
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
Abstract: 本发明提出一种基于稠密多路卷积网络的图片分类方法和系统,包括:构建由分组、变换、聚合构成的基本单元,基于该基本单元构建新的稠密模块,将密集连接的卷积DenseNet网络网络框架中原始稠密模块替换为该新稠密模块,得到稠密多路卷积网络;使用已标记类别的图片数据作为训练数据,通过梯度反向传播更新该稠密多路卷积网络中的权重,训练该稠密多路卷积网络,得到图片分类模型;将待分类图片数据输入该分类模型,得到该待分类图片数据的分类结果。本发明提出的稠密多路卷积网络,对DenseNet网络的基本模块进行了改进和优化,以获取表达力更强的特征。
-
公开(公告)号:CN119364140A
公开(公告)日:2025-01-24
申请号:CN202411377010.7
申请日:2024-09-30
Applicant: 中国科学院计算技术研究所
IPC: H04N21/854 , G06V10/766 , G06V10/776 , G06V10/40 , H04N21/472
Abstract: 本发明提出一种基于实体和位置关系的轨迹引导视频生成方法和装置,包括:获取待编辑的视频帧及其对应的运动轨迹,视频帧中包括多个实体;提取步骤,以每个实体为中心建立极坐标系,通过将相邻实体边界框的四维向量转换为极坐标向量,得到实体间的相对位置,结合相对位置和视频帧的实体语义信息,得到视频帧的图像特征;初始化零矩阵,根据运动轨迹的轨迹序列点嵌入图像特征,得到实体表示;将实体表示和运动轨迹输入编码器,得到编码结果,将编码结果与高斯噪声相叠加后输入去噪扩散模型,获得多个不同分辨率的特征作为潜在条件信号,最后通过解码器对潜在条件信号进行解码,得到重构视频,作为视频帧在运动轨迹下的视频生成结果。
-
公开(公告)号:CN117710850A
公开(公告)日:2024-03-15
申请号:CN202311575656.1
申请日:2023-11-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于时空分解与对齐的端到端动作视频生成方法,包括:构建视频生成模型,以一组姿势关键点、参考前景及参考背景作为该视频生成模型的模型输入,以目标动作视频作为该视频生成模型的模型输出;将该目标动作视频的原始视频空间分解为多组时空子空间,通过动作流引导使各组时空子空间的子空间特征对齐;将对齐后的各组时空子空间恢复为该原始视频空间,并得到该目标动作视频。本发明还提出一种基于时空分解与对齐的端到端动作视频生成系统,以及一种用于实现基于时空分解与对齐的端到端动作视频生成的数据处理装置。
-
公开(公告)号:CN113627498B
公开(公告)日:2024-03-12
申请号:CN202110854800.X
申请日:2021-07-28
Applicant: 中国科学院计算技术研究所
IPC: G06V10/764 , G06V10/774 , G06V10/46 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种人物丑化图像识别模型训练方法,包括以下步骤:将真实图像样本输入到丑化分类器中进行训练以使该其具有图像分类和图像特征提取的功能;冻结该丑化分类器的网络参数并将其作为图像特征提取器,将噪声和该真实图像样本输入到分类有益生成对抗网络进行训练以使其具有生成合成图像样本的功能;将该分类有益生成对抗网络生成的合成图像样本输入到该丑化分类器中进行进一步训练,得到该丑化分类器即为该人物丑化图像识别模型。
-
公开(公告)号:CN117271768A
公开(公告)日:2023-12-22
申请号:CN202311208664.2
申请日:2023-09-19
Applicant: 中国科学院计算技术研究所
IPC: G06F16/35 , G06F40/126 , G06F40/279 , G06N3/0499
Abstract: 本发明提出一种基于大语言模型分析引导的虚假新闻检测方法,通过将大语言模型的分析中蕴含的知识选择性地注入到小语言模型中,实现大语言模型和小语言模型的协同检测。为进一步降低检测成本,通过知识迁移的方式,基于训练完成的上述网络中得到基于大语言模型分析知识迁移的虚假新闻检测网络,该网络的特点是无需大语言模型分析作为输入,仅使用检测网络中凝结的大模型分析知识用于检测。
-
-
-
-
-
-
-
-
-