-
公开(公告)号:CN116563635A
公开(公告)日:2023-08-08
申请号:CN202310550550.X
申请日:2023-05-16
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/82 , G06V10/77 , G06N3/0464 , G06N3/0895 , G06N3/096 , G06N3/048 , G06F21/71
Abstract: 本发明涉及图像处理技术领域,提出了基于类别属性建模的图像分类系统,包括图像预处理模块,用于对原始图像进行预处理,得到原始图像的多个数据增广变换图像;骨干网络,用于提取第一数据增广变换图像的特征向量xs;持续学习的知识蒸馏分支,用于通过最小化蒸馏损失函数,使特征向量xs与特征向量xt的概率分布误差在第一设定范围内;自监督学习分支,用于通过最小化对比损失函数,使特征向量xs和特征向量xc的误差在第二设定范围内;属性注意力模块,用于使用属性标记与交叉注意力机制计算特征向量xs的属性编码e;分类模块,用于计算每个类别的分类分数。通过上述技术方案,解决了现有技术中基于回放的持续学习方法内存消耗大的问题。
-
公开(公告)号:CN119151774A
公开(公告)日:2024-12-17
申请号:CN202411373580.9
申请日:2024-09-29
Applicant: 北京邮电大学
IPC: G06T3/04 , G06T5/70 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G06F3/0486 , G06F3/04845
Abstract: 本公开提供了一种图像拖拽编辑方法及系统,属于图像处理技术领域,该方法包括:基于第一图像和第一图像的拖拽点信息进行意图推理,得到N个语义意图;所述第一图像为拖拽编辑前的原始图像;基于N个语义意图分别对第一图像进行编辑,得到N个第二图像;所述N个第二图像用于指示用户从所述N个第二图像中选取目标图像。本公开提供的图像拖拽编辑方法及系统能够得到符合用户预期的拖拽编辑结果。
-
公开(公告)号:CN116450784A
公开(公告)日:2023-07-18
申请号:CN202310118446.3
申请日:2023-02-03
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F40/30 , G06F16/33 , G06N20/00
Abstract: 本发明涉及图像处理技术领域,提出了基于任务型对话的图像编辑系统,包括对话理解模块,用于根据输入的对话文本得到对话状态,所述对话状态包括用户要编辑的属性和编辑程度;图像编辑模块,用于接收用户输入图像和对话状态,根据对话状态对用户输入图像进行编辑,输出编辑后的图像;系统回复模块,用于输出系统回复信息;所述对话理解模块包括依次连接的编码器、解码器、第一线性层和Softmax函数,所述编码器和所述解码器均为N个,每一所述解码器的输出均设置一个适应器。通过上述技术方案,解决了现有技术中图像编辑方法在连续的图像编辑时出现历史编辑信息遗忘、用户需求理解偏差、系统交互不准确、不灵活的问题。
-
公开(公告)号:CN116450784B
公开(公告)日:2024-09-27
申请号:CN202310118446.3
申请日:2023-02-03
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F40/30 , G06F16/33 , G06N20/00
Abstract: 本发明涉及图像处理技术领域,提出了基于任务型对话的图像编辑系统,包括对话理解模块,用于根据输入的对话文本得到对话状态,所述对话状态包括用户要编辑的属性和编辑程度;图像编辑模块,用于接收用户输入图像和对话状态,根据对话状态对用户输入图像进行编辑,输出编辑后的图像;系统回复模块,用于输出系统回复信息;所述对话理解模块包括依次连接的编码器、解码器、第一线性层和Softmax函数,所述编码器和所述解码器均为N个,每一所述解码器的输出均设置一个适应器。通过上述技术方案,解决了现有技术中图像编辑方法在连续的图像编辑时出现历史编辑信息遗忘、用户需求理解偏差、系统交互不准确、不灵活的问题。
-
公开(公告)号:CN118445414A
公开(公告)日:2024-08-06
申请号:CN202410657457.3
申请日:2024-05-25
Applicant: 北京邮电大学
IPC: G06F16/35 , G06F16/583 , G06F16/332 , G06F40/30 , G06F16/9536 , G06Q50/00
Abstract: 本公开提供了一种虚假新闻检测方法及装置、电子设备、可读存储介质,属于深度学习技术领域,该方法包括:根据目标新闻中的第一文本特征和第一图像特征确定对应于目标新闻的语义关联数据;语义关联数据包括第一数据和第二数据;第一数据和第二数据为不同种类的数据;对第一数据进行处理得到第三数据;第三数据包括虚假痕迹信息;基于第二数据和第三数据对目标大语言模型进行训练;基于已训练的目标大语言模型进行虚假新闻检测。本公开基于多模态的数据处理技术,能够更能准确地反映新闻内容的真实性和完整性。
-
公开(公告)号:CN117912082A
公开(公告)日:2024-04-19
申请号:CN202410100065.7
申请日:2024-01-24
Applicant: 北京邮电大学
IPC: G06V40/16 , G06V10/82 , G06N3/0475 , G06N3/094
Abstract: 本公开提供了一种对抗人脸隐私保护方法,属于人脸识别技术领域,该方法包括:基于多个第一输入样本对对抗网络模型进行训练,以对对抗网络模型中的生成器参数和判别器参数进行第一阶段更新。第一输入样本为第一人脸图像。基于多个第二输入样本对对抗网络模型进行训练,以对对抗网络模型中的生成器参数和判别器参数进行第二阶段更新。第二输入样本为多个第二人脸图像。多个第二人脸图像对应的人员身份相同且面部变化不同。基于进行第二阶段更新后的生成器对人脸图像进行隐私保护。本公开提供的对抗人脸隐私保护方法能够提高人脸隐私保护的有效性和效率。
-
公开(公告)号:CN117788646A
公开(公告)日:2024-03-29
申请号:CN202410143913.2
申请日:2024-02-01
Applicant: 北京邮电大学
IPC: G06T11/60 , G06T5/70 , G06N3/0464 , G06N3/0455
Abstract: 本公开提供了一种图像生成方法及装置、电子设备、可读存储介质,属于人工智能技术领域,该方法包括:将第一图像和对应于第一图像的第一文本提示输入至第一模型中得到第一反演噪声;将第一反演噪声以及多个第二文本提示输入至第二模型得到对应于多个第二文本提示的多个第二图像;将第三图像以及对应于第三图像的第三文本提示输入至噪声估计模型中以对噪声估计模型中的可学习参数进行更新;可学习参数更新后的噪声估计模型用于进行图像生成。本公开提供的图像生成方法及装置、电子设备、可读存储介质可以更加细粒度地提取参考图像的风格,使文本提示可以很好的表征风格,还可以生成组合风格的图像。
-
公开(公告)号:CN113757503A
公开(公告)日:2021-12-07
申请号:CN202110950215.X
申请日:2021-08-18
Applicant: 北京邮电大学
Abstract: 本发明提供了一种面部生物特征采集方法及采集装置,包括:利用场景相机采集预定区域的场景图像,分析所采集的场景图像,判定在预定区域内是否出现采集对象;如果预定区域出现采集对象,从场景相机所采集的场景图像中获取采集对象的位置、运动状态、身高和面部姿态相关的粗略信息;根据粗略信息,将安装有特征采集相机模组的并联平台在竖直方向的上下位置调整到位,同时利用特征采集相机模组动态追踪采集对象的面部姿态,同步调整并联平台和其上所安装的特征采集相机模组,以使得特征采集相机模组处于适合采集面部生物特征的姿态和位置;特征采集相机模组完成采集采集对象的面部生物特征。本发明还提出了一种用于实施前述采集方法的采集装置。
-
公开(公告)号:CN118093823A
公开(公告)日:2024-05-28
申请号:CN202410287285.5
申请日:2024-03-13
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F16/35 , G06F16/33 , G06N5/022 , G06F18/22
Abstract: 本公开提供了一种大语言模型自我提升方法及装置,属于深度学习技术领域,该方法包括:在第一知识库中检索与第一输入信息对应的反思样本,得到反思样本信息;将反思样本信息和第一输入信息输入至大语言模型中,得到目标反思信息;基于第一输入信息和目标反思信息对第一知识库进行更新;在第二知识库中检索与第二输入信息对应的改进样本,得到改进样本信息;将第二输入信息和改进样本信息输入至大语言模型中,得到目标改进信息;基于第二输入信息和目标改进信息对第二知识库进行更新。本公开根据大语言模型的反思信息和改进信息更新第一知识库和第二知识库,丰富了第一知识库和第二知识库的内容,提高了大语言模型的输出质量。
-
公开(公告)号:CN117437464A
公开(公告)日:2024-01-23
申请号:CN202311366292.6
申请日:2023-10-20
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V20/70 , G06F40/289 , G06N3/045 , G06N3/084
Abstract: 本公开提供了一种图像有序分类模型训练方法及装置、电子设备、存储介质,该方法包括:获取多个类型的训练样本,每个训练样本中包含文本描述和对应于所述文本描述的第一图像;对所述文本描述进行分词处理,得到每个文本描述的分词;对各个文本描述中的第一分词进行第一排序处理,基于第一排序处理的结果对各个文本描述进行排序;其中,所述第一分词为每个文本描述中用于标识训练样本类型的分词;对每个文本描述中的第二分词进行第二排序处理;其中,所述第二分词为每个文本描述中除第一分词之外的分词;基于第一排序处理和第二排序处理后的文本描述以及所述第一图像训练图像有序分类模型。本公开可以解决相关技术中存在的过拟合问题。
-
-
-
-
-
-
-
-
-