-
公开(公告)号:CN118097283A
公开(公告)日:2024-05-28
申请号:CN202410274125.7
申请日:2024-03-11
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/82 , G06V10/776 , G06N3/0499 , G06N3/084
Abstract: 本公开提供了一种图像分类方法及装置、电子设备、可读存储介质,属于机器学习技术领域,该方法包括:基于第一分类类别对目标分类器的权重进行更新。确定第一训练集中样本类别和第二训练集中样本类别的数量比例,基于数量比例计算目标分类器对应的图像分类模型的损失函数值。第一训练集为第一分类类别对应的训练集,第二训练集属于图像分类模型的历史训练集,为第二分类类别对应的训练集。第二分类类别不同于第一分类类别。基于损失函数值、第一训练集以及第二训练集对图像分类模型的骨干网络进行参数更新直至图像分类模型收敛。基于收敛后的图像分类模型进行图像分类。本公开提供的图像分类方法能够减轻数据不平衡问题对图像分类模型训练性能的影响,提高模型的泛化能力。
-
公开(公告)号:CN118093823A
公开(公告)日:2024-05-28
申请号:CN202410287285.5
申请日:2024-03-13
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F16/35 , G06F16/33 , G06N5/022 , G06F18/22
Abstract: 本公开提供了一种大语言模型自我提升方法及装置,属于深度学习技术领域,该方法包括:在第一知识库中检索与第一输入信息对应的反思样本,得到反思样本信息;将反思样本信息和第一输入信息输入至大语言模型中,得到目标反思信息;基于第一输入信息和目标反思信息对第一知识库进行更新;在第二知识库中检索与第二输入信息对应的改进样本,得到改进样本信息;将第二输入信息和改进样本信息输入至大语言模型中,得到目标改进信息;基于第二输入信息和目标改进信息对第二知识库进行更新。本公开根据大语言模型的反思信息和改进信息更新第一知识库和第二知识库,丰富了第一知识库和第二知识库的内容,提高了大语言模型的输出质量。
-
公开(公告)号:CN117437464A
公开(公告)日:2024-01-23
申请号:CN202311366292.6
申请日:2023-10-20
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V20/70 , G06F40/289 , G06N3/045 , G06N3/084
Abstract: 本公开提供了一种图像有序分类模型训练方法及装置、电子设备、存储介质,该方法包括:获取多个类型的训练样本,每个训练样本中包含文本描述和对应于所述文本描述的第一图像;对所述文本描述进行分词处理,得到每个文本描述的分词;对各个文本描述中的第一分词进行第一排序处理,基于第一排序处理的结果对各个文本描述进行排序;其中,所述第一分词为每个文本描述中用于标识训练样本类型的分词;对每个文本描述中的第二分词进行第二排序处理;其中,所述第二分词为每个文本描述中除第一分词之外的分词;基于第一排序处理和第二排序处理后的文本描述以及所述第一图像训练图像有序分类模型。本公开可以解决相关技术中存在的过拟合问题。
-
公开(公告)号:CN119623566A
公开(公告)日:2025-03-14
申请号:CN202411723421.7
申请日:2024-11-28
Applicant: 北京邮电大学
IPC: G06N3/092 , G06N3/0499 , G06F18/23
Abstract: 本发明公开了一种基于涌现混合专家模型的多任务强化学习方法,包括以下步骤:构建多任务强化学习网络,所述多任务强化学习网络包括若干个前馈神经网络,每个前馈神经网络前面连接一个路由网络;对每个前馈神经网络进行聚类分析,均分为若干个专家模块;基于策略梯度下降方法对每个路由网络进行训练,并更新对应专家模块的参数;选取多任务学习环境中的实验任务;对于每个实验任务,基于训练后的路由网络激活对应的专家模块进行解耦处理,完成多任务强化学习。本发明为多任务学习提供了高效稳定的优化策略,有效缓解了多任务学习中参数共享与任务之间相互干扰的难题。
-
公开(公告)号:CN119399337A
公开(公告)日:2025-02-07
申请号:CN202411452920.7
申请日:2024-10-17
Applicant: 北京邮电大学
IPC: G06T15/00 , G06T3/4053 , G06T3/4007 , G06T3/4046
Abstract: 本发明公开了一种基于时空超分辨率和神经辐射场的三维场景渲染方法,属于三维场景重建领域,该方法包括以下步骤:将多视图图像输入神经辐射场得到目标帧低分辨率图像和支持帧低分辨率图像;对目标帧低分辨率图像进行上采样处理得到第一分支的目标帧高分辨率图像;基于目标帧低分辨率图像和支持帧低分辨率图像采用视频插值网络处理并进行图像投影得到第二分支的目标帧高分辨率图像;将第一分支的目标帧高分辨率图像和第二分支的目标帧高分辨率图像输入轻量级神经渲染器得到目标三维场景。
-
公开(公告)号:CN119379652A
公开(公告)日:2025-01-28
申请号:CN202411511389.6
申请日:2024-10-28
Applicant: 北京邮电大学
IPC: G06T7/00 , G06N3/0442 , G06N3/042 , G06N3/08
Abstract: 本发明公开了一种基于视觉大模型的重量估计方法,包括:获取多模态重量数据集,构建视觉语言模型,基于所述多模态重量数据集对所述视觉语言模型进行两个阶段的训练;基于所述多模态重量数据集获得微调数据集;基于微调数据集、类别引导策略和参考校准策略对完成第二阶段训练的视觉语言模型获得重量估计模型;基于重量估计模型与待评估的物体图像进行重量估计。本发明通过类别引导策略和参考校准策略有效提升了视觉大模型的重量估计精度和重量推理能力。
-
公开(公告)号:CN116450784B
公开(公告)日:2024-09-27
申请号:CN202310118446.3
申请日:2023-02-03
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F40/30 , G06F16/33 , G06N20/00
Abstract: 本发明涉及图像处理技术领域,提出了基于任务型对话的图像编辑系统,包括对话理解模块,用于根据输入的对话文本得到对话状态,所述对话状态包括用户要编辑的属性和编辑程度;图像编辑模块,用于接收用户输入图像和对话状态,根据对话状态对用户输入图像进行编辑,输出编辑后的图像;系统回复模块,用于输出系统回复信息;所述对话理解模块包括依次连接的编码器、解码器、第一线性层和Softmax函数,所述编码器和所述解码器均为N个,每一所述解码器的输出均设置一个适应器。通过上述技术方案,解决了现有技术中图像编辑方法在连续的图像编辑时出现历史编辑信息遗忘、用户需求理解偏差、系统交互不准确、不灵活的问题。
-
公开(公告)号:CN118536447A
公开(公告)日:2024-08-23
申请号:CN202410811458.9
申请日:2024-06-21
Applicant: 北京邮电大学
IPC: G06F30/347
Abstract: 本公开提供了一种全局布局优化方法及装置,属于深度学习技术领域,该方法包括:根据目标位置确定第一参数。目标位置为在FPGA中的布局位置。第一参数为全局布局质量评估指标。基于第一判断准则判断第一参数对应的目标位置是否需要调整。响应于第一参数对应的目标位置需要调整,基于第一算法更新目标超参数。目标超参数为用于确定目标位置的参数。基于目标超参数在FPGA中对目标位置的布局进行优化。本公开提供的一种全局布局优化方法及装置能够提高全局布局质量以及优化效率。
-
公开(公告)号:CN118445414A
公开(公告)日:2024-08-06
申请号:CN202410657457.3
申请日:2024-05-25
Applicant: 北京邮电大学
IPC: G06F16/35 , G06F16/583 , G06F16/332 , G06F40/30 , G06F16/9536 , G06Q50/00
Abstract: 本公开提供了一种虚假新闻检测方法及装置、电子设备、可读存储介质,属于深度学习技术领域,该方法包括:根据目标新闻中的第一文本特征和第一图像特征确定对应于目标新闻的语义关联数据;语义关联数据包括第一数据和第二数据;第一数据和第二数据为不同种类的数据;对第一数据进行处理得到第三数据;第三数据包括虚假痕迹信息;基于第二数据和第三数据对目标大语言模型进行训练;基于已训练的目标大语言模型进行虚假新闻检测。本公开基于多模态的数据处理技术,能够更能准确地反映新闻内容的真实性和完整性。
-
公开(公告)号:CN114841861B
公开(公告)日:2024-07-23
申请号:CN202210565019.5
申请日:2022-05-23
Applicant: 北京邮电大学
IPC: G06T3/4053 , G06T3/4046 , G06T5/00 , G06N3/0464 , G06N3/048 , G06V40/18 , G06V10/20 , G06V10/82
Abstract: 本发明涉及图像处理技术领域,提出了基于经验模态分解的图像超分辨系统,输入模块,用于获得第一图像;所述第一图像为低分辨率图像;特征提取模块,用于所述提取第一图像的特征;IMF预测模块,用于根据所述第一图像的特征,预测得到多个IMF特征图;所述多个IMF特征图位于不同的频率;所述IMF预测模块包括多个平行的分支,每个分支为一个CNN滤波器组,且所述分支的数量与所述IMF特征图的数量相同;重建模块,用于根据设定的放大比例,将每一IMF特征图转换为新的IMF,得到多个新的IMF;将多个新的IMF进行叠加得到第二图像,所述第二图像为超分辨率图像。通过上述技术方案,解决了现有技术中图像分辨率低、导致虹膜识别精度低的问题。
-
-
-
-
-
-
-
-
-