-
公开(公告)号:CN118798214A
公开(公告)日:2024-10-18
申请号:CN202410949511.1
申请日:2024-07-16
Applicant: 北京邮电大学
IPC: G06F40/30 , G06F40/211 , G06N3/045 , G06F16/35
Abstract: 本发明公开了一种基于语义三元组的面向用户意愿的语义通信方法,属于人工智能与通信融合领域;具体过程为:发送端采集待传输的文本数据,依次利用开源工具OpenIE和句法依存分析提取文本中的三元组,通过语义三元组表征面向用户意愿的语义信息;然后,基于用户意愿对提取的语义三元组,将语义冗余和意愿无关的三元组进行过滤,降低传输的数据量;接着,基于深度学习的联合语义编码和信道编码,对过滤后的语义三元组进一步压缩,得到语义符号并经信道传输到接收端,进行信道解码后输入语义解码器,最终输出符合用户意愿结果;本发明通过可解释地表征和压缩语义信息,相比于传统通信方法,可以实现更高的用户意愿性能,达到性能优势。
-
公开(公告)号:CN119399794A
公开(公告)日:2025-02-07
申请号:CN202411521867.1
申请日:2024-10-29
Applicant: 北京邮电大学
IPC: G06V40/10 , G06V20/52 , G06V10/764 , G06V10/774 , G06V10/42 , G06V10/80 , G06V10/82 , G06F18/25 , G06F18/24 , G06N3/0499 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于大规模预训练模型的跨模态行人搜索的实现方法,涉及计算机视觉、自然语言处理和机器学习技术领域。首先对某个跨模态行人搜索数据集按比例将其中的图像划分为训练数据集和验证数据集,并将训练数据集和验证数据集中的行人图像属性分别按照自定义的句子模板进行填充,得到对应的两个文本。将训练数据集的文本数据中的属性进行随机掩码,得到掩码文本。然后基于大规模预训练模型构建跨模态行人搜索算法,将训练数据集的图像、文本和掩码文本导入跨模态行人搜索算法中,通过训练迭代生成跨模态行人搜索算法模型。最后通过测试数据集合测试训练好的跨模态行人搜索算法模型的搜索准确率。
-
公开(公告)号:CN116634245A
公开(公告)日:2023-08-22
申请号:CN202310610681.2
申请日:2023-05-26
Applicant: 中电信数智科技有限公司 , 北京邮电大学
IPC: H04N21/8358 , H04N19/467
Abstract: 本发明涉及一种视频信息处理方法、装置、电子设备及存储介质,该方法包括:获取载体视频和秘密视频,并基于载体视频和秘密视频进行正反向过程处理用以分别得到载密视频和重建秘密视频;基于载体视频、秘密视频、载密视频和重建秘密视频进行自训练,以获取载体视频、秘密视频、载密视频和重建秘密视频之间的映射关系;基于载体视频和秘密视频得到最优重建秘密视频。通过载体视频、秘密视频、载密视频和重建秘密视频以获取四者之间的映射关系,可有效的减少秘密视频隐藏及提取过程中产生的损失。相对于现有视频信息处理方法中存在的因大量信息损失导致生成载密视频和重建秘密视频失真度大的问题。
-
公开(公告)号:CN112487227A
公开(公告)日:2021-03-12
申请号:CN202011358906.2
申请日:2020-11-27
Applicant: 北京邮电大学 , 中国电信集团系统集成有限责任公司
Abstract: 本申请公开了一种深度学习的细粒度图像分类方法,该方法包括:重复如下步骤:通过类间采样器从数据集中随机采样不同类的两张图像,生成图像对,将其输入到骨干网络进行训练;通过类内采样器从数据集中随机采样同类的两张图像,生成图像对,将其输入到骨干网络进行训练;从数据集中随机采样一张图像,将其生成骨干网络进行训练和分类预测;分析如上所述的分类预测结果,采样增强模块指导类间采样器和类内采样器生成图像对;本申请提供的一种基于三阶段深度学习的细粒度图像分类方法及系统,通过各个子模块,混合增强模块得以更好的解决细粒度图像分类任务中类内差异大类间差异小的问题。
-
公开(公告)号:CN112487229A
公开(公告)日:2021-03-12
申请号:CN202011364185.6
申请日:2020-11-27
Applicant: 北京邮电大学 , 中国电信集团系统集成有限责任公司
Abstract: 本申请提供细粒度图像分类方法、系统及预测模型的训练方法,细粒度图像分类方法包括:重复如下步骤,直至更新后的第一层为神经网络的最后一层:接收神经网络的第一层的输出特征,作为可学习的非局部模块的输入特征;将非局部模块的输出特征作为神经网络的第一层的输入特征;用第二层更新第一层;并且,若更新后的第一层为神经网络的最后一层,则将神经网络的最后一层的输出特征输入分类网络中;将分类网络的输出特征作为预测结果并输出。本申请在神经网络的每两层之间插入一个可学习的非局部模块,使得每一层的神经元的感受野大小与物体部分大小匹配,可以更好的关联多层多尺度的特征,有效的提升细粒度图像分类中神经网络的性能。
-
公开(公告)号:CN112487227B
公开(公告)日:2023-12-26
申请号:CN202011358906.2
申请日:2020-11-27
Applicant: 北京邮电大学 , 中国电信集团系统集成有限责任公司
Abstract: 本申请公开了一种深度学习的细粒度图像分类方法,该方法包括:重复如下步骤:通过类间采样器从数据集中随机采样不同类的两张图像,生成图像对,将其输入到骨干网络进行训练;通过类内采样器从数据集中随机采样同类的两张图像,生成图像对,将其输入到骨干网络进行训练;从数据集中随机采样一张图像,将其生成骨干网络进行训练和分类预测;分析如上所述的分类预测结果,采样增强模块指导类间采样器和类内采样器生成图像对;本申请提供的一种基于三阶段深度学习的细粒度图像分类方法及系统,通过各个子模块,混合增强模块得以更好的解决细粒度图像分类任务中类内差异大类间差异小的问题。
-
公开(公告)号:CN116501909A
公开(公告)日:2023-07-28
申请号:CN202310607631.9
申请日:2023-05-26
Applicant: 中电信数智科技有限公司 , 北京邮电大学
IPC: G06F16/583 , G06V10/42 , G06V10/44 , G06V10/774 , G06V10/82
Abstract: 本申请提出一种基于多任务学习的车辆检索方法,包括如下步骤:获取包含车辆图像标注信息的训练数据集合、验证数据集合和测试数据集合,将所述训练数据集合的数据按照图像序号输入基于多任务学习的初始车辆检索模型中以训练得到车辆检索模型;将所述验证数据集合中的数据输入训练后的车辆检索模型,得到初步排序结果;采用多任务检索策略对所述初步排序结果进行重排序,得到最终排序结果。本申请通过多任务学习的方式指导车辆图像特征的提取,设计相机视角检索、车辆朝向检索作为辅助任务,消除检索时背景及视角不同带来的偏差,从而有效解决相机视角、车辆朝向变换导致的问题,以实现强可解释性、高效率、高检索精度的车辆检索。
-
公开(公告)号:CN112487229B
公开(公告)日:2022-11-11
申请号:CN202011364185.6
申请日:2020-11-27
Applicant: 北京邮电大学 , 中国电信集团系统集成有限责任公司
Abstract: 本申请提供细粒度图像分类方法、系统及预测模型的训练方法,细粒度图像分类方法包括:重复如下步骤,直至更新后的第一层为神经网络的最后一层:接收神经网络的第一层的输出特征,作为可学习的非局部模块的输入特征;将非局部模块的输出特征作为神经网络的第一层的输入特征;用第二层更新第一层;并且,若更新后的第一层为神经网络的最后一层,则将神经网络的最后一层的输出特征输入分类网络中;将分类网络的输出特征作为预测结果并输出。本申请在神经网络的每两层之间插入一个可学习的非局部模块,使得每一层的神经元的感受野大小与物体部分大小匹配,可以更好的关联多层多尺度的特征,有效的提升细粒度图像分类中神经网络的性能。
-
-
-
-
-
-
-