-
公开(公告)号:CN117036191A
公开(公告)日:2023-11-10
申请号:CN202310945884.7
申请日:2023-07-31
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种基于swin transformer和小波变换的SAR图像去噪方法,其实现步骤为:对生成的含噪样本集中的每个样本进行尺度为1的小波分解,得到每个样本的4个子带图片,训练构建的Swin Transformer网络,对SAR图像进行去噪。本发明利用小波变换后的样本训练构建的swin transformer的SAR图像去噪网络,利用小波变换的多尺度分析特性在不同尺度上对信号进行局部分析,使得滤除高频噪声成分的同时保留了原始图像的边缘纹理信息;利用swin transformer的局部窗口连接策略,增强了图像信息特征的同时降低了模型的参数量,减少了生成降噪后图像的时间。
-
公开(公告)号:CN116228824A
公开(公告)日:2023-06-06
申请号:CN202310030561.5
申请日:2023-01-09
Applicant: 西安电子科技大学
IPC: G06T7/33 , G06N3/08 , G06N3/0464
Abstract: 本发明涉及一种图像配准方法,涉及计算机视觉领域,该方法可在不进行网络级联和多次插值的情况下,有效提升大位移下的图像配准精度。方法步骤包括:将固定图像和浮动图像拼接后,输入训练好的图像配准网络,利用图像配准网络学习浮动图像和固定图像的差异,输出配准图像;所述图像配准网络包括骨干网络,多卷积融合模块和空间变换层;其中:骨干网络,基于拼接的固定图像和浮动图像得到第一位移场,并基于第一位移场对浮动图像进行插值得到第一特征图;多卷积融合模块,基于第一特征图提取多尺度的位置信息并融合,得到第二位移场,再将第一位移场和第二位移场相加得到第三位移场;空间变换层,基于第三位移场对浮动图像做空间变换生成配准图像。
-
公开(公告)号:CN114973062A
公开(公告)日:2022-08-30
申请号:CN202210442390.2
申请日:2022-04-25
Applicant: 西安电子科技大学
IPC: G06V20/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于Transformer的多模态情感分析方法,其实现步骤为:获取训练样本集、验证样本集和测试样本集;构建多基于Transformer的多模态情感分析模型;对多模态情感分析模型进行迭代训练;获得多模态情感分析结果。本发明采用Bert和ViT预训练模型对文本和视觉模态的数据进行特征提取,基于t的多头注意力模块使视觉和音频数据更专注与文本相关的信息,跨模态Transformer模块和单模态标签预测模块使融合特征表示具有统一性和差异性信息,避免了现有技术中因为忽略不同模态对情感分析贡献度不同、单模态缺少长期依赖,导致情感分析准确度较低的技术问题,有效地提高了多模态情感分析的准确度。
-
公开(公告)号:CN114943921A
公开(公告)日:2022-08-26
申请号:CN202210610447.5
申请日:2022-05-31
Applicant: 西安电子科技大学
Abstract: 本发明提出了一种融合多粒度视频语义信息的视频文本描述方法,主要解决现有技术中视频语义信息不全、语义信息融合不充分和当多种语义信息存在时的信息冗余的问题。其实现方案为:1)建立数据集,并利用三种神经网络预训练模型分别提取其视频样本三层级的空间时序特征;2)搭建融合多粒度视频语义信息的视频文本描述网络,并构建其损失函数;3)对融合多粒度视频语义信息的视频文本描述网络进行训练;4)将待描述视频输入到训练好的网络中生成视频的文本描述。本发明增加了提取的视频特征种类,充分融合特征,选择合适融合特征生成文本,不仅能有效表示视频信息,而且减少了信息冗余程度,可用于生成准确性高且流畅的描述视频内容文本。
-
公开(公告)号:CN113806580A
公开(公告)日:2021-12-17
申请号:CN202111140203.7
申请日:2021-09-28
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种基于层次语义结构的跨模态哈希检索方法,其步骤为:(1)建立数据集;(2)构建图像和文本特征提取网络;(3)利用层次语义结构生成损失函数;(4)训练图像和文本特征提取网络;(5)用户用图像检索文本;(6)用户用文本检索图像。本发明通过将图像文本对标签中每层的所有类别的类哈希码扩展为对应层次的层次语义结构,将各层的层次语义结构融合到哈希码中,使得图像文本对的哈希码很大程度地保留了标签的同层与层间的关联信息,解决了现有跨模态哈希检索方法忽略层间关系导致标签信息不全面的问题和将标签信息融合到图像特征和文本特征中导致哈希码损失了部分语义信息的问题。
-
公开(公告)号:CN113704546A
公开(公告)日:2021-11-26
申请号:CN202110968279.2
申请日:2021-08-23
Applicant: 西安电子科技大学
Abstract: 一种基于空间时序特征的视频文本检索方法,利用三种不同类型的神经网络对视频的空间时序语义信息进行了层次化细粒度全面的视频统一表征,构建视频文本公共语义嵌入网络拟合跨模态数据的语义鸿沟并利用对比排序损失函数训练网络。本发明可用于视频自然语言文本相互检索,分层的特征提取方法充分挖掘了视频模态数据更具判别性的复杂时空语义信息,视频文本公共语义嵌入网络有效地学习不同模态异构数据语义特征同分布的公共空间特征表示,公共空间特征表示准确衡量了视频和自然语言文本高阶特征间的语义关联,提高了视频自然语言文本检索的精度。
-
公开(公告)号:CN113011357A
公开(公告)日:2021-06-22
申请号:CN202110325432.X
申请日:2021-03-26
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种基于时空融合的深度伪造人脸视频定位方法,其步骤为:(1)构建卷积神经网络;(2)构建融合时域和空间域特征的分类网络;(3)构建分割定位任务网络;(4)构建重建任务网络;(5)构建多任务融合网络;(6)生成多任务融合损失函数;(7)生成训练集;(8)训练多任务融合网络;(9)对深度伪造人脸视频进行识别定位。本发明构建融合时域和空间域特征的分类网络提取特征,可以提取到更完整的帧内和帧间特征,获得更高的准确率,同时,本发明构建用于训练多任务融合网络的多任务融合损失函数,解决了未见攻击类别和任务单一化导致的影响泛化能力和功能完善性的问题。
-
公开(公告)号:CN111538560A
公开(公告)日:2020-08-14
申请号:CN202010159013.9
申请日:2020-03-09
Applicant: 西安电子科技大学
IPC: G06F9/455
Abstract: 本发明公开了一种虚拟机部署方法、装置、电子设备及其存储介质,该虚拟机部署方法,包括:获取虚拟机的性能数据、N台物理机的能耗数据,N为大于0的整数;根据虚拟机的性能数据构建虚拟机的分段线性性能模型;根据每台物理机的能耗数据构建每台物理机的非线性能耗模型;根据虚拟机的分段线性性能模型、每台物理机的非线性能耗模型构建每台物理机的效能比模型;根据每台物理机效能比模型将虚拟机部署在N台物理机中目标物理机上。本发明提供的虚拟机部署方法,同时考虑了物理机的能耗和虚拟机的性能,从而减少了物理机的能耗,保障了虚拟机的性能,提高了用户体验感。
-
公开(公告)号:CN109766481A
公开(公告)日:2019-05-17
申请号:CN201910025025.X
申请日:2019-01-11
Applicant: 西安电子科技大学
IPC: G06F16/903
Abstract: 本发明公开了一种基于协同矩阵分解的在线哈希跨模态信息检索方法,其步骤为:(1)生成初始训练集;(2)在线训练哈希跨模态信息检索模型;(3)判断信息检索系统实施获取新样本个数是否大于等于100;(4)计算待检索样本的哈希编码;(5)得到检索结果。本发明采用矩阵分解的思想构建信息损失函数,能够对于实时获取的无类标信息在线建立模型,并根据获取到的数据在线更新模型,在模型训练的过程中,信息检索系统只需存储前一轮的优化结果,降低了系统存储压力,提高了计算速度,具有广泛的适应性。
-
公开(公告)号:CN104506661B
公开(公告)日:2018-09-04
申请号:CN201510018318.7
申请日:2015-01-14
Applicant: 西安电子科技大学
IPC: H04L29/08
Abstract: 本发明公开了一种远程配置的基于使用场景的手机功耗自动化产生方法,通过Web端设置自动化场景的测试流程;Web端自动化场景服务器生成测试流程配置脚本并保存在服务器硬盘上,手机端测试程序通过网络获取服务器端的配置脚本并执行;手机端接收到配置脚本后,按照json格式解析配置脚本,并按照测试项在配置文件中出现的先后顺序依次执行,在执行过程中使用json格式中的配置参数信息。本发明通过Web端远程配置场景的测试时间、测试参数、测试流程,生成测试流程配置脚本,手机端远程获取配置脚本后,自动执行实现手机功耗自动化产生;无需人工干预,实现了任意多台手机设备并行测试,提高了手机特定场景的功耗产生的效率以及功耗测试的精度和一致性。
-
-
-
-
-
-
-
-
-