-
公开(公告)号:CN116109960A
公开(公告)日:2023-05-12
申请号:CN202210804157.4
申请日:2022-07-07
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种基于预训练模型的视频文本检索方法,主要解决现有方法中数据特征异质性及冗余级联造成视频文本匹配精度低的问题;方案包括:1)获取视频数据集的帧序列及文本标注切分产生的文本序列;2)采用图文预训练模型协同提取视频和文本的特征;3)将视频以块级联形式映射,同时将协同提取应用到视频的聚合阶段,以文本表征指导聚合视频帧级特征;4)加入交叉方向上的先验概率并使用分散约束损失,完成模型训练;5)利用训练好的视频文本匹配模型得到最终检索结果。本发明能够有效减少不同模态之间的语义鸿沟,充分挖掘视频模态数据中的复杂时空信息,提升跨模态检索精度。
-
公开(公告)号:CN114764564A
公开(公告)日:2022-07-19
申请号:CN202210465093.X
申请日:2022-04-25
Applicant: 西安电子科技大学
IPC: G06F40/284 , G06F40/253 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于融合语言学知识的方面级情感极性分类方法,包括下述步骤:(1)建立训练样本集和测试样本集;(2)搭建基于融合语言学知识的方面级情感分类模型;(3)对方面级情感极性分类模型进行迭代训练;(4)获取方面级情感极性分类结果。本发明构建了基于融合语言学知识的方面级情感极性分类网络,利用现有的SOTA模型分析并提取评论数据中所特有的语言学知识,搭建基于图神经网络和注意力机制的语言学知识融合网络,将评论数据中所蕴涵的语言学知识融入到最终的单词表示中,提高了方面级情感极性分类的准确率。
-
公开(公告)号:CN113791879A
公开(公告)日:2021-12-14
申请号:CN202110902966.4
申请日:2021-08-06
Applicant: 西安电子科技大学
IPC: G06F9/48
Abstract: 本发明公开了一种云平台的任务调度方法、装置、设备和计算机存储介质,获取多个初始调度方案。确定初始调度方案的适应度值;根据所有初始调度方案的适应度值和所有初始调度方案的适应度值的平均值,确定每个初始调度方案的类型;分别根据每个初始调度方案的类型,进行烟花爆炸操作,得到爆炸后的调度方案;根据所有爆炸后的调度方案,确定下一代初始调度方案;将初始调度方案更新为下一代初始调度方案,返回执行针对每个初始调度方案,分别根据每个物理机执行初始调度方案的时长,确定初始调度方案的适应度值,直到满足迭代停止条件,确定目标调度方案为适应度值最小的下一代初始调度方案。云平台能耗低,提高资源的利用率,提高用户体验。
-
公开(公告)号:CN113590867A
公开(公告)日:2021-11-02
申请号:CN202110893943.1
申请日:2021-08-05
Applicant: 西安电子科技大学
IPC: G06F16/583 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于分层度量学习的跨模态信息检索方法,其实现步骤为:(1)建立训练集;(2)构建分层度量学习网络;(3)训练分层度量学习网络;(4)利用图像检索文本;(5)利用文本检索图像。本发明构建了与标签层数相等的多个分层度量学习子网络组成分层度量学习网络,采用了特征嵌入模块对图像样本和文本样本进行实值特征表示学习,使得最终分层度量学习网络学习到的特征能包含层次标签的所有标签信息,学习到的图像特征和文本特征具有更高的数值精度,提高了跨模态信息检索的精度,增强了跨模态信息检索过程中数据特征结构的稳定性。
-
公开(公告)号:CN108268887A
公开(公告)日:2018-07-10
申请号:CN201711345175.6
申请日:2017-12-15
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种基于虚拟驾驶与EEG检测的驾驶人安全意识评估方法,主要解决现有技术缺少对驾驶人安全意识综合评估的问题。其实现方案是:使用商用unity3D软件构建动态虚拟场景,并且用头盔进行调试预览;然后,在虚拟场景中通过驾驶模拟器采集驾驶人的操作数据、车辆状态数据和脑电信号并判定驾驶人格;按照所设计的调查问卷计算驾驶操作在某一场景中的评分权重;通过类神经网络模型对驾驶人进行安全意识综合评分。本发明可展示驾驶人的个人安全意识水平,以及个人相较于平均水平的安全意识水平,对处于平均水平之下的驾驶群体,给出暂时不适合单独上路的建议,可用于虚拟驾驶环境下驾驶人的驾驶操作与脑电信号状态的分析实验。
-
公开(公告)号:CN106534610A
公开(公告)日:2017-03-22
申请号:CN201611111565.2
申请日:2016-12-06
Applicant: 西安电子科技大学
IPC: H04N1/405
CPC classification number: H04N1/4052
Abstract: 本发明公开了一种基于FPGA的改进彩色矢量误差扩散方法,所述基于FPGA的改进彩色矢量误差扩散方法通过RGB三个通道实现误差扩散的并行处理,并采用矩阵增益模型使单通道的误差扩散值可以扩散到其他两个通道;通过硬件实现半色调过程及误差值生成,使用增益矩阵预存储器替代算法中的乘法运算;对每个通道,采用流水线的方式处理,使误差扩散的流程平均在一个时钟周期内可以计算出一个像素点的半色调结果。FPGA为运行平台,通过对半色调算法的彩色矢量误差扩散算法的改进,实现算法在嵌入式平台上的快速高效执行。实现了彩色矢量误差扩散不同通道之间的并行处理。将基色之间并行处理,提高处理效率。
-
公开(公告)号:CN104331933B
公开(公告)日:2017-03-15
申请号:CN201410566821.1
申请日:2014-10-22
Applicant: 西安电子科技大学
IPC: G06T17/30
Abstract: 本发明公开了一种分层方向自适应快速选取方法,将三维模型三角网格化得到三角形面片后求出面积加权法向量;然后对面积加权法向量进行主成分分析,构造协方差矩阵并进行奇异值分解,得出三个特征向量作为候选分层方向;其后,在候选分层方向下对模型进行分层,并计算分层后构建模型和原始模型的总体积误差,最小总体积误差所对应的候选分层方向即为最优分层方向。本发明通过提取特征向量获得三个垂直正交的候选分层方向,并基于最小体积误差选择最优分层方向,无需将模型表面所有法向量或空间法向量的采样作为候选分层方向,提高模型精度的同时减少了算法复杂度,能够大大降低获得最优分层方向的时间,适用于几何特征或拓扑结构复杂的模型。
-
公开(公告)号:CN106383579A
公开(公告)日:2017-02-08
申请号:CN201610824475.1
申请日:2016-09-14
Applicant: 西安电子科技大学
IPC: G06F3/01
CPC classification number: G06F3/015 , G06F3/014 , G06F3/017 , G06F2203/011
Abstract: 本发明公开了一种基于EMG和FSR的精细手势识别系统及方法,设置有手套和MYO臂环;MYO臂环内置肌电信号传感器;手套固定有FSR传感器;数据采集系统包括对肌电传感器的采集和对FSR传感器的采集;采集的肌电信号通过蓝牙发送至计算机,采集的压力信号通过串口发送至计算机。本发明将肌电信号和压力信号结合,完成对21种自定义精细手势动作的识别,克服了单一信号自身的限制;将FSR传感器固定在手套里,做成可穿戴设备,和MYO臂环结合起来,形成可穿戴设备,操作简单,使得人机交互更加自然和人性化,并且克服了自然环境限制;FSR传感器放置在手背上,采集手指运动时的手背压力分布,对手指的运动检测有较好的识别率。
-
公开(公告)号:CN102930497A
公开(公告)日:2013-02-13
申请号:CN201210434246.0
申请日:2012-10-19
Applicant: 西安电子科技大学
IPC: G06T1/00
Abstract: 本发明公开了一种基于像素块奇偶校验和块误差分散的半调水印方法,具体步骤包括:(1)图像分色处理;(2)水印图像预处理;(3)计算像素块的奇偶校验值;(4)确定水印嵌入强度;(5)嵌入水印;(6)图像矫正;(7)水印提取。本发明解决了现有技术中在提取水印时要求将扫描后的待检测图像二值化,水印的鲁棒性差,难以真正抵抗打印扫描攻击的问题。本发明具有良好的鲁棒性、能够有效的抵抗打印扫描、随机涂改和裁剪等攻击、容易提取水印的优点。
-
公开(公告)号:CN114943921B
公开(公告)日:2025-04-08
申请号:CN202210610447.5
申请日:2022-05-31
Applicant: 西安电子科技大学
IPC: G06V20/40 , G06V10/77 , G06V10/774 , G06V10/80 , G06V10/82 , G06F40/30 , G06N3/0442 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明提出了一种融合多粒度视频语义信息的视频文本描述方法,主要解决现有技术中视频语义信息不全、语义信息融合不充分和当多种语义信息存在时的信息冗余的问题。其实现方案为:1)建立数据集,并利用三种神经网络预训练模型分别提取其视频样本三层级的空间时序特征;2)搭建融合多粒度视频语义信息的视频文本描述网络,并构建其损失函数;3)对融合多粒度视频语义信息的视频文本描述网络进行训练;4)将待描述视频输入到训练好的网络中生成视频的文本描述。本发明增加了提取的视频特征种类,充分融合特征,选择合适融合特征生成文本,不仅能有效表示视频信息,而且减少了信息冗余程度,可用于生成准确性高且流畅的描述视频内容文本。
-
-
-
-
-
-
-
-
-