-
公开(公告)号:CN108111439B
公开(公告)日:2022-03-08
申请号:CN201711068382.1
申请日:2017-11-02
申请人: 中国传媒大学
IPC分类号: H04L25/02
摘要: 本发明涉及双向多输入多输出(MIMO)中继系统中一种非迭代的信道估计方法。针对双向MIMO中继系统,主要解决现有信道估计方法中,中继节点负担过大以及信道估计精度较低的问题。其实现步骤为:1)建立矩阵形式的双向MIMO中继信道模型;2)两个用户同时发送正交信道训练序列至中继;3)中继采用所设计的放大因子放大接收的信号,并将放大后的信号转发至用户;4)每个用户对接收的信号进行重排,构造两个具有Khatri‑Rao乘积结构的矩阵。5)根据所构造矩阵的特殊结构,设计低复杂的算法估计出系统所有的信道状态信息。本发明对信道估计具有速度快和精度高的优点,而且对于时分系统和频分系统都能适用。
-
公开(公告)号:CN116628262A
公开(公告)日:2023-08-22
申请号:CN202310618967.5
申请日:2023-05-30
申请人: 中国传媒大学
IPC分类号: G06F16/783 , G06N5/02 , G06N3/0464 , G06N3/08 , G06F16/36 , G06F16/903 , G06F40/289 , G06N3/042
摘要: 本发明公开了一种基于知识增强的视频‑文本检索方法,通过对视频‑文本深度学习预训练模型即CLIP模型对视频‑文本进行编码,将图文关联知识迁移,以便获取良好的视频‑文本表征。通过引入域外常识性知识图谱Conceptnet对视频‑文本编码进行知识增强,首先经过图卷积神经网络获取知识图谱的图嵌入向量,再使用Cross‑attention模块对文本编码进行知识增强;知识增强后的文本编码通过Xpool操作辅助视频帧的时间特征汇聚,并增强视频全局表征;经过知识增强的视频‑文本表征进行对比学习,提升视频‑文本检索性能;经过多组实验证明,本发明显著提高了视频‑文本检索的召回率。
-
公开(公告)号:CN108111439A
公开(公告)日:2018-06-01
申请号:CN201711068382.1
申请日:2017-11-02
申请人: 中国传媒大学
IPC分类号: H04L25/02
CPC分类号: H04L25/0204 , H04L25/024
摘要: 本发明涉及双向多输入多输出(MIMO)中继系统中一种非迭代的信道估计方法。针对双向MIMO中继系统,主要解决现有信道估计方法中,中继节点负担过大以及信道估计精度较低的问题。其实现步骤为:1)建立矩阵形式的双向MIMO中继信道模型;2)两个用户同时发送正交信道训练序列至中继;3)中继采用所设计的放大因子放大接收的信号,并将放大后的信号转发至用户;4)每个用户对接收的信号进行重排,构造两个具有Khatri‑Rao乘积结构的矩阵。5)根据所构造矩阵的特殊结构,设计低复杂的算法估计出系统所有的信道状态信息。本发明对信道估计具有速度快和精度高的优点,而且对于时分系统和频分系统都能适用。
-
公开(公告)号:CN117095659B
公开(公告)日:2024-01-05
申请号:CN202311349311.4
申请日:2023-10-18
申请人: 中国传媒大学
IPC分类号: G10H1/00 , G10L25/63 , G10L25/30 , G10L25/03 , G10L25/09 , G10L25/18 , G10L25/24 , G06F18/2415 , G06F18/25 , G06N3/045 , G06N3/084 , G06N3/0985 , G06F123/02
摘要: 本发明公开了一种双模态歌曲情感分类方法,获取歌曲音乐文件后进行切割,提取得到音乐曲调特征向量以及进行编码获得文本特征向量。将音乐曲调特征向量、文本特征向量与位置编码加和得到音乐曲调特征向量与曲调片段的位置融合编码、文本特征向量与歌词片段的位置融合编码。基于自注意机制训练获得自注意模型,基于编码融合对自注意模型进行两段式训练;将得到的最终歌曲特征向量经过全连接神经网络层映射为每种歌曲情感得到的分数,激活函数层将分数进行归一化,转化为概率分布,概率分布中概率最大的类别即为歌曲情感的类别。本方法结合两种模态特征进行分析,并改进自注意模型实现双模态的情感分析,能够显著提高歌曲
-
公开(公告)号:CN110719459A
公开(公告)日:2020-01-21
申请号:CN201910999039.1
申请日:2019-10-21
申请人: 中国传媒大学
IPC分类号: H04N17/00
摘要: 本发明涉及VR眼镜中小型显示器分辨力测量领域,特别涉及在VR眼镜或头盔式眼镜的显示器中固有分辨力和360度VR模式下VR视频的重现分辨力的测试图。用于测量固有分辨力的测试图水平方向上分布着特定水平、垂直分辨力数值的条纹,这些分辨力数值是当前手机显示器、VR眼镜采用的主要分辨力。用于测量重现分辨力共有三行相同的条纹分布,分别是对应全景图垂直位置的3/4、1/2、1/4处,对应球面纬度的3/4π、π/2、π/4位置。不同水平垂直分辨力的黑白条纹的灰度变化与空间位置的关系呈正弦函数关系。本发明成本低,操作简单,测量效果直观。
-
公开(公告)号:CN117095659A
公开(公告)日:2023-11-21
申请号:CN202311349311.4
申请日:2023-10-18
申请人: 中国传媒大学
IPC分类号: G10H1/00 , G10L25/63 , G10L25/30 , G10L25/03 , G10L25/09 , G10L25/18 , G10L25/24 , G06F18/2415 , G06F18/25 , G06N3/045 , G06N3/084 , G06N3/0985 , G06F123/02
摘要: 本发明公开了一种双模态歌曲情感分类方法,获取歌曲音乐文件后进行切割,提取得到音乐曲调特征向量以及进行编码获得文本特征向量。将音乐曲调特征向量、文本特征向量与位置编码加和得到音乐曲调特征向量与曲调片段的位置融合编码、文本特征向量与歌词片段的位置融合编码。基于自注意机制训练获得自注意模型,基于编码融合对自注意模型进行两段式训练;将得到的最终歌曲特征向量经过全连接神经网络层映射为每种歌曲情感得到的分数,激活函数层将分数进行归一化,转化为概率分布,概率分布中概率最大的类别即为歌曲情感的类别。本方法结合两种模态特征进行分析,并改进自注意模型实现双模态的情感分析,能够显著提高歌曲情感分类的准确率。
-
公开(公告)号:CN110719459B
公开(公告)日:2021-06-04
申请号:CN201910999039.1
申请日:2019-10-21
申请人: 中国传媒大学
IPC分类号: H04N17/00
摘要: 本发明涉及VR眼镜中小型显示器分辨力测量领域,特别涉及在VR眼镜或头盔式眼镜的显示器中固有分辨力和360度VR模式下VR视频的重现分辨力的测试图。用于测量固有分辨力的测试图水平方向上分布着特定水平、垂直分辨力数值的条纹,这些分辨力数值是当前手机显示器、VR眼镜采用的主要分辨力。用于测量重现分辨力共有三行相同的条纹分布,分别是对应全景图垂直位置的3/4、1/2、1/4处,对应球面纬度的3/4π、π/2、π/4位置。不同水平垂直分辨力的黑白条纹的灰度变化与空间位置的关系呈正弦函数关系。本发明成本低,操作简单,测量效果直观。
-
公开(公告)号:CN114548293A
公开(公告)日:2022-05-27
申请号:CN202210174138.8
申请日:2022-02-24
申请人: 中国传媒大学
摘要: 本发明公开了基于跨粒度自蒸馏的视频‑文本跨模态检索方法。该方法旨在通过细粒度交互相似度提供伪标签,解决跨模态对比学习中二元标签不够平滑,不符合真实情况的问题。该方法首先设计了一个筛选模块,为各模态筛选一部分关键tokens,用于计算token级细粒度相似度。接着以此细粒度相似度作为软标签,结合对比损失,联合优化各模态编码器。本方法在训练阶段时引入跨粒度自蒸馏来改善对比学习标签的天然缺陷,但在检索时并不会有额外的计算消耗,因此是一种高效的方法。
-
-
-
-
-
-
-