Patent search ap:("西安交通大学") AND inv:"董怡卓" Page 1

1.

发明授权
一种基于分层可靠度变化趋势的音频分割方法失效

公开(公告)号：CN106297824B

公开(公告)日：2017-08-01

申请号：CN201610872916.5

申请日：2016-09-30

Applicant: 西安交通大学

Inventor： 杨新宇 , 王银瑞 , 丁建行 , 董怡卓 , 罗晶 , 杨泽正 , 王艺蒙 , 李雨墨

IPC: G10L25/45 , G10L25/27 , G10L21/0272

Abstract: 本发明公开了一种基于分层可靠度变化趋势的音频分割方法，具体步骤包括：1)定长分析窗内基于可靠度变化趋势的分层跳变点检测；2)基于定长分析窗内跳变点检测的音频分割。本发明采用定长分析窗来避免分窗检测导致的累积误差，在定长分析窗内根据可靠度变化趋势来检测声学跳变点以解决冗余点过多与硬判决的局限性问题，同时在定长分析窗内采用自顶向下的分层检测方式来避免跳变点漏检的情况，能够有效减少冗余分割点，提高综合性能。

2.

发明授权
一种基于条件随机场的中国民歌地域分类方法有权

公开(公告)号：CN110189768B

公开(公告)日：2021-02-02

申请号：CN201910395241.3

申请日：2019-05-13

Applicant: 西安交通大学

Inventor： 杨新宇 , 罗晶 , 丁建行 , 魏洁 , 董怡卓 , 张亦弛 , 夏小景 , 崔宇涵 , 吉姝蕾

IPC: G10L25/51

Abstract: 本发明公开了一种基于条件随机场的中国民歌地域分类方法。本发明提出考虑音乐的时序性，采用条件随机场对民歌的帧特征进行建模，其中结合受限玻尔兹曼机计算其标注序列，使用拟牛顿算法和k次对比散度方法对参数进行学习，最后进行音乐地域分类的实现。相比于传统的方法，本发明解决了特征序列时序关系缺失问题，同时采用受限玻尔兹曼机计算条件随机场标注序列，解决了以往研究计算标注序列的准确度“瓶颈”问题。此外，受限玻尔兹曼机对音频帧特征进行学习，得到音乐高级特征，增大了帧特征之间的差异，简化了手工音频特征设计的难度。本发明方法有效解决了民歌分类精度的问题，提高了民歌地域风格分类的结果。

3.

发明公开
一种融合听觉感知特征和视觉特征的中国民歌地域分类方法有权

公开(公告)号：CN110222227A

公开(公告)日：2019-09-10

申请号：CN201910394433.2

申请日：2019-05-13

Applicant: 西安交通大学

Inventor： 杨新宇 , 罗晶 , 王银瑞 , 董怡卓 , 魏洁 , 夏小景 , 张亦弛 , 吉姝蕾 , 崔宇涵

IPC: G06F16/683 , G06K9/46 , G06K9/62

Abstract: 本发明公开了一种融合听觉感知特征和视觉特征的中国民歌地域分类方法。本发明提出同时提取听觉感知特征和视觉特征用于中国民歌的地域分类，并且提出要充分考虑两种特征对于中国民歌地域分类的适用性，从而对它们做了改进。提取听觉感知特征时，充分考虑特征对音乐语义的清晰性表达与特征的时序结构，采用CHMM模型对每类民歌建模，然后计算每首民歌对应于各个CHMM的输出概率，进而将每首歌曲的听觉感知特征转化为新的特征向量。提取音频视觉特征时，采用彩色语谱图替代灰度图以捕捉更多的纹理信息，并且同时采用纹理模式特征与模式强度特征以更全面的表征纹理。实验表明，本发明不仅可以有效识别不同地域的民歌，而且优于现有的民歌地域识别方法。

4.

发明授权
一种基于双向卷积循环稀疏网络的音乐情感识别方法有权

公开(公告)号：CN110223712B

公开(公告)日：2021-04-20

申请号：CN201910485792.9

申请日：2019-06-05

Applicant: 西安交通大学

Inventor： 杨新宇 , 董怡卓 , 罗晶 , 张亦弛 , 魏洁 , 崔宇涵 , 夏小景 , 吉姝蕾

IPC: G10L25/30 , G10L25/63 , G10H1/00

Abstract: 本发明公开了一种基于双向卷积循环稀疏网络的音乐情感识别方法。本发明结合卷积神经网络和循环神经网络自适应地从原始音频信号的二维时频表示(即时频图)中学习内含时序信息的情感显著性特征。进一步地，本发明提出采用加权混合二进制表示法，通过将回归预测问题转化为多个二分类问题的加权联合来降低数值型真实数据的计算复杂度。实验结果表明，双向卷积循环稀疏网络提取的内含时序信息的情感显著性特征与MediaEval 2015中的最优特征相比表现出更优的预测性能；提出的模型与目前普遍的音乐情感识别网络结构和最优方法相比训练时间减少且预测精度提高。因此，本发明方法有效解决了音乐情感识别的精度和效率的问题，而且优于现有的识别方法。

5.

发明公开
一种基于双向卷积循环稀疏网络的音乐情感识别方法有权

公开(公告)号：CN110223712A

公开(公告)日：2019-09-10

申请号：CN201910485792.9

申请日：2019-06-05

Applicant: 西安交通大学

Inventor： 杨新宇 , 董怡卓 , 罗晶 , 张亦弛 , 魏洁 , 崔宇涵 , 夏小景 , 吉姝蕾

IPC: G10L25/30 , G10L25/63 , G10H1/00

Abstract: 本发明公开了一种基于双向卷积循环稀疏网络的音乐情感识别方法。本发明结合卷积神经网络和循环神经网络自适应地从原始音频信号的二维时频表示(即时频图)中学习内含时序信息的情感显著性特征。进一步地，本发明提出采用加权混合二进制表示法，通过将回归预测问题转化为多个二分类问题的加权联合来降低数值型真实数据的计算复杂度。实验结果表明，双向卷积循环稀疏网络提取的内含时序信息的情感显著性特征与MediaEval 2015中的最优特征相比表现出更优的预测性能；提出的模型与目前普遍的音乐情感识别网络结构和最优方法相比训练时间减少且预测精度提高。因此，本发明方法有效解决了音乐情感识别的精度和效率的问题，而且优于现有的识别方法。

6.

发明公开
一种基于分层可靠度变化趋势的音频分割方法失效

公开(公告)号：CN106297824A

公开(公告)日：2017-01-04

申请号：CN201610872916.5

申请日：2016-09-30

Applicant: 西安交通大学

Inventor： 杨新宇 , 王银瑞 , 丁建行 , 董怡卓 , 罗晶 , 杨泽正 , 王艺蒙 , 李雨墨

IPC: G10L25/45 , G10L25/27 , G10L21/0272

CPC classification number: G10L25/45 , G10L21/0272 , G10L25/27

Abstract: 本发明公开了一种基于分层可靠度变化趋势的音频分割方法，具体步骤包括：1)定长分析窗内基于可靠度变化趋势的分层跳变点检测；2)基于定长分析窗内跳变点检测的音频分割。本发明采用定长分析窗来避免分窗检测导致的累积误差，在定长分析窗内根据可靠度变化趋势来检测声学跳变点以解决冗余点过多与硬判决的局限性问题，同时在定长分析窗内采用自顶向下的分层检测方式来避免跳变点漏检的情况，能够有效减少冗余分割点，提高综合性能。

7.

发明授权
一种基于声纹和情感线索的抑郁症识别方法有权

公开(公告)号：CN113611295B

公开(公告)日：2024-07-16

申请号：CN202110874297.4

申请日：2021-07-30

Applicant: 西安交通大学

Inventor： 杨新宇 , 董怡卓 , 胡冠宇 , 张亦弛 , 许伯凡 , 魏洁

IPC: G10L15/16 , G10L15/04 , G10L15/06 , A61B5/16

Abstract: 本发明公开了一种基于声纹和情感线索的抑郁症识别方法，该方法利用预训练模型来提取有效的深度声纹识别和语音情感识别特征并进行融合，实现对说话人的声纹和情感差异信息的互补。考虑到目前抑郁症识别的数据量较小且识别结果具有代价敏感性，提出层次抑郁症识别模型。该模型在回归器之前设置多个分类器，对每个样本进行多分类器结果导向的抑郁等级预测，避免模型训练的过拟合问题。实验结果表明深度声纹识别和语音情感识别特征的融合能够显著提高模型的预测性能。与目前普遍的抑郁症识别网络结构和最优方法相比，层次抑郁症识别模型可以避免利用小样本训练模型的过拟合问题，提高预测准确率，同时抑郁症识别性能优于目前语音模态的最优方法。

8.

发明授权
一种融合听觉感知特征和视觉特征的中国民歌地域分类方法有权

公开(公告)号：CN110222227B

公开(公告)日：2021-03-23

申请号：CN201910394433.2

申请日：2019-05-13

Applicant: 西安交通大学

Inventor： 杨新宇 , 罗晶 , 王银瑞 , 董怡卓 , 魏洁 , 夏小景 , 张亦弛 , 吉姝蕾 , 崔宇涵

IPC: G06F16/683 , G06K9/46 , G06K9/62

Abstract: 本发明公开了一种融合听觉感知特征和视觉特征的中国民歌地域分类方法。本发明提出同时提取听觉感知特征和视觉特征用于中国民歌的地域分类，并且提出要充分考虑两种特征对于中国民歌地域分类的适用性，从而对它们做了改进。提取听觉感知特征时，充分考虑特征对音乐语义的清晰性表达与特征的时序结构，采用CHMM模型对每类民歌建模，然后计算每首民歌对应于各个CHMM的输出概率，进而将每首歌曲的听觉感知特征转化为新的特征向量。提取音频视觉特征时，采用彩色语谱图替代灰度图以捕捉更多的纹理信息，并且同时采用纹理模式特征与模式强度特征以更全面的表征纹理。实验表明，本发明不仅可以有效识别不同地域的民歌，而且优于现有的民歌地域识别方法。

9.

发明公开
一种基于声纹和情感线索的抑郁症识别方法有权

公开(公告)号：CN113611295A

公开(公告)日：2021-11-05

申请号：CN202110874297.4

申请日：2021-07-30

Applicant: 西安交通大学

Inventor： 杨新宇 , 董怡卓 , 胡冠宇 , 张亦弛 , 许伯凡 , 魏洁

IPC: G10L15/16 , G10L15/04 , G10L15/06 , A61B5/16

Abstract: 本发明公开了一种基于声纹和情感线索的抑郁症识别方法，该方法利用预训练模型来提取有效的深度声纹识别和语音情感识别特征并进行融合，实现对说话人的声纹和情感差异信息的互补。考虑到目前抑郁症识别的数据量较小且识别结果具有代价敏感性，提出层次抑郁症识别模型。该模型在回归器之前设置多个分类器，对每个样本进行多分类器结果导向的抑郁等级预测，避免模型训练的过拟合问题。实验结果表明深度声纹识别和语音情感识别特征的融合能够显著提高模型的预测性能。与目前普遍的抑郁症识别网络结构和最优方法相比，层次抑郁症识别模型可以避免利用小样本训练模型的过拟合问题，提高预测准确率，同时抑郁症识别性能优于目前语音模态的最优方法。

10.

发明公开
一种基于条件随机场的中国民歌地域分类方法有权

公开(公告)号：CN110189768A

公开(公告)日：2019-08-30

申请号：CN201910395241.3

申请日：2019-05-13

Applicant: 西安交通大学

Inventor： 杨新宇 , 罗晶 , 丁建行 , 魏洁 , 董怡卓 , 张亦弛 , 夏小景 , 崔宇涵 , 吉姝蕾

IPC: G10L25/51

Abstract: 本发明公开了一种基于条件随机场的中国民歌地域分类方法。本发明提出考虑音乐的时序性，采用条件随机场对民歌的帧特征进行建模，其中结合受限玻尔兹曼机计算其标注序列，使用拟牛顿算法和k次对比散度方法对参数进行学习，最后进行音乐地域分类的实现。相比于传统的方法，本发明解决了特征序列时序关系缺失问题，同时采用受限玻尔兹曼机计算条件随机场标注序列，解决了以往研究计算标注序列的准确度“瓶颈”问题。此外，受限玻尔兹曼机对音频帧特征进行学习，得到音乐高级特征，增大了帧特征之间的差异，简化了手工音频特征设计的难度。本发明方法有效解决了民歌分类精度的问题，提高了民歌地域风格分类的结果。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification