-
公开(公告)号:CN101763288A
公开(公告)日:2010-06-30
申请号:CN201010022085.5
申请日:2010-01-19
Applicant: 湖南大学
Inventor: 李仁发 , 陈宇 , 徐成 , 吴强 , 刘彦 , 朱海 , 袁虎 , 钟俊 , 刘滔 , 邝继顺 , 李蕊 , 李肯立 , 罗娟 , 赵欢 , 杨科华 , 任小西 , 杨书凡 , 彭日光 , 李春江 , 黄瑜臣 , 张维 , 李浪
IPC: G06F9/50
Abstract: 本发明提供了一种考虑硬件预配置因素的动态软硬件划分方法,其特征在于,在程序运行过程中,进行动态的软硬件划分,在可重构硬件资源上进行一个或多个函数的配置,对待划分函数维护一个待划分函数列表list(f1,…,fm),其中fk为定义硬件加速比,k为待划分的一个函数;k=1,…,m,m为待划分函数个数,基于硬件加速比对函数配置,并且考虑到硬件预配置因素。本发明基于硬件加速比对函数进行动态软硬件配置,充分利用了系统的硬件资源,从而显著提高整个系统的任务处理效率。
-
公开(公告)号:CN101155089A
公开(公告)日:2008-04-02
申请号:CN200610032349.9
申请日:2006-09-29
Applicant: 湖南大学
Abstract: 一种无线多媒体实时学习系统与方法,涉及基于无线网络的实时嵌入式流媒体技术。系统由主控服务器、流媒体服务器、无线网络AP接入点和移动学习终端组成,两服务器通过有线以太网互连,移动学习终端通过无线网络与上述两个服务器互连;主控服务器管理用户登录验证、系统交互控制;流媒体服务器维护教学资源与数据,并采集数据,制作实时流媒体数据发布;无线网络AP接入点提供移动学习终端与上述服务器的通信功能;移动学习终端为手持嵌入式设备,通过无线网络与服务器互连,进行流媒体交互。本发明具有操作界面简单、成本低、部署方便、容量大、接口丰富、适于多种应用的特点,并进行个性化学习。系统可用于高校教学、企业培训、咨询等领域。
-
公开(公告)号:CN116894995A
公开(公告)日:2023-10-17
申请号:CN202310779352.0
申请日:2023-06-28
Applicant: 湖南大学
IPC: G06V10/774 , G06V10/20 , G06V10/40 , G06V10/82 , G06N3/0455 , G06N3/082 , G06N3/0495
Abstract: 本发明公开一种用于图像掩码预训练的知识蒸馏方法及装置,该方法步骤包括:S01.获取待学习图像数据样本集均匀不重叠切割成图片块,并抽取出指定比例作为可见块;S02.将可见块输入至学生模型,生成可见块的低级语义表示和整个图像的高级语义表示;S03.根据高级语义表示生成第一图像标记,与第一老师模型生成的第二图像标记计算高级语义表示损失;S04.第二老师模型生成可见块的低级语义表示,与学生模型生成的低级语义表示计算低级语义表示损失;S05.根据低级语义表示损失以及高级语义表示损失,建立图像掩码知识蒸馏的目标函数。本发明具有实现方法简单、计算量与延时小、能够同时学习低级与高级语义表示等优点。
-
公开(公告)号:CN116230019A
公开(公告)日:2023-06-06
申请号:CN202211472628.2
申请日:2022-11-17
Applicant: 湖南大学
Abstract: 本发明涉及一种基于半监督语音情感识别框架的深度情感聚类方法,属于语音情感识别技术领域,对输入的语料库中的音频进行预处理;使用Attn‑Convolution网络对预处理后的语音数据在空间上进行特征提取;使用BiGRU网络对预处理后的语音数据在时间上进行特征提取;将提取出的语音特征使用ADD函数进行特征融合;在聚类分类器模块中对未标记的数据集进行伪标签分配;在情感回归器中对每个句子i的语音片段sij进行回归预测;使用新的CCC‑CE联合损失作为回归器与分类器模型的损失函数。有益效果在于,使用较少未标记数据的模型框架比现有的半监督框架实现了更好的语音表示,并且在下游任务中优于最先进的方法。
-
公开(公告)号:CN104036779A
公开(公告)日:2014-09-10
申请号:CN201410285216.7
申请日:2014-06-24
Applicant: 湖南大学
Abstract: 本发明公开了一种用于移动平台的无线语音控制方法及系统,该方法包括:建立移动控制端与移动平台之间的无线通信连接;移动控制端采集语音信号,对采集到的所述语音信号进行语音识别得到识别文本;移动控制端对所述识别文本进行语义解析并形成可执行命令;移动控制端将所述可执行命令发送至移动平台,移动平台接收并执行命令。本发明克服了传统可移动装置手动控制方式造成的不便,操作简单,很好的诠释了人机一体化的设计思想,同时高效准确,大大提高了语音识别效率和识别精度。
-
公开(公告)号:CN103489443A
公开(公告)日:2014-01-01
申请号:CN201310423715.3
申请日:2013-09-17
Applicant: 湖南大学
Abstract: 本发明公开了一种声音模仿方法及装置,方法步骤包括获取语音信号及模仿对象,将语音信号预处理,将语音信号的每一个语音帧根据模仿对象进行音调转换及音色转换、重新合成得到合成语音帧,将所述合成语音帧添加至模仿语音帧,最终将由所述模仿语音帧构成的模仿语音输出。声音模仿装置包括输入模块、音调转换模块、音色转换模块、语音帧合成模块、模仿语音帧添加模块、判断处理模块和模仿语音输出输出模块。本发明具有声音模拟效果好、声音模仿相似度较高、能够实现音料库自动扩展的优点。
-
公开(公告)号:CN103440864A
公开(公告)日:2013-12-11
申请号:CN201310329295.2
申请日:2013-07-31
Applicant: 湖南大学
Abstract: 本发明公开了一种基于语音的人格特征预测方法,其实施步骤如下:针对多个参考测定人进行人格评估测定得到多项人格特征因素评分值;采集参考测定人的语音片段并提取多项声学韵律特征,提取多项统计特征值;建立语音人格预测机器学习模型,将每一个参考测定人的多项人格特征因素评分值及统计特征值分别输入语音人格预测机器学习模型进行训练;采集测定人的语音片段,提取声学韵律特征和统计特征,输入语音人格预测机器学习模型得到各项声学韵律特征对应的多项人格特征因素评分值,将每一项特征的所有人格特征因素评分值加权求和得到测定人的多项人格特征因素评分值并输出。本发明具有预测素材采集简便、预测过程快捷、效果客观准确的优点。
-
公开(公告)号:CN101763265A
公开(公告)日:2010-06-30
申请号:CN201010022084.0
申请日:2010-01-19
Applicant: 湖南大学
Inventor: 李仁发 , 陈宇 , 徐成 , 吴强 , 刘彦 , 朱海 , 袁虎 , 钟俊 , 刘滔 , 邝继顺 , 李蕊 , 李肯立 , 罗娟 , 赵欢 , 杨科华 , 任小西 , 杨书凡 , 彭日光 , 李春江 , 黄瑜臣 , 张维 , 李浪
IPC: G06F9/44
Abstract: 本发明提供了一种过程级软硬件协同设计自动化开发方法,其特征在于,包括以下步骤:步骤1:利用高级语言完成系统功能描述,系统功能描述中包括软硬件协同函数的调用;步骤2:软硬件函数的动态划分;步骤3:链接和执行步骤;步骤4:判断和结束步骤;判断是否所有的函数执行完毕,如果执行完毕就结束,否则返回用于划分的参数到步骤2进入下一次循环。本发明使用过程级软硬件统一编程模型,来屏蔽底层硬件实现的差异,达到可重构器件对程序用户透明的目的。该编程模型将硬件加速器封装成C语言函数,方便用户编程,且支持运行时的动态软硬件划分,使划分对程序员透明,提高了可重构资源的利用率。
-
公开(公告)号:CN118522311A
公开(公告)日:2024-08-20
申请号:CN202410731976.X
申请日:2024-06-06
Applicant: 湖南大学
Abstract: 本发明公开了一种基于动态窗口紧凑卷积transformer的跨语料库语音情感识别方法,包括:获取语音信号的频谱特征图后进行卷积计算得到频谱特征,对频谱特征进行位置嵌入后将具有位置信息的频谱特征输入到transformer编码器层进行自注意力学习获得初始情感特征和权重矩阵,对权重矩阵进行重要性计算得到重要性特征,将初始情感特征和重要性特征一起输入到动态窗口transformer中将样本动态分割并计算全局上下文情感特征;将全局上下文情感特征输入至预先训练好的分类器,得到情感分类结果。本发明减少了对训练数据量的需求并可以从语音中提取包含更多情感信息的特征。
-
公开(公告)号:CN114387366A
公开(公告)日:2022-04-22
申请号:CN202210043174.0
申请日:2022-01-14
Applicant: 湖南大学
Abstract: 本发明公开了一种感知联合空间注意力文本生成图像方法,包括生成初始图像,绘制对象的基本形状和颜色;进行图像细化,生成从空间维度和单词重要性维度细化的新图像特征;细化过程包括通过细粒度单词级文本信息和图像信息融合,并联合空间注意力机制和动态记忆力机制对初始图像消除缺陷并添加细节,增强图像特征区域表征;通过训练目标函数,鼓励生成器生成更真实更符合文本语义的图像。本发明保证了生成器专注于与最相关的单词对应的图像子区域的内容以及位置和形状,同时避免了生成过程中的随机性,减少了最终生成的图像和目标图像之间的差异,本方法能够提高文本生成图像的感知质量和布局,能够高效准确得生成图像。
-
-
-
-
-
-
-
-
-