-
公开(公告)号:CN112951242B
公开(公告)日:2022-10-25
申请号:CN202110140928.X
申请日:2021-02-02
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于孪生神经网络的短语音说话人匹配方法,步骤如下:构造训练样本对;从各样本提取对数梅尔能量谱特征;搭建孪生神经网络,包括依次连接的空洞循环卷积子网络、说话人表征层和Sigmoid输出模块;将从各训练样本对提取的对数梅尔能量谱特征输入空洞循环卷积子网络以得到样本对的两个说话人表征矢量;拼接样本对的两个说话人表征矢量并输入Sigmoid输出模块,训练孪生神经网络;采用经训练的孪生神经网络判断输入的两段短语音是否属于同一个说话人,得到说话人匹配结果。本方法引入空洞循环卷积子网络使孪生神经网络获得更大的感受野,并利用语音样本前后帧之间的说话人信息,获得更好的说话人匹配结果。
-
公开(公告)号:CN113823292A
公开(公告)日:2021-12-21
申请号:CN202110954659.0
申请日:2021-08-19
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于通道注意力深度可分卷积网络的小样本话者辨认方法,步骤如下:从训练语音提取对数梅尔谱特征,训练得到通道注意力深度可分卷积网络;将注册(小样本)语音的对数梅尔谱特征输入已训练网络,得到它们的深度特征,计算所有注册语音的深度特征均值矢量并作为对应话者的中心矢量;将测试语音的对数梅尔谱特征输入已训练网络,得到它们的深度特征,计算测试语音深度特征与注册语音各话者中心矢量之间的距离,距离最小的中心矢量所对应的话者即为测试语音所属话者。本发明方法既减小了网络规模又降低了网络训练难度,有效缓解小样本话者辨认的过拟合问题,获得更满意话者辨认结果。
-
公开(公告)号:CN111129780B
公开(公告)日:2021-11-23
申请号:CN201911384962.0
申请日:2019-12-28
Applicant: 华南理工大学
IPC: H01Q15/00
Abstract: 本发明公开了一种改善玻璃材料在5G毫米波频段斜入射特性的结构.所述结构包括透明材料薄膜层和玻璃层;所述透明材料薄膜层包括第一电路层、透明介质层和第二电路层,第一电路层和第二电路层分别印刷在透明介质层的上表面和下表面,玻璃层位于第二电路层下方。本发明通过在玻璃上粘贴表面带有电路的透明薄膜,可以增强玻璃在5G通讯毫米波通信频段的斜入射透射性能,并且还能阻挡传输频带外的入射电磁波,实现空间滤波功能。本发明有以下几个优点:透光性好,薄膜和电路均做了透明化处理,减少对玻璃透光性能的影响;使用简单,将设计好的薄膜粘贴在玻璃上,操作方便;损耗小,一般使用低损耗的材料制成薄膜,减少在介质中的损耗。
-
公开(公告)号:CN112951242A
公开(公告)日:2021-06-11
申请号:CN202110140928.X
申请日:2021-02-02
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于孪生神经网络的短语音说话人匹配方法,步骤如下:构造训练样本对;从各样本提取对数梅尔能量谱特征;搭建孪生神经网络,包括依次连接的空洞循环卷积子网络、说话人表征层和Sigmoid输出模块;将从各训练样本对提取的对数梅尔能量谱特征输入空洞循环卷积子网络以得到样本对的两个说话人表征矢量;拼接样本对的两个说话人表征矢量并输入Sigmoid输出模块,训练孪生神经网络;采用经训练的孪生神经网络判断输入的两段短语音是否属于同一个说话人,得到说话人匹配结果。本方法引入空洞循环卷积子网络使孪生神经网络获得更大的感受野,并利用语音样本前后帧之间的说话人信息,获得更好的说话人匹配结果。
-
公开(公告)号:CN106209235B
公开(公告)日:2019-01-15
申请号:CN201610698106.2
申请日:2016-08-20
Applicant: 华南理工大学
IPC: H04B10/116 , H04B1/707 , G01S5/16
Abstract: 本发明公开了一种基于CDMA调制的RSS三角定位迭代方法及系统。由于传统的可见光通信定位系统中存在多个定位参考点光源,而不同参考点光源所发出的ID信息在时域与频域上均是重叠的,且会由于多径效应等影响导致码间干扰,进而大大限制了VLC定位系统的精度。为此,本发明提出一种基于CDMA调制的RSS三角定位迭代方法,通过利用扩频码的正交性,可恢复出各LED光源的信息以及对应光信号的衰减,根据ID信息和其衰减大小,利用RSS三角定位迭代方法实现接收三维位置坐标的确定。所提出的定位算法具有良好的定位精度,系统简单且可以实现异步定位,具有广阔的应用前景。
-
公开(公告)号:CN106921459A
公开(公告)日:2017-07-04
申请号:CN201710027183.X
申请日:2017-01-16
Applicant: 华南理工大学
IPC: H04J13/00 , H04B10/556 , H04B10/116 , G01S5/16
CPC classification number: H04J13/0022 , G01S5/16 , H04B10/116 , H04B10/5563
Abstract: 本发明公开了一种基于CDMA调制的室内可见光异步定位方法和系统。定位方法利用CDMA调制技术,通过配备室内空间中LED灯具互不相同的CDMA扩频码,使灯具发出的定位的ID信息实现时域和频域均重叠的信号分离,实现异步通信。根据信号强度衰减的大小确定定位点与各LED灯具的距离,利用三边测量算法即可实现接收机的精准定位。相比传统的可见光室内定位方法,本发明的方法不需要发送设备和接收设备之间高精度的时钟和同步,降低了接收端智能设备的功耗,同时,CDMA技术具有通信质量好、接通率高、发射功率小、抗干扰能力强等诸多优点,这使得室内定位更加简单、可靠和有效。
-
公开(公告)号:CN106151903A
公开(公告)日:2016-11-23
申请号:CN201610698304.9
申请日:2016-08-20
Applicant: 华南理工大学
IPC: F21K9/232 , F21K9/238 , F21V23/00 , H05B33/08 , F21Y115/10
Abstract: 本发明提供一种用于PAM调制的可见光通信LED灯具,主要包括:用于照明的LED灯具主体,用来控制所述LED灯具的LED驱动调制电路以及用于供电的LED驱动电源电路。所述灯具可作为可见光通信发射机,并且应用脉冲振幅调制技术,可解决可见光通信中LED调制带宽窄对可见光通信系统的数据传输速率的限制。采用4*4 LED阵列作为可见光通信的信源,通过控制16盏白光LED芯片的亮灭盏数实现16级的脉冲振幅调制,可在一个时钟周期内传输4位二进制数据。本发明实现了在不增加器件带宽前提下,成倍提高无线通信的质量与数据传输速率。另外,所述灯具的驱动电路与调制电路集成在一起,安装于灯具主体里面,结构简单,而具有广阔的应用前景。
-
公开(公告)号:CN111161744B
公开(公告)日:2023-04-28
申请号:CN201911239006.3
申请日:2019-12-06
Applicant: 华南理工大学
IPC: G10L17/02 , G10L17/18 , G10L17/04 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种同时优化深度表征学习与说话人类别估计的说话人聚类方法,步骤如下:对聚类语音样本进行预处理,提取I‑vector特征,训练卷积自编码网络并提取深度表征特征;根据深度表征特征构造初始类,得到类别数和初始类标签;在卷积自编码网络的编码器输出层增加一个全连接层和一个Softmax层构成联合优化框架,Softmax层用于估计说话人类别;将卷积自编码网络的重构误差与Softmax层的说话人类别估计交叉熵误差之和作为目标函数,迭代更新联合优化框架参数直到满足收敛条件,得到各说话人的语音样本。本发明能同时得到优化的深度表征特征与说话人聚类结果,获得比传统方法更优的说话人聚类效果。
-
公开(公告)号:CN111129780A
公开(公告)日:2020-05-08
申请号:CN201911384962.0
申请日:2019-12-28
Applicant: 华南理工大学
IPC: H01Q15/00
Abstract: 本发明公开了一种改善玻璃材料在5G毫米波频段斜入射特性的结构.所述结构包括透明材料薄膜层和玻璃层;所述透明材料薄膜层包括第一电路层、透明介质层和第二电路层,第一电路层和第二电路层分别印刷在透明介质层的上表面和下表面,玻璃层位于第二电路层下方。本发明通过在玻璃上粘贴表面带有电路的透明薄膜,可以增强玻璃在5G通讯毫米波通信频段的斜入射透射性能,并且还能阻挡传输频带外的入射电磁波,实现空间滤波功能。本发明有以下几个优点:透光性好,薄膜和电路均做了透明化处理,减少对玻璃透光性能的影响;使用简单,将设计好的薄膜粘贴在玻璃上,操作方便;损耗小,一般使用低损耗的材料制成薄膜,减少在介质中的损耗。
-
公开(公告)号:CN106130602B
公开(公告)日:2019-10-18
申请号:CN201610698466.2
申请日:2016-08-20
Applicant: 华南理工大学
IPC: H04B1/707 , H04B10/116 , G01S5/16
Abstract: 本发明公开了一种基于可见光室内定位的CDMA编码方法。本发明在室内可见光定位系统中由于存在多个LED,各LED之间由于会产生码间干扰而严重影响定位的精确度。直接序列码分多址调制通过利用扩频码的正交性,实现在时域和频域均重叠的信号分离,进而实现了码分复用,解决了VLC定位系统中由于存在多个参考点而导致码间干扰的问题。比起传统的可见光通信定位技术不仅大大提高了定位的精度,而且系统简单且不需要同步发射,大大提高了系统的性能。具有广阔的应用前景。
-
-
-
-
-
-
-
-
-