-
公开(公告)号:CN113129920B
公开(公告)日:2021-08-17
申请号:CN202110403350.2
申请日:2021-04-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G10L21/0272 , G10L21/028 , G10L21/0308
Abstract: 本发明涉及一种基于U型网络和音频指纹的音乐与人声分离方法:当输入混合音频时,首先经过已经训练好的音乐分离模型,得到分离的伴奏音频;然后采用指纹提取算法,提取出伴奏音频中的指纹;随后将这些指纹送入到音频指纹数据库中,检索出对应匹配的歌曲以及时间点offset;随后将检索出的歌曲进行音量的调整;在匹配歌曲时间点offset前后一段时间内的采样点进行匹配,得到得到一段音频波形;再将分离音频与这段波形的音量进行精确匹配;最后混合音频减去这段波形最后得到较为纯净的音频。该方法设计一种基于U型网络架构的音乐分离模型,以及在该模型后加入音频指纹检索进行再分离,使分离效果差距明显缩小,得到纯净人声。
-
公开(公告)号:CN113129920A
公开(公告)日:2021-07-16
申请号:CN202110403350.2
申请日:2021-04-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G10L21/0272 , G10L21/028 , G10L21/0308
Abstract: 本发明涉及一种基于U型网络和音频指纹的音乐与人声分离方法:当输入混合音频时,首先经过已经训练好的音乐分离模型,得到分离的伴奏音频;然后采用指纹提取算法,提取出伴奏音频中的指纹;随后将这些指纹送入到音频指纹数据库中,检索出对应匹配的歌曲以及时间点offset;随后将检索出的歌曲进行音量的调整;在匹配歌曲时间点offset前后一段时间内的采样点进行匹配,得到得到一段音频波形;再将分离音频与这段波形的音量进行精确匹配;最后混合音频减去这段波形最后得到较为纯净的音频。该方法设计一种基于U型网络架构的音乐分离模型,以及在该模型后加入音频指纹检索进行再分离,使分离效果差距明显缩小,得到纯净人声。
-
公开(公告)号:CN113393829B
公开(公告)日:2023-08-29
申请号:CN202110667531.6
申请日:2021-06-16
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明提供了一种融合韵律和个人信息的中文语音合成方法,中文语音合成方法包括如下步骤:步骤1:将输入文本、输入文本对应的拼音和输入文本的词法句法特征输入层次化韵律预测模型,得到输入文本的多层韵律信息;步骤2:将输入文本对应的拼音、声调等输入到声学模型,得到输入文本对应的语音特征谱图;步骤3:将多层韵律信息引入声学模型,将层次化韵律预测模型和声学模型进行联合,形成新的声学模型;步骤4:在新的声学模型中引入说话人信息,形成个性化语音合成模型,支持多人个性化语音合成。本发明有益效果:本发明在目前端到端合成模型的基础上,提高音频质量、速度;单人和多人的应用场景下,探索一种联合韵律预测任务和梅尔谱图生成任务的多任务学习方法,使得合成音频的停顿节奏感更自然,更贴近原始音频。
-
公开(公告)号:CN115512874A
公开(公告)日:2022-12-23
申请号:CN202211150489.1
申请日:2022-09-21
Applicant: 哈尔滨工业大学(深圳)
IPC: H01B1/22 , H01B13/00 , H01L31/0224
Abstract: 本申请涉及电子浆料技术领域,并提供了一种光伏电池正面银浆及其制备方法、电极及光伏电池,正面银浆按重量份数计算包括:环氧树脂3‑8份、助剂2‑7份和球状银包铜粉85‑95份,制备方法包括:将环氧树脂、助剂和球状银包铜粉混合均匀,得到正面银浆,在混合过程中同步进行超声波处理,所述电极由光伏电池正面银浆在光伏电池正面烧结得到。本发明的银浆粘度低,可以应用于高精度丝网印刷中,采用该银浆在光伏电池正面印刷后得到涂层与基材之间具有良好的附着效果和接触效果,能够有效降低电阻。
-
公开(公告)号:CN114664282A
公开(公告)日:2022-06-24
申请号:CN202210152018.8
申请日:2022-02-18
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种中英文跨语言语音合成方法、装置、电子设备及存储介质,该方法包括利用深度学习中序列到序列任务构建第一跨语言声学模型;将文本数据集处理成包括音素序列、声调序列和语言序列的基础语句;利用模型编码器将基础语句编码成高级上下文语义表示,同时在模型编码器的多个位置引入语言嵌入和说话人嵌入;利用注意力机制学习高级上下文语义表示和声学特征梅尔谱图的映射关系,得到线性加权后的高级上下文语义表示;利用模型解码器将线性加权后的高级上下文语义表示生成原始谱图。本发明方法基于多种策略融合,构建了两种跨语言声学模型,使本发明的中英文跨语言语音合成方法解决了现有的语音合成方法的不足。
-
公开(公告)号:CN113447551A
公开(公告)日:2021-09-28
申请号:CN202110697176.7
申请日:2021-06-23
Applicant: 哈尔滨工业大学(深圳)
IPC: G01N27/327 , G01N27/26 , H01B1/22
Abstract: 本申请属于检测技术领域,尤其涉及一种生物分子检测芯片及其制备方法,以及一种生物分子的检测方法。其中,生物分子检测芯片的制备方法,包括以下步骤:获取纸基柔性基底,在所述纸基柔性基底的一表面设计参比电极图案、工作电极图案和对电极图案;在所述参比电极图案、所述对电极图案和所述工作电极图案的表面沉积导电油墨,干燥得到参比电极、对电极和工作电极;在所述工作电极的表面制备碳层,得到碳工作电极;在所述碳工作电极表面固定生物酶,得到生物分子检测芯片。本申请生物分子检测芯片的制备方法,工艺简单,成本低,原料安全无毒副作用,且检测灵活高效,适用范围广。
-
公开(公告)号:CN103368655A
公开(公告)日:2013-10-23
申请号:CN201310248867.4
申请日:2013-06-21
Applicant: 哈尔滨工业大学深圳研究生院
IPC: H04B10/60
Abstract: 本发明提供了一种基于振幅和相位自适应控制的望远镜阵列光信号接收方法,包括以下步骤:A、光学信号通过望远镜阵列实现多元阵列接收;B、由每个望远镜通道出来的光学信号先后进行放大和滤波;C、通过叠加输出单元输出端的反馈来控制移相器实现对相位的自适应控制,通过放大器输出端的反馈来控制放大器的放大倍率实现对振幅的自适应控制;D、各个通道的光学信号经过振幅的自适应控制和相位的自适应控制后进入叠加输出单元进行相干叠加,然后得到高灵敏度的输出信号。本发明还提供了一种基于振幅和相位自适应控制的望远镜阵列光信号接收装置。本发明的有益效果是:实现了无线光信号在强背景干扰和弱光学信号情况下的高灵敏度和高信噪比的接收。
-
公开(公告)号:CN115512874B
公开(公告)日:2024-12-03
申请号:CN202211150489.1
申请日:2022-09-21
Applicant: 哈尔滨工业大学(深圳)
IPC: H01B1/22 , H01B13/00 , H01L31/0224
Abstract: 本申请涉及电子浆料技术领域,并提供了一种光伏电池正面银浆及其制备方法、电极及光伏电池,正面银浆按重量份数计算包括:环氧树脂3‑8份、助剂2‑7份和球状银包铜粉85‑95份,制备方法包括:将环氧树脂、助剂和球状银包铜粉混合均匀,得到正面银浆,在混合过程中同步进行超声波处理,所述电极由光伏电池正面银浆在光伏电池正面烧结得到。本发明的银浆粘度低,可以应用于高精度丝网印刷中,采用该银浆在光伏电池正面印刷后得到涂层与基材之间具有良好的附着效果和接触效果,能够有效降低电阻。
-
公开(公告)号:CN103532623A
公开(公告)日:2014-01-22
申请号:CN201310531217.0
申请日:2013-11-01
Applicant: 哈尔滨工业大学深圳研究生院
IPC: H04B10/11 , H04B10/291
Abstract: 本发明提供一种基于偏振位移键控调制的光通信中继传输系统,包括至少一个中继传输节点,所述中继传输节点包括信号接收处理组件、中继处理组件、信号调制发送组件;本发明还公开一种基于偏振位移键控调制的光通信中继传输方法,本发明综合了自由空间光通信、偏振位移键控调制、光信号的接收和处理的技术,通过利用受到大气信道影响较小的偏振调制方法将信号加载到光载波上,减少光信号在大气信道中受到的干扰;通过利用中继传输方法补偿光信号在传输过程中的损耗和衰减。
-
公开(公告)号:CN113393829A
公开(公告)日:2021-09-14
申请号:CN202110667531.6
申请日:2021-06-16
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明提供了一种融合韵律和个人信息的中文语音合成方法,中文语音合成方法包括如下步骤:步骤1:将输入文本、输入文本对应的拼音和输入文本的词法句法特征输入层次化韵律预测模型,得到输入文本的多层韵律信息;步骤2:将输入文本对应的拼音、声调等输入到声学模型,得到输入文本对应的语音特征谱图;步骤3:将多层韵律信息引入声学模型,将层次化韵律预测模型和声学模型进行联合,形成新的声学模型;步骤4:在新的声学模型中引入说话人信息,形成个性化语音合成模型,支持多人个性化语音合成。本发明有益效果:本发明在目前端到端合成模型的基础上,提高音频质量、速度;单人和多人的应用场景下,探索一种联合韵律预测任务和梅尔谱图生成任务的多任务学习方法,使得合成音频的停顿节奏感更自然,更贴近原始音频。
-
-
-
-
-
-
-
-
-