-
公开(公告)号:CN119785762A
公开(公告)日:2025-04-08
申请号:CN202510003560.0
申请日:2025-01-02
Applicant: 东南大学
IPC: G10L13/027 , G10L13/08 , G10L21/0208 , G10L25/30
Abstract: 本发明涉及一种提升合成音频自然度以及降噪的方法,包括以下步骤:步骤1,构建音素编码器,步骤2,构建方差适配器,步骤3,构建频谱降噪器,实现提升合成音频自然度以及降噪;该方案提出在音素编码器阶段,加入基于Transformer的双向编码器,能够利用较少的训练资源,完成语音合成模型的训练;本发明首次将具有选择性状态空间的线性时间序列建模用于语音合成任务,借助于小波分解在图像去噪领域的应用,将其引入语音合成网络,成功地减少了生成音频的噪声。
-
公开(公告)号:CN119513566A
公开(公告)日:2025-02-25
申请号:CN202411491454.3
申请日:2024-10-24
Applicant: 东南大学
IPC: G06F18/213 , G06F18/2431 , G06F17/16 , G06N3/0442 , G06N3/049 , A61B5/00
Abstract: 本发明公开了一种基于时空注意力的脑认知状态分层识别方法,引入大脑认知域识别模块和大脑细粒度状态识别模块两层先后应用,针对功能性磁共振成像(fMRI)对大脑细粒度认知状态进行精确识别,其中能结合动态和静态、时间和空间特征,创新性地解决大脑细粒度认知状态识别低准确度问题,因此将设计方案应用到大脑认知状态的识别中,对于难以识别的大脑细粒度认知状态,能够得到更精确的识别结果。
-
公开(公告)号:CN119446431A
公开(公告)日:2025-02-14
申请号:CN202411428461.9
申请日:2024-10-14
Applicant: 东南大学
IPC: G16H30/00 , G06T7/00 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种全自动分析胸部CT身体组织成分系统,涉及医疗诊断设备技术领域,能够自动挑选符合要求的L1切片,并对目标层面的肌肉、脂肪面积和密度进行定量分析,具体包括三个模块:定位模块,用于对胸部CT图像上目标L1切片进行定位;分割模块,用于对胸部CT图像上L1对应轴向切片的骨骼肌及脂肪组织进行分割;自动测量模块,用于对临床胸部CT图像的身体成分的自动测量。总而言之,本发明不仅提高了对胸部CT上人体成分测量的效率和精度,还填补了以往机器自动筛选L1单一切片技术的空白。
-
公开(公告)号:CN118781336A
公开(公告)日:2024-10-15
申请号:CN202410821546.7
申请日:2024-06-24
Applicant: 东南大学
IPC: G06V10/26 , G06V10/25 , G06V10/44 , G06V10/42 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06V10/764 , G06V10/766 , G06N3/048
Abstract: 本发明公开了一种基于多通道注意力的腰椎CT图像分割与识别方法,包括以下三个阶段:在第一阶段提出了基于目标检测和高斯模糊的腰椎定位方法,通过目标检测在垂直轴上定位腰椎位置,并利用高斯模糊和定位网络进一步定位待分割的感兴趣区域;在第二阶段提出了基于多尺度Unet的腰椎二值分割网络,采用Inception块在学习不同尺度上特征的同时减少了模型参数,并提出跃层连接进一步增加多尺度信息;在第三阶段提出了基于多通道注意力的腰椎分割与识别网络,为了充分利用脊柱本身的特征信息,在跃层连接的基础上采用Transformer块捕获长距离依赖信息,对腰椎进行了局部和全局特征提取,能够有效提升腰椎CT图像分割与识别的准确性和鲁棒性,具有广泛的应用前景。
-
公开(公告)号:CN118447922A
公开(公告)日:2024-08-06
申请号:CN202410614412.8
申请日:2024-05-17
Applicant: 东南大学
Abstract: 本发明公开了一种基于视觉语言模型的EGFR基因突变少样本检测方法,首先,向预训练的视觉语言模型输入少量PET‑CT图像与疾病描述,通过这些少量样本筛选出有效的疾病描述并计算出超参数;然后,输入剩余PET‑CT图像与筛选出的疾病描述,利用已获得的超参数,对剩余样本进行预测分类;最后,统计分类结果,计算识别率与其他指标。本发明构造的基于视觉语言模型的EGFR基因突变少样本检测方法,摒弃了传统的训练神经网络的方法,应用视觉与语言两个模态,构造PET、CT双通道,引入疾病描述的筛选机制,在不训练模型的基础上,发掘了预训练模型的潜能,在非小细胞肺癌EGFR基因突变的检测任务上获得了优秀的结果。
-
公开(公告)号:CN113539232B
公开(公告)日:2024-05-14
申请号:CN202110781210.9
申请日:2021-07-10
Applicant: 东南大学
IPC: G10L13/047 , G10L13/033 , G10L13/08 , G10L25/24 , G10L25/30 , G10L19/16 , G06N3/0464 , G06N3/0442 , G06N3/047 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于慕课语音数据集的语音合成方法,该方法的主要特征在于通过真实场景下的语音构建的数据集进行语音合成,并进行说话人转换和多语种语音合成;该方法运用端到端的语音合成模型生成梅尔频谱,并用基于生成对抗网络的声码器将梅尔频谱转换成最终音频。本发明在真实场景下的语音数据集上有良好的效果,降低了语音合成所需数据的要求,提高了合成音频的质量,使合成音频更贴近真实说话场景。
-
公开(公告)号:CN117592602A
公开(公告)日:2024-02-23
申请号:CN202311557188.5
申请日:2023-11-21
Applicant: 东南大学
IPC: G06Q10/04 , G06Q50/40 , G06F18/20 , G06F18/27 , G06N3/049 , G06N3/0464 , G06N3/082 , G06N3/0985 , G06N3/084 , G06F17/13
Abstract: 本发明公开了一种基于时空图常微分方程的地铁客流量预测方法及系统,所述方法包括下述步骤:采集并处理原始地铁AFC历史数据,利用地理拓扑信息和原始历史客流量数据构建一组地铁网络时空关系图;将处理后得到的历史客流量和图组作为模型输入;建立一种新的地铁客流量预测网络,在每个时空层中,利用两个时序自注意力模块和时序卷积模块来获取节点之间的动态多尺度的时间依赖性,利用基于张量的常微分方程来捕获空间依赖性,并通过跳跃连接将每个时空层得到的隐藏状态馈送到输出层,对未来时刻地铁客流量进行预测。本发明能够有效结合时空特征,有效减轻图神经网络中常见的过平滑问题,在地铁客流量数据集中实现较好预测性能。
-
公开(公告)号:CN116385951A
公开(公告)日:2023-07-04
申请号:CN202310366961.3
申请日:2023-04-07
Applicant: 东南大学
Abstract: 本发明公开了一种基于计算机视觉的桌面应用信息提取与组织方法,首先获取目标桌面的应用图像,所述图像为桌面应用软件使用过程中的一系列图像帧;再通过图像处理技术分析应用软件的版面布局信息,所述图像处理技术至少包括灰度处理、边缘检测、长直线检测和连通域分析;通过基于深度学习的文本检测网络和文本识别网络对应用图像进行文本块检测及识别文本内容;所述文本检测网络采用可微分二值化网络DBNet,文本识别网络采用端到端网络CRNN;最后将版面布局信息与文本识别结果进行信息融合,采用JSON格式输出图像的描述文档,完成桌面应用信息的提取和组织。
-
公开(公告)号:CN113592836B
公开(公告)日:2022-11-18
申请号:CN202110898144.3
申请日:2021-08-05
Applicant: 东南大学
IPC: G06T7/00 , G06V10/74 , G06V10/764 , G06V10/80
Abstract: 本发明提供了一种深度多模态图卷积的脑图分类方法,通过将不同模态间脑图进行融合达到脑图的分类目的。首先进行多模态脑拓扑图构建,利用静息态功能磁共振数据与弥散张量磁共振数据依据其生物学意义构建脑拓扑图;然后,进行多模态融合,包含功能‑结构融合和动态‑静态融合两个部分。本发明不仅使用了多种模态特征,并对其进行了融合,能够充分利用特征间的相似性和互补性,这使得进行脑图分类的结果更加准确。
-
公开(公告)号:CN110751664B
公开(公告)日:2022-11-18
申请号:CN201910931927.X
申请日:2019-09-29
Applicant: 东南大学
IPC: G06T7/13 , G06T7/11 , G06V10/74 , G06V10/762
Abstract: 本发明公开了一种基于超体素匹配的脑组织分割方法,步骤如下:S1:所有的磁共振图像通过SLIC算法均生成超体素数据;S2:预处理所有的磁共振图像;S3:获取得到每个磁共振图像的超体素特征;S4:计算每个超体素和相邻超体素之间的特征梯度,并获取特征梯度之和;S5:确定模板图像中每个超体素对应的标签;S6:将每个磁共振图像的超体素特征、特征梯度之和串联为一个向量,根据向量计算待匹配磁共振图像和模板图像中每个超体素的相似度;S7:将待匹配磁共振图像和模板图像进行匹配,确定出每个待匹配磁共振图像的分割结果。本发明在匹配的过程中考虑超体素自身特征的同时,也能够考虑相邻超体素之间的关系,进而能够得到有效的匹配结果。
-
-
-
-
-
-
-
-
-