-
公开(公告)号:CN111832570B
公开(公告)日:2024-08-16
申请号:CN202010634052.X
申请日:2020-07-02
Applicant: 北京工业大学
IPC: G06V20/70 , G06V10/26 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0475 , G06N3/0455 , G06N3/084 , G06N3/094
Abstract: 本发明实施例提供一种图像语义分割模型训练方法及系统。该方法包括:获取用于训练分割网络的训练数据;将所述训练数据输入至图像语义分割网络,进行目标域图像语义分割网络的训练;其中所述训练数据是由预先训练好的训练数据合成网络和合成的伪标签所得到。本发明实施例通过采用生成对抗网络合成目标任务上的语义分割标签,采用基于领域自适应机制的训练数据合成网络生成训练数据,采用基于注意力机制的图像分割网络,来优化目标语义区域的分割效果。
-
公开(公告)号:CN113611283B
公开(公告)日:2024-04-05
申请号:CN202110921087.6
申请日:2021-08-11
Applicant: 北京工业大学
IPC: G10L13/02 , G10L13/033 , G10L13/027
Abstract: 本申请实施例公开了一种语音合成方法、装置、电子设备及存储介质。所述方法包括:获取待进行语音合成的目标语音;将所述目标语音输入至语音合成模型中,得到合成语音;所述合成语音的语音属性由所述目标语音的语音属性组成。本申请实施例通过语音合成模型将多个目标语音的语音属性进行自由组合,生成新的语音,可以实现全局多属性可控的语音合成,而且保持全局语音信息一致。
-
公开(公告)号:CN119445642A
公开(公告)日:2025-02-14
申请号:CN202411374955.3
申请日:2024-09-30
Applicant: 北京工业大学
IPC: G06V40/18 , G06V10/26 , G06N3/0464
Abstract: 一种基于拓扑交并约束损失的人眼多类分割方法属于计算机视觉领域,解决不同标签之间的拓扑结构表示。在分割模型的基础上,引入人体眼睛结构的先验知识,以拓扑交并约束损失函数形式来指导多类标签的分割图像。分割模型外部再接入一个最大池化层,在最大池化层中引入拓扑约束,最大池化差异和拓扑区域约束组成拓扑交并约束损失。此损失分为两个模块,模块一是最大池化差异,包括归一化输入和目标张量,以及使用不同的内核和步幅对预测图像和标注图像进行最大池化,计算池化预测与各通道标签的差值。模块二是拓扑区域约束,引入附加拓扑条件保证巩膜包含虹膜,虹膜包含瞳孔,巩膜与瞳孔互斥。将池化差异和拓扑约束组合成最终的拓扑交并约束损失。
-
公开(公告)号:CN113889150A
公开(公告)日:2022-01-04
申请号:CN202111205089.1
申请日:2021-10-15
Applicant: 北京工业大学
Abstract: 本发明提供一种语音情感识别方法及装置,其中方法包括:获取原始语音集,所述原始语音集包括待识别语音和上下文语音;将所述原始语音集输入至语音情感识别模型,获得所述语音情感识别模型输出的所述待识别语音的识别结果;其中,所述语音情感识别模型是基于语音样本以及对应的识别标签进行训练后得到的,用于基于所述上下文语音对所述待识别语音进行语音情感识别;所述识别标签是根据所述语音样本预先确定的,并与所述语音样本一一对应;所述语音样本包括待识别语音样本和上下文语音样本。本发明提供的语音情感识别方法,通过结合上下文语音情感特征和待识别语音的语音情感特征,提高了语音情感识别正确率。
-
公开(公告)号:CN112102239A
公开(公告)日:2020-12-18
申请号:CN202010797841.5
申请日:2020-08-10
Applicant: 北京工业大学
Abstract: 本发明实施例提供一种用于全层脑CT图像的图像处理方法及系统,包括:将目标脑CT图像组输入到训练好的卷积神经网络中进行特征提取处理,得到所述目标脑CT图像组中每一张图像的特征图,并根据所述特征图构建所述目标脑CT图像组对应的特征向量矩阵;所述训练好的卷积神经网络是由标记有脑部CT图像分类标签和扫描干扰标签的样本脑CT图像训练得到的;对所述特征向量矩阵中的特征图进行多特征融合处理,得到所述目标脑CT图像组的图像处理结果。本发明实施例通过对连续的脑CT图像进行特征提取和融合处理,将一组脑CT图像之间的相关性关联起来,得到关联性更强的脑CT图像,并将干扰去除,提供效果更好的脑CT图像。
-
公开(公告)号:CN120067299A
公开(公告)日:2025-05-30
申请号:CN202510212807.X
申请日:2025-02-26
Applicant: 北京工业大学
IPC: G06F16/334 , G06N3/045 , G06F21/62 , G06F40/30 , G06F18/213 , G06F18/25 , G06F16/3329 , G06F16/338 , G06F16/335 , G06F18/22 , G06N5/04 , G06N5/022
Abstract: 本发明提供一种基于大型语言模型的个性化认知路径抽取方法,涉及自然语言处理。所述方法包括以下步骤:首先,对个体陈述文本进行预处理和编码;然后,通过计算相似度,从认知路径数据库中检索出相似的认知路径抽取示例,为少样本提示构建提供参考;接着,设计了一种综合提示策略,结合基础提示、少样本提示以及思维链提示,引导大型语言模型逐步精准地抽取个体的认知路径;此外,引入自动化检查与大型语言模型自评反馈的方式,对生成的认知路径进行一致性校验与优化,以确保抽取结果的准确性和可靠性。本发明通过结合示例检索与提示工程,特别是引入思维链提示策略,强化了模型推理过程的可解释性,提高个性化认知路径抽取的效率与准确性。
-
公开(公告)号:CN112052869B
公开(公告)日:2024-07-09
申请号:CN202010675638.0
申请日:2020-07-14
Applicant: 北京工业大学
IPC: G06F18/24 , G06F18/25 , G06N3/0464 , G06N3/045 , G06N3/09 , G06Q50/00 , G06F16/906 , G06F16/951 , G06F40/284
Abstract: 本发明实施例提供一种用户心理状态识别方法及系统,包括:对待分析目标用户的微博数据进行多模态数据特征融合处理,得到待分析目标用户的用户个人微博情感特征;对待分析目标用户的社交信息进行筛选,得到待分析目标用户的粉丝信息和关注者信息,并获取粉丝情感特征和关注者情感特征;将用户个人微博情感特征、粉丝情感特征和关注者情感特征进行社交关系特征融合,得到用户综合心理特征,并通过神经网络模型对用户综合心理特征进行分类,得到待分析目标用户的心理状态。本发明实施例通过将用户个人微博情感特征与用户社交关系特征进行社交关系特征融合处理,更全面地分析用户心理状态,从而提高情感分类的识别准确率。
-
公开(公告)号:CN113889149B
公开(公告)日:2023-08-29
申请号:CN202111205078.3
申请日:2021-10-15
Applicant: 北京工业大学
Abstract: 本发明提供一种语音情感识别方法及装置,其中方法包括:获取原始语音集,原始语音集包括对话者语音和说话者语音;将原始语音集输入至语音情感识别模型,获得语音情感识别模型输出的说话者语音的识别结果;其中,语音情感识别模型是基于语音样本以及对应的识别标签进行训练后得到的,用于基于对话者语音对说话者语音的影响对说话者语音进行语音情感识别;识别标签是根据语音样本预先确定的,并与语音样本一一对应;语音样本包括对话者语音样本和说话者语音样本。本发明提供的语音情感识别方法,将对话者对说话者的情感影响和说话者自身情绪结合,对说话者语音的情感进行识别,提高了语音情感识别正确率。
-
公开(公告)号:CN113327221A
公开(公告)日:2021-08-31
申请号:CN202110735504.8
申请日:2021-06-30
Applicant: 北京工业大学
Abstract: 本发明涉及一种融合ROI区域的图像合成方法、装置、电子设备及介质,该方法包括获取具有对应类别信息的有病和无病原始图像;使用弱监督定位网络获取有病原始图像的感兴趣区域,得到有病掩膜图像;通过相似度计算获取与无病原始图像对应的相似有病图像,得到无病掩膜图像;分别使用有病和无病掩膜图像对有病和无病原始图像进行遮挡,得到被掩膜遮挡的图像;设计基于条件生成对抗性网络模型,并使用有病和无病掩膜图像、被掩膜遮挡的图像以及对应类别信息对该网络模型进行训练,从而得到合成医疗图像。本发明通过获取医疗图像中的感兴趣区域以及使用基于条件生成对抗性网络模型,能够高效合成指定种类的医疗图像,提高图像质量。
-
公开(公告)号:CN111832644A
公开(公告)日:2020-10-27
申请号:CN202010651959.7
申请日:2020-07-08
Applicant: 北京工业大学
Abstract: 本发明实施例提供一种基于序列级别的脑部医疗影像报告生成方法及系统。该方法包括:获取具有预设标准的待判断脑部医疗图像;将所述序列级别待判断脑部医疗图像输入至预先训练好的脑部医疗影像判别模型,得到所述脑部医疗影像判别模型输出的脑部医疗影像报告结果;其中,所述脑部医疗影像判别模型是基于脑部医疗影像的样本集数据,以及按照脑部医疗疾病标准等级进行分类所得的序列级别分类标签进行训练得到的。本发明实施例通过对符合DICOM标准的脑部医疗影像进行模型训练,训练好的模型可以生成辅助医生进行脑部疾病诊断的报告,节约医生诊断的时间和减小工作量,同时减少漏诊、误诊的发生概率。
-
-
-
-
-
-
-
-
-