-
公开(公告)号:CN118297166A
公开(公告)日:2024-07-05
申请号:CN202410729045.6
申请日:2024-06-06
Applicant: 南京邮电大学
IPC: G06N5/04 , G06N5/045 , G06N3/042 , G06N3/0455 , G06N3/096 , G06F16/532 , G06F16/583 , G06F16/332 , G06F18/25
Abstract: 本发明公开基于先计划再求解思维链的科学问答任务解决方法;属于计算机视觉和自然语言处理领域;科学问答任务解决方法包括:设计语义适配器与视觉编码器和语言模型连接,得到多模态网络模型,并使用科学问答数据集中的训练集数据对多模态模型进行语义适配器预训练;使用预训练后的多模态网络模型对次优的原理解释进行筛选,并使用先计划再求解思维链为次优的原理解释生成按计划的原理解释,并用按计划的原理解释优化原有的次优原理解释;使用集成了按计划的原理解释的训练数据,微调预训练过的多模态网络模型并进行测试,输出答案。
-
公开(公告)号:CN118411572B
公开(公告)日:2024-09-10
申请号:CN202410868719.0
申请日:2024-07-01
Applicant: 南京邮电大学
IPC: G06V10/764 , G06V10/82 , G06V10/44 , G06V10/80 , G06V40/10 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了基于多模态多层次特征聚合的小样本图像分类方法及系统,涉及深度学习、计算机视觉技术领域,包括:根据支持集数据的类别标签获取语义信息,将语义信息输入至文本编码器中,得到文本特征,将支持集和查询集的数据输入至预先建立的卷积神经网络模型内,得到图像特征;将文本特征与支持集图像特征进行融合,得到多模态特征,多模态特征的支持集数据和图像特征的查询集数据输入至预先建立的卷积神经网络模型内,得到分类预测结果,利用分类预测结果,采用交叉熵损失函数对模型进行迭代训练,得到训练后的小样本图像分类网络模型;将小样本图像数据集内的测试集数据输入至训练后的小样本图像分类网络模型内,得到小样本图像的分类结果。
-
公开(公告)号:CN118411572A
公开(公告)日:2024-07-30
申请号:CN202410868719.0
申请日:2024-07-01
Applicant: 南京邮电大学
IPC: G06V10/764 , G06V10/82 , G06V10/44 , G06V10/80 , G06V40/10 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了基于多模态多层次特征聚合的小样本图像分类方法及系统,涉及深度学习、计算机视觉技术领域,包括:根据支持集数据的类别标签获取语义信息,将语义信息输入至文本编码器中,得到文本特征,将支持集和查询集的数据输入至预先建立的卷积神经网络模型内,得到图像特征;将文本特征与支持集图像特征进行融合,得到多模态特征,多模态特征的支持集数据和图像特征的查询集数据输入至预先建立的卷积神经网络模型内,得到分类预测结果,利用分类预测结果,采用交叉熵损失函数对模型进行迭代训练,得到训练后的小样本图像分类网络模型;将小样本图像数据集内的测试集数据输入至训练后的小样本图像分类网络模型内,得到小样本图像的分类结果。
-
公开(公告)号:CN116340849A
公开(公告)日:2023-06-27
申请号:CN202310556403.3
申请日:2023-05-17
Applicant: 南京邮电大学
IPC: G06F18/241 , G06F18/10 , G06F18/214 , G06F18/22 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/08 , H04B17/391
Abstract: 一种基于度量学习的非接触式跨域人体活动识别方法,通过对已采集到的活动数据采用自编码器进行数据增强,然后通过采用度量学习完成未出现在训练集中的新活动类别的识别。具体步骤如下:在室内环境中采集人员活动时对应的无线信号数据,从中提取CSI原始数据;对原始CSI数据进行数据预处理,数据插值,统一数据长度,数据去噪;对已知活动类型的数据使用自编码器进行数据增强,扩充数据集;使用扩充后的数据集训练特征提取网络,将待识别活动数据和支持集输入特征提取网络得到相应特征,使用度量学习的方法将待识别数据特征与支持集数据特征一一对比,从而判断活动类型。本方法对于未训练的活动类型能实现较高识别精度,增强泛化性和鲁棒性。
-
公开(公告)号:CN118297166B
公开(公告)日:2024-08-06
申请号:CN202410729045.6
申请日:2024-06-06
Applicant: 南京邮电大学
IPC: G06N5/04 , G06N5/045 , G06N3/042 , G06N3/0455 , G06N3/096 , G06F16/532 , G06F16/583 , G06F16/332 , G06F18/25
Abstract: 本发明公开基于先计划再求解思维链的科学问答任务解决方法;属于计算机视觉和自然语言处理领域;科学问答任务解决方法包括:设计语义适配器与视觉编码器和语言模型连接,得到多模态网络模型,并使用科学问答数据集中的训练集数据对多模态模型进行语义适配器预训练;使用预训练后的多模态网络模型对次优的原理解释进行筛选,并使用先计划再求解思维链为次优的原理解释生成按计划的原理解释,并用按计划的原理解释优化原有的次优原理解释;使用集成了按计划的原理解释的训练数据,微调预训练过的多模态网络模型并进行测试,输出答案。
-
公开(公告)号:CN116340849B
公开(公告)日:2023-08-15
申请号:CN202310556403.3
申请日:2023-05-17
Applicant: 南京邮电大学
IPC: G06F18/241 , G06F18/10 , G06F18/214 , G06F18/22 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/08 , H04B17/391
Abstract: 一种基于度量学习的非接触式跨域人体活动识别方法,通过对已采集到的活动数据采用自编码器进行数据增强,然后通过采用度量学习完成未出现在训练集中的新活动类别的识别。具体步骤如下:在室内环境中采集人员活动时对应的无线信号数据,从中提取CSI原始数据;对原始CSI数据进行数据预处理,数据插值,统一数据长度,数据去噪;对已知活动类型的数据使用自编码器进行数据增强,扩充数据集;使用扩充后的数据集训练特征提取网络,将待识别活动数据和支持集输入特征提取网络得到相应特征,使用度量学习的方法将待识别数据特征与支持集数据特征一一对比,从而判断活动类型。本方法对于未训练的活动类型能实现较高识别精度,增强泛化性和鲁棒性。
-
-
-
-
-